数据仓库与数据挖掘上机实验报告.doc
文本预览下载声明
数据仓库与数据挖掘上机实验报告
实验目的:学习Analysis Services的操作和基本的数据清洗
实验内容:
浏览SQL Server 2000 Analysis Services?随机教程;规划需求分析;仓库设计;数据清洗转换;建立数据源建立建立Products,Categories,Employees,Orders,Order Details转换到新数据库,为数据仓库提供需要的数据
目的:为数据仓库事实表和各维表建立基本数据
步骤:
新建一个数据库myNorthwind,并准备从Northwind导入数据。
建立Products和Categories两个维度表,将维度表需要的列从Northwind数据库复制到myNorthwind。
建立Employees维度表,将源表的列内容复制过来,并将源表中first name和lastname合成一个fullname列,在DTS导入/导出向导中使用SQL语句合成新的列fullname。
建立Dates维度表,由源表Orders表中OrderDate一列产生出年、月、日、周、季等列,同时保留OrderDate一列。在处理数据时使用了VBScript中的DatePart函数。
建立Facts表,(事实表)该表的数据来自Order Details表,首先用Select语句将产品类别编号和员工编号等从各自表中取出;其次计算合计列值,计算方法为单价*(1-折扣)*数量;然后将Order Details表的内容复制到Facts表各列即可;再建立主、外键关系。
最后的新数据库内容为:
下面是需要用到的数据转换SQL语句:
源表中姓名有first name和lastname两列,将它们合成一个fullname列
select [Employees].[EmployeeID],
[Employees].[FirstName]+ +[Employees].[LastName] FullName,
[Employees].[Title], [Employees].[TitleOfCourtesy],
[Employees].[BirthDate], [Employees].[HireDate], [Employees].[Address],
[Employees].[City], [Employees].[Region], [Employees].[PostalCode], [Employees].[Country], [Employees].[HomePhone], [Employees].[Extension], [Employees].[Photo], [Employees].[Notes], [Employees].[ReportsTo], [Employees].[PhotoPath]
from [Employees]
由源表Orders表中OrderDate一列产生出年、月、日、周、季等列
select [Orders].[OrderID], [Orders].[CustomerID], [Orders].[EmployeeID], [Orders].[OrderDate],
DatePart(yyyy,[Orders].[OrderDate]) OrderYear,
DatePart(mm,[Orders].[OrderDate]) OrderMonth,
DatePart(dd,[Orders].[OrderDate]) OrderDay,
DatePart(ww,[Orders].[OrderDate]) OrderWeek,
DatePart(qq,[Orders].[OrderDate]) OrderQuarter,
[Orders].[RequiredDate], [Orders].[ShippedDate],
[Orders].[ShipVia], [Orders].[Freight],
[Orders].[ShipName], [Orders].[ShipAddress],
[Orders].[ShipCity], [Orders].[ShipRegion], [Orders].[ShipPostalCode], [Orders].[ShipCountry]
from [Orders]
Facts表的建立
select [Order Details].[OrderID], [Order Details].[ProductID], [Order Details].[UnitPrice], [Order Details].[Quantity], [Order Details].[Discount],
[Order Details].[UnitPrice]
显示全部