收藏 分享(赏)

数据仓库历史与现在发展状况.docx

上传人:Wallisgabriel 文档编号:21759586 上传时间:2024-04-22 格式:DOCX 页数:15 大小:31.22KB
下载 相关 举报
数据仓库历史与现在发展状况.docx_第1页
第1页 / 共15页
数据仓库历史与现在发展状况.docx_第2页
第2页 / 共15页
数据仓库历史与现在发展状况.docx_第3页
第3页 / 共15页
数据仓库历史与现在发展状况.docx_第4页
第4页 / 共15页
数据仓库历史与现在发展状况.docx_第5页
第5页 / 共15页
亲,该文档总共15页,到这儿已超出免费预览范围,如果喜欢就下载吧!
资源描述

1、数据仓库一数据仓库简介随着处理信息量的不断加大, 企业需要多角度处理海量信息并从中获取支持决策的信息,面向事务处理的操作型数据库就显得力不从心,面向主题集成大量数据的数据仓库技术产生。数据仓库因其面向主题性,集成性,稳定性和时变性,不仅在数据的集成,存储上效果好, 在从操作系统提取信息和支持系统造作者的前端工具上更是充分利用了数学严谨的逻辑思维和统计学知识, 以及先进的信息技术, 使企业的信息利用更有价值。 数据仓路按照特定的方法( ETL )从数据源中提取数据,以特定主题作维度利用特定的算法集成数据,给数据用户提供实时查询,最终集成有效信息供决策者使用。数据仓库是个过程而不是一个项目,是一个

2、解决方案而不是一个产品。 一个解决方案而7、是一一个产品。数据仓库之父比尔恩门(Bi川nmon )在1991 年出版的 BuildingtheDataWarehouse(建 立数据仓库)一书中所 提出的定 义被广泛接受, 数 据 仓 库是一个面向主题 的( SubjectOriented ) 、集成的( Integrate ) 、相对稳定的( Non-Volatile ) 、反映历史变化( TimeVariant )的数据集合,用于支持管理决策。二数据仓库历史1.1981 年 NCR 公司 ( nationalcashregistercorporation ) 为 Walmart 建立了第一个

3、数据仓库,总容量超过101TB( 十年的会计文档还不足 1TB)2. 商务智能的瓶颈是从数据到知识的转换。 1979 年,一家以决策支持系统为已任、致力于构建单独的数据存储结构的公司 Teradata 诞生了。 Tera ,是万亿的意思, Teradata 的命名表明了公司处理海量运营数据的决心。 1983 年,该公司利用并行处理技术为美国富国银行( WellsFargoBank)建立了第一个决策支持系统。这种先发优势令Teradata 至今一直雄居数据行业的龙头榜首。3.1988 年, 为解决企业集成问题, IBM 公司的研究员 BarryDevlin 和 PaulMurphy 创造性的提出

4、了一个新的术语:数据仓库( DataWarehouse )4.1992 年,比尔恩门(BillInmon )出版了如何构建数据仓库一书,第一次给出了数 据仓库的清晰定义和操作性极强的指导意见,真正拉开了数据仓库得以大规模应用的序幕。5.1993年,毕业于斯坦福计算机系的博士拉尔夫金博尔,也出版了一本书:数据仓库的工具(TheDataWarehouseToolkit ),他在书里认同了比尔恩门对于数据仓库的定义,但却在具体的构建方法上和他分庭抗礼。 最终拉尔夫金博尔尔由下而上, 从部门到企业的数据仓库建立方式迎合人们从易到难的心理,得到了长足的发展。6.1996 年, 加拿大的 IDC (int

5、ernationaldatecorporation ) 公司调查了 62 家实现数据仓库的欧美企业, 结果表明: 数据仓库为企业提供了巨大的收益、 进行数据仓库项目开发的公司在平均 2.72 年内的投资回报率为 321% 。7 到如今, 数据仓库已成为商务智能由数据到知识, 由知识转化为利润的基础和核心技术。8 . 在国内,因数据仓库的实施需要较多的投入,再加之需要足够的数据积累才能看到结果,不能很好的被企业普遍接受。 对数据仓库的发展产生了一些负面影响。 但实时的, 多维的处理海量数据已成为信息时代企业发展所必须的工作。三主流数据仓库产品IBM 、 Oracle 、 Sybase 、 CA

6、、 NCR 、 Informix 、 Microsoft 和 SAS 等有实力的公司相继通过收购或研发的途径推出了自己的数据仓库解决方案。 BO 和 Brio 等专业软件公司也前端在线分析处理工具市场上占有一席之地。 根据各个公司提供的数据仓库工具的功能, 可以将其分为 3 大类:解决特定功能的产品(主要包括BO 的数据仓库解决方案) 、提供部分解决方案的产品(主要包括Oracle 、 IBM 、 Sybase 、 Informix 、 NCR 、 Microsoft 及 SAS 等公司的数据仓库解决方案)和提供全面解决方案的产品( CA 是目前的主要厂商) 。1 、 BusinessObje

7、cts ( BO )数据仓库解决方案BO 是集查询、报表和OLAP 技术为一身的 IDSS ,它使用独特的语义层和动态微立方技术来表示数据库中的多维数据, 具有较好的查询和报表功能, 提供钻取等多维分析技术, 支持多种数据库,同时还支持基于Web 浏览器的查询、报表和分析决策。虽然BO 在不断增加新的功能, 但从严格意义上讲, 只能算是一个前端工具。 也许正是因为如此,几乎所有的数据仓库解决方案都把BO 作为可选的数据展现工具。BO 支持多种平台和多种数据库,同时支持 Internet/Intranet 。 BO 主要作为第三方产 品或其它公司的产品结合进行使用。 BO 是集成查询,报表和分析

8、功能工具,它还提供了世界上第一个通过Web 进行查询、报表和分析的决策支持工具Webintelligence ,第一个可以在 MicrosoftExcel 集成企业公共数据源中数据的工具Businessquery 和面向主流商业用户的数据挖掘工具Businessminer ,用其可以实现深入的分析用以发掘深层次的数据之间的关系。BO 是商务智能行业不折不扣的领导者,在美国加利福尼亚圣何塞和法国巴黎设有两个总部。 BusinessObjects 还在业内创建了最强大、最全面的合作伙伴社区,在全球拥有3000多家合作伙伴,包括Accenture 、 BearingPoint 、 Capgemini

9、 、 HP 、 IBM 、 Microsoft 、Oracle(PeopleSoft) 、 Sysbase 、 BEA 、 Teradata 和 SAP 等企业。另外,公司还提供咨询和培训服务,以帮助客户有效地部署商务智能项目。 2007 年 10 月被 SAP 收购,但是保持独立运营。BusinessObject 是一个由多个产品组成的产品族,主要包BusinessObject,Designer,DocumentAgent,Supervisor,BusinessMiner五个产品。这几个产品功能如下:(1)supervisor:Supervisor 是 BO 自身的安全管理工具。 在 Spe

10、rvisor 中可以建立和维护资料库, 在资料库中可以建立BO 的用户和用户组, 通过对不同用户赋予不同的操作权限, 来实现对 BusinessObject 的使用用户、定制查询 (universe) 以及查询报告的安全管理。实际上多个用户定制查询及查询结果的共享时通过资料库实现的。(2)Designer:Designer 是一个多编模型构建工具,它可以将关系库中的表通过类、对象及对象明细等工具映射到多维模型的维、 维元素及度量指标上, 使用户在符合业务逻辑的多维模型上构建查询。(3)BusinessObject:BusinessObject 是一个查询定制和统计报表( 图形 )生成工具。它利

11、用Designer 建立多维模型定制各类查询,查询方式包括 BusinessObject 定制查询语义层(universe) 、 手写 SQL 语句、 存储过程及个人数据文件等, 在 BusinessObject41 版中还将支持 OLAPPannel ,从而使其可以利用其他厂商的 OLAP 服务器的功能。 BusinessObject将查询结果以多种报表形式及统计图形的方式提交给用户。 用户可以在查询结果上进行进一步的分析,如向下/ 向上钻取(DrillUp/DrillDown) 等。另外,在 BusinessObject 中还提供了一种 script 语言,?该语言风格类似VisualBa

12、sic ,在程序中可以以面向对象的编程风格调用 BusinessObject 提供的丰富类库。得script 语言可以定制出更为友好的查询界面。(4)DocumentAgent:DocumentAgent 是专为工作组用户的文档管理及查询结果刷新而建立的。一组用户对应一个DocumentAgent ,不同用户的查询报表(图形 )均可发送到DocumentAgent 供同组的其他用户共享。 DocumentAgent 还可以定义统计报表(图形 )的刷新频度。BusinessObject 具有以下几个特点:前端分析手段灵活,表现方式多样,语义层构建工具应用面广, 应用简单, 具有文档管理的数据刷新

13、功能, 可以利用资料库对不同用户的操作权限进行管理【文来自百度空间】2 、 IBM 数据仓库解决方案IBM 公司提供了一套基于可视数据仓库的商业智能解决方案,具有集成能力强,高级面向对象 SQL 等特性。包括: VisualWarehouse ( VM ) 、 Essbase/DB2OLAPServer5.0和 IBMDB2UDB , 以及来自第三方的前端数据展现工具 (如 BO) 和数据挖掘工具 (如 SAS ) 。其中, VW 是一个功能很强的集成环境, 既可用于数据仓库建模和元数据管理, 又可用于数据抽取、转换、装载和调度。 Essbase/DB2OLAPServer 支持:“维”的定义

14、和数据装载,它不是关系型OLAP ,而是混合型的 OLAP 。IBM 采取合作伙伴战略,例如其前端数据展现工具可以使BusinessObjects 的 BO 、Lotus 的 Approach 、 Cognos 的 Impromptu 或 IBM 的 QueryManagementFacility维分析工具支持ArborSoftware 的 Essbase 和 IBM 的 DS2OLAP 服务器,统计分析工具采用 SAS 系统。IBM 公司推出的 DB2UDB7.1 主要实现以下功能: 电子商务, 包括 e-commerce 、 ERP、客户关系管理、 供应链管理、网络自助和商业智能,帮助企业

15、实现电子商务。商业智能利用已有的数据资源来支持企业决策,包括数据访问、 数据分析、 成本控制、获取新的商业机会和提高客户忠诚度; 数据管理包括准确高效的运行查询和应用、安全的存储、访问数据、数据恢复和在复杂的硬件环境下实现应用;增强 DB2 家族产品,满足当今异构计算环境的需要,实现开放时机决方案。 IBM 联合了 550 多家合作伙伴,可以提供多达800 种商业信息应用和工具。在世界范围内, IBM 的 9500 多家合作伙伴为支持 DB2 通用数据库设计了 16300 种应用程序。它主要有以下特性:集成能力强主要包括通用数据支持、免费新增数据仓库中心和DB2OLAPstarterkit 。

16、用户可以使用 DB2 的数据连接器 ( DataJoiner ) , 象访问 DB2 数据资源一样访问 Oracle 、 Sybase 、 Informix 、 SQLServer 等数据库。 DB2UDB 的用户现在可以跨越 DB2 数据库、 Oracle 数据库或者一个OLEDB 资源进行分布式的查询, 也就是可以通过使用 DB2 通用数据库的 SQL句法和 API 在一个工作单元的查询内访问和处理保存在异构数据资源中的数据。高级面向对象SQLDB2UDBV7 中包含了一些先进的 SQL 功能,对开发人员和分析员都非常有用。DB2 可以提供临时表格支持、 应用存储点 (savingpoin

17、t) 、 标识栏 (IDColumn) 和嵌套存储过 程。Windows 集成DB2UDB7.1 增加了对于Windows 环境集成的支持: OLE-DB2.0 版本的客户端支持功能; OLE 存储过程的集成支持; VisualStudio 集成; LDAPonWin2000 支持;扩展用户 ID 支持。 DB2V7.1 加强了对 OLE-DB 的支持功能。现在用户可以用 OLE-DB 的应用工具通过本地的 OLE 界面来访问或查询 DB2 数据,也可以通过OLE-DB 的表格功能把数据装载到 DB2 中。提供三个新的扩展器:空间扩展器(SpatialExtender )新版 DB2 提出了空

18、间 SQL 查询概念( SpatiallyEnabledSQLQueries ) ,使用户可以在关系型数据库中集成空间数据(通过坐标确定位置)和普通的 SQL 数据。这两种技术的结合使用户可以进行新型查询。 新的空间扩展器将能够存储和索引空间数据 (坐标信息) ,并使用户通过特定的空间数据查询对其进行访问。4DB2XML扩展器IBMDB2XMLExtender 体现了 IBM 全面的 XML 技术策略,在电子商务领域居业界领导地位。 XML 扩展器是 IBMB2B 服务器的组成部分,使DB2 服务器可以支持XML 。通过 XML 扩展器提供了 XML 文档在 DB2 中的存储和恢复机制,并可高

19、效地查询 XML 内容。通过数据交换, XML 扩展器提供新的和已存在的 DB2 相关表格和XML 格式文档之间的映射。 DB2 用户可以在任何地方通过 XML 扩展器进行电子商务,实现企业之间( B2B )和企业与消费者之间( B2C )的应用。4Net.Search 扩展器DB2SearchExtender 包括一个 DB2 存储过程,提高了 Net.Data 、 Java 和DB2CallLevel 界面应用的快速全文本查询功能。它为应用编程者提供了大量查询功能,例如模糊查询、 逆序查询、 布尔操作和分区查询。 在 Internet 中使用 DB2Net.SearchExtender进行

20、查询具有极大的优势, 特别是在遇到并行查询的大型检索时。 【文来自天极网 】盒装数据仓库”为了使企业尽可能轻松、快捷和成本有效地建立一个功能数据仓库, IBM 及 IBM 服务人员提供一个集成的 S/390Multiprise3000 服务器硬件、关系数据库、操作系统和查询管理软件以及咨询和实施服务包“盒装数据仓库”,能够比以前更加轻松地使您的系统运行起来。该产品的主要组件包括:IBMDB2UniversalDatabase?forOS/390 :业界主要的 Web 使能的数据库,用于处理不同的任务,例如分布式数据仓库和数据仓库、复杂的查询和事务处理。如果与OS/390 一起运行,它可以为您的

21、数据仓库应用提供无与伦比的可用性、安全性和易于管理特性。IBMDB2ServerforVSE 和 VM : DB2 家族的关键成员,它为客户建立分布式数据库解决方案和一周 7 天一天 24 小时管理复杂的数据库环境提供所需的一切。 DB2ServerforVSE 和VM 能以大型系统所需的效率和速度管理大量的数据,允许使用不同的工具直接访问数据。IBMQueryManagementFacility(QMF)forWindows :紧密集成、功能强大而且可靠的查询和报表工具集,用于DB2 关系数据库管理系统。 QMFforWindows( 与安装在Multiprise3000 中的一个 QMF

22、程序协作,能使用户轻松地访问存储在分布式数据库网络中许多 DB2 子系统中的大量关系数据,包括 DB2forOS/390 。S/390Multiprise3000EnterpriseServer : 功能强大、 易于管理的服务器, 它在 S/390 平台上成本有效地为中型企业提供增加的计算功能。 它包括三种简化的型号配置, 每一种型号都提供领先的 S/390 处理技术、额外的存储容量、更高的数据传输速率和更快的处理速度。为商业智能解决方案选择S/390 平台有助于利用现有的技能和资源降低您的总拥有成本。它可以单独使用或者与任何基于UNIX( 和 WindowsNT( 的应用服务器一起使用。IB

23、M 服务人员: IBM 服务人员将向您的企业咨询,以了解您的业务需求,帮助准备和组织 用在数据仓库中的数据, 提供教育、 培训和安装服务。 IBM 服务人员提供的全面的 FastStart解决方案包括硬件、 软件和服务能够快捷、 成本有效地帮助使您的数据市场应用运行起来文来自 IBM 中国主页产品介绍3 、 Oracle 数据仓库解决方案Oracle 作为世界上最大的数据库厂商之一,凭借其在技术、资源和经验上的优势,一直致力于为企业提供最能满足企业竞争需要的数据仓库解决方案, 其数据仓库解决方案包含了业界领先的数据库平台、开发工具和应用系统。 Oracle 数据仓库突破了现有数据仓库产品的局限

24、,能够帮助企业以任何方式访问存放在任何地点的信息,在企业中的任何层次上,满足信息检索和商业决策的功能需要。 数据仓库解决方案能够提供一系列的数据仓库工具和服务,具有多用户数据仓库管理能力,多种分区方式,较强的与OLAP 工具的交互能力,以及快速和便捷的数据移动机制等。Oracle 数据仓库解决方案主要包括两部分:4 1 ) OracleEcpress :它由 4 部分组成, OracleExpressServer 是一个 MOLAP 服务器, 它利用多维模型, 存储和管理多维数据库或多维高速缓存, 同时也能够访问多种关系型数据库; OracleExpressWebAgent 通过 CGI 或

25、Web 插件支持基于Web 的动态多维数据展现; OracleExpressObjects前端数据分析工具提供了图形化建模和假设分析功能,支持可视化开发和事件驱动编程技术, 提供了兼容 VisualBasic 语法的语言, 支持 OCX 和 OLE ;OracleExpressAnalyzer 是通用的面向最终用户的报告和分析工具。5 2 ) 、 OracleDiscoverer :即席查询工具,专门为最终用户设计,分为最终用户版和管理员版,在其数据仓库解决方案实施过程中,通常把汇总数据存储在Express 多维数据库中,而将详细数据存储在Oracle 关系数据库中。需要详细数据时, Expr

26、essServer 通过 构造 SQL 语句访问关系数据库。但目前的 Express 还不够灵活,数据仓库设计的一个变化 往往导致数据库重构。最新的 oracle 数据仓库产品有: oracle 数据库 11g , sunoracleexadata 存储服务器, sunoracle 数据库机, oracle 分区, oracle 高级压缩, oracle 在线分析处理, oracle 零售 数据模型, oracle 数据挖掘, oracle 数据集成器企业版等。 (文摘自甲骨文中国主页)4 、 Sybase 数据仓库解决方案Sybase 公司提供的数据仓库解决方案以能够支持多种关系型数据库而受

27、到业界的推崇。它能够同时处理几十个即席查询,其垂直数据存储技术是系统只访问特定的少量数据,使得查询速度比传统的关系型数据库管理系统快100 倍。Sybase 提供的数据仓库解决方案称为 Sybase 企业级关系型数据库,AdaptiveServerIQ 是专门为数据仓库设计的关系型数据库,它为高性能的 DSS 和数据仓库的建立作了专门的优化处理, SybaseIQ 支持各种流行的前端展现工具(如CognosImpromptu 、 BusinessObjects 和 BrioQuery 等) 。数据分析与展望工具包括PowerDimensions 、 EnglishWizard 、 InfoMa

28、ker 和 PowerDynamo 等,PowerDimensions 是图形化的 OLAP 工具,支持 SMP 和多维缓存技术,能够集成异构的关系型数据仓库和分布的数据集市, 从而形成单一新型的多维模式, 数据仓库的维护与管理工具包括 WarehouseControlCenter 、 SybaseCentral 和 DistributionDirector ,其中WarehouseControlCenter 是为数据仓库库开发人员提供的元数据管理工具。Sybase 提供了完整的数据参股解决方案QuickStartDataMart ,具有良好的性能,并支持第三方数据展现工具, 它尤其适合于数据

29、集市应用。 另外, Sybase 可以提供面向电信、金融、保险和医疗保健 4 个行业的客户关系管理产品。成功案例有:广东电信运营分析系统, 大鹏证券数据仓库项目, 全国铁路客票系统, 招商银行数据仓库项目以及最新的贵州电信等。5 、 Infomix 数据仓库解决方案Infomix 于 1998 和 1999 年相继收购了国际上享有盛誉的数据仓库供应商RedBrickSystem和数据管理软件供应商Ardent , 并提供了完整集成的数据仓库解决方案。该解决方案还包括了一个快速启动咨询服务, 能够帮助用户快速完成数据仓库或数据集市的开发。 Infomix 产品能够集成MicrosoftIIS 或

30、 NetscapeEnterprise/FastTrack 服务器,从而支持基于Web 的数据仓库应用。Infomix 没有提供自己的报表和数据挖掘工具, 但与 Brio 和 SAS 公司建立了战略联盟,并推出了 “Infomi淌业智能联盟计划”,该计划以 Infomix为主,结合Brio的前端数据分析和报表功能,以及SAS 的数据挖掘功能,形成了一个“ 中心”打包方案。 BIInfomix 公司发布的集成可伸缩的 FastStart 数据仓库解决方案,使用户能够快速而便捷的设计开发具有可伸缩的数据仓库或数据集市。 InfomixDataStage 是一个可以简化和自动从任意数据源中抽取、 转

31、换、 集成和装载数据的集成化工具, 其可视化设计使用户可以通过一个直观的可视模型设计数据的转换过程, 它允许开发者添加更多的数据源、 目标及转换程序, 而无须重建应用程序, 因此可降低成本, 减少时间和资源。 由于能快速确定解决方案,用户可以在短时间内存取他们需要的数据,从而做出更明智的商业决策。构建一个数据集市包含许多普通的操作, 而每个执行过程都不可避免的需要制定解决方案, 使之适应特定的分析需求。 有经验的开发者懂得如何定制以便处理特殊的数据格式、 专业化的商业规划处理和复杂的逻辑转换,这些工作大约占用构建数据集市或数据仓库所需的80% 以上的成本和时间。 InfomixDataStag

32、e 提供一个基于组件的体系结构, 可以通过模型化、重复使用模块(如文件载入和集合)来简化和加快开发过程。另外还提供了更为强大的可伸缩性和经济性,允许用户建立反映特定应用需求的组件,然后封装这些组件以重用。InfomixDataStage 利用开放的应用程序接口( API )和开发工具箱扩展基于组件的体系结构,使用这个接口,用户能够方便的构建新的被称为“ - In ”的组件。利用这些 PlugPlug-In ,用户可以捕获定制的转换和商业规划,自动归档并在 InfomixDataStage 环境中重复使用,从而构建一个可扩展的附加功能库。InfomixDataStage 包括如下组件 :(1)

33、设计器。这是一个强大的,基于图形用户界面的开发工具,包含一个转换引擎,一个元数据存储和二种编程语言( SQL 和 BASIC ) 。使用设计器的拖拉功能,用户能在准备数据集市中建立一个数据转换过程模型,防止操作系统的中断及避免执行错误。(2) 存储管理器。在开发数据集市的过程中,使用存储管理器浏览、编辑和输入元数据,可能包括来自操作系统的元数据或目标集市及开发项目中新的元数据(如新的数据类型定义、传输定义和商业规则) 。(3) 控制器。使用控制器和运行引擎规划运行中的解决方案,测试和调试其组件,并肩控执行版本的结果(以特别要求或预定为基础) 。(4) 管理器。简化数据集市的多种管理,用其为用户

34、或用户组分配器权限(控制InfomixDataStage 客户应用或看到或执行的工作) ,建立全局设置(如用于自动清除日志文件的默认设置) ,移动、重命名或删除项目和管理或发布从开发到生产的状态。(5) 服务器。提供了很高的性能,如高速转换引擎、临时的数据存储、支持legacy 及关系数据结构和强大的预定义转换等。另外,服务器通过多个处理器平台优化强化可伸缩性,支持多种数据输入输出方法,容易添加新的数据源及转换方法。(6) 、 NCR 数据仓库解决方案NCR提出了一套独特的数据仓库方法论和实施框架理论,成为“可扩展数据仓库”(ScalableDataWarehouse ,简称为SDW),其基本

35、框架主要分为3个部分:1 )数据装载。把操作数据或源数据利用一定的方法,如提取、过滤(Filer ) 、清理( Scurb ) 、家庭关系识别( Household )等,从生产系统中转换到中央数据仓库中。这种转换分成逻辑与物理两部分, 即根据业务问题建立数据库逻辑模型。 然后在此基础上构造物理模型, 将操作数据加载到物理表中。 逻辑建模应基于要解决的业务问题, 而不是基于目前的系统能提供的数据进行。 换言之, 数据仓库的出发点是解决业务问题, 而不是只提供一个 信息转换与访问的工具。( 2 )数据管理这一部分是整个数据仓库的心脏,它必须采用一个具有优良并行处理性能的关系数据库管理系统。 当数

36、据仓库非常庞大而且复杂时, 为了提高性能, 可以建立一些 面向部门应用的数据集市,集市中的数据从中央库中通过复制与传送等手段拷贝而来。( 3 ) 信息访问。 这是前端工具, 主要提供给有关业务部门访问数据仓库中的信息使用, 一般都采用一些具有图形界面和交互功能强的查询工具。NCR 数据仓库的主要工具Teradata 是高端数据仓库市场最有力的竞争者, 主要运行在NCRWorldMarkSMP 硬件的 Unix 操作系统平台上,提高交互分析、标准报告和多维度分 析。( 、 Microsoft 数据仓库解决方案2000 年 4 月, Microsoft 发布了 SQLServer2000Beta2

37、 版本, 供用户测试评估该公司下一版本的数据库系统。 该版本是一套完全的数据库和数据分析解决方案, 是用户可以快速 创建下一代的可扩展电子商务和数据仓库解决方案,包括以下几大功能:( 1 )完备的 Web 功能。提供完全集成和基于标准的 XML 支持,对于Web 开发人员和数据库程序员来说都是灵活高效且易于使用的。 数据挖掘功能可以自动地从大量的商业信 息中进行筛选,帮助客户找出未被发现的新机会,预测在商业中制胜的策略。( 2 )高度可扩展性和高可靠性。 SQLServer2000 引入了一个新的特性,称为“分布式数据库分区视图( DistributedPartitionedViews )”,

38、可以把工作服在分配到多台独立的 SQL 分析服务允许对拥有数以亿计成员的为进行多维查询,支持对 Web 数据集的高速分析。( 3 )加速应用开发。SQLServer2000 与 Windows2000 的活动目录服务的紧密集成允许集中管理SQLServer2000 和其他企业资源, 从而极大的简化了大型组织中的系统管理任务。SQLServer2000 还增强了安全性方面,保护防火墙内和防火墙外的数据。SQLServer2000 支持强有力的、灵活的和基于角色的安全,拥有安全审计工具,并提供高级文件加密和网络加密功能。MicrosoftWindowsDNA 是建立和部署Internet 商业应用

39、程序全面的集成平台。SQLServer 可以在 WindowsDNA 环境下快速建立Web 解决方案,并减少了建立电子商务应用、商业智能(数据仓库) 和商业线路应用所需的时间, 同时保证了这些应用具有在最苛刻的环境下面所需要的可扩展性。Microsoft 将 OLAP 功能集成到 SQLServer 中,提供可扩充的基于COM 的 OLAP 接口。 MicrosoftOffice2000 套件中的 Access 和 Excel 可以作为数据展现工具,另外SQLServer 还支持第三方数据展现工具。 SQLServer2000 数据仓库技术主要包括:( 1 )数据传输服务DTS ( DataT

40、ransformationServices )提供数据输入 / 输出和自动调度功能,在数据传输过程中可以完成数据的验证、清洗和转换等操作,通过与MicrosoftRepository 集成,共向有关的元数据。(2 ) MicrosoftRepository 存储包括元数据在内的所有中间数据。3 ) SQLServerOLAPServices 支持在线分析处理。4 ) PivorT ableServices 提供客户端OLAP 数据访问功能,通过这一服务,开发人员可以用 VB 或其他语言开发用户前端数据展现程序, PivorTableServices 还允许在本地客户机上存储数据。( 5 ) M

41、MC ( MicrosoftManagementConsole ) 提供日程安排、 存储管理、 性能监测、报警和通知的核心管理服务。( 、 SAS 数据仓库解决方案SAS 公司在 20 世纪 70 年代以“统计分析”和“线性数学模型”而享誉业界, 20 世纪90 年代以后,该公司也加入了数据仓库市场的竞争,它提供的工具(如智能化的客户机/服务器和多厂商构架等) 可以帮助企业实现一个灵活和低风险的处理, 并提供了特点鲜明的数据仓库解决方案,包括多个专用模块。其中, SAS/WA ( WarehouseAdministrator )是建立数据仓库的集成管理工具, 包括定义主题、数据转换与汇总、 更

42、新汇总数据、 元数据管理和数据集市的实现等; SAS/MDDB 是 SAS 用于在线分析的多维数据库服务器; SAS/AF提供了屏幕设计功能和用于开发的SCL (屏幕控制语言); SAS/ITSV ( ITServiceVision )是 IT 服务的性能评估和管理的软件,这些 IT 服务包括计算机系统、网络系统和 Web 服务器和电话系统等。总的来说, SAS 系统的优点是功能强、性能高且特长突出;缺点是系统比较复杂,软件投资较高,而且每年都需交纳 License 费。9 、 CA 数据仓库解决方案CA 于 1999 年收购了 PlatinumTechnology 公司后, 得到了完整的数据

43、仓库解决方案,包括 Erwin 数据仓库设计工具、 InfoPump 数据转换与抽取工具、 InfoBeaconROLAP 服务器、 Foresrt&Trees 前端数据展现工具、 Provision 系统监视与作业调度工具和DecisionBase 元数据管理工具等。与 Informix 解决方案相似, CA 解决方案也提供了数据仓库建模、元数据管理、数据抽取与转换、 基于关系数据库的在线分析服务器、 系统监视与作业调度和前端数据展现等功能, 同时还支持Web 应用。 不同之处是Infomix 提供了专门为数据仓库设计的高性能目标 数据库 ( RedBirck ) , 而 CA 解决方案则提

44、供 ODBC 接口, 并将数据存储在第三方关系数据库(如 Oracle 、 Sybase 、 SQLServer 、 Infomix 和 IBMDB2 等) 中, 其性能要打一些折扣,但开放性要好些。 另外, CA 的 OLAP 服务器目前只能与Microsoft 的 IISWeb 服务器集成。CA 提供的数据仓库解决方案能够满足不同企业的需要, 能够集成完全不同的技术解决方案。适合于航空、电信、 零售业、股票交易和证券等各行业的数据综合性分析处理,为其提供全面的数据仓库解决方案。其特色如下:( 1 )独特的元数据管理与应用,数据仓库必须优化,以更好的实现数据存取、大量数据分析乃至交易分析。

45、必须确保数据仓库能够从正确的地方搜集与存储详细的数据, 以进行正确的分析, 元数据管理是仓库环境、 性能和利用率的关键基础, 最终的数据仓库的价值取决于基础设计。 CA 的数据仓库解决方案DecisionBase 利用其知识库( Repository )作为中心记录用户的信息资产关于入库信息的数据,使商业用户能够更轻易的驾驽数据仓库和理解常有的隐含的数据信息。这样元数据如同地图,提示用户的数据仓库中有何信息,这些信息来自何处。( 2 ) 数据转换, CADecisionBaseReporter 提供了简便的方案, 创建与共享特定报表,并将其转换为生产报表,它支持在报表内进行多重查询使用户可在其

46、报表中创建多重一对关系, 并可进行并列比较。 无需昂贵的中间件或临时表格, 报表生成程序就可将来自不同数据库的数据衔接起来,使CADecisionBaseReporter 能够轻松创建具有专业外观的报表。( 3 )解析处理功能, CA 将三维可视化技术运用到了 DecisionBaseOLAPServer 中,从而为复杂的数据提供了更友好和更为直观的界面。 这样用户就能集中精力设计专门的商务功能,提供更稳健的电子商务应用程序,从而更快地进入市场。CADecisionBaseOLAPServer 提供了多维视角,并可通过标准关系数据库顶端的“虚拟立方”实现分析处理功能。 OLAPServer 允

47、许用户通过基于 LAN 的客户或在浏览器内现场编辑与执行任何分析, 动态编辑数据。 在任何层级或细节跟踪与分析关键商业指标。 因为它是Web 激活的, 所以应用程序可通过 Internet 、 Intranet 或 Extranet 服务器在企业内轻松配置。( 4 )预测管理功能, CANeugents 是企业用于预测管理的先锋,能够预测商业结果、规划前景和预计收入, 并可识别对这些方面有所影响的因素。 Neugents 与基于规则的系统及基于经验的推论(EBR) 一起提供了一整套聪明的解决方案,可用于任何商业问题。通过Neugents 与 DecisionBase ,能够检测企业的客户数据,预测他们最可能购买的产品,然后据此安排生产系统。 Neugents 可在应用程序内建立学习功能, 应用程序可清楚的显示过去所发生状况,并根据已经改变的环境做出正确的反应。文来自it1688 网

展开阅读全文
相关资源
相关搜索

当前位置:首页 > 教育专区 > 高中资料

本站链接:文库   一言   我酷   合作


客服QQ:2549714901微博号:文库网官方知乎号:文库网

经营许可证编号: 粤ICP备2021046453号世界地图

文库网官网©版权所有2025营业执照举报