ImageVerifierCode 换一换
格式:PPT , 页数:11 ,大小:431.16KB ,
资源ID:3347941      下载积分:15 文币
快捷下载
登录下载
邮箱/手机:
温馨提示:
快捷下载时,用户名和密码都是您填写的邮箱或者手机号,方便查询和重复下载(系统自动生成)。 如填写123,账号就是123,密码也是123。
特别说明:
请自助下载,系统不会自动发送文件的哦; 如果您已付费,想二次下载,请登录后访问:我的下载记录
支付方式: 支付宝    微信支付   
验证码:   换一换

加入VIP,免费下载
 

温馨提示:由于个人手机设置不同,如果发现不能下载,请复制以下地址【https://www.wenkunet.com/d-3347941.html】到电脑端继续下载(重复下载不扣费)。

已注册用户请登录:
账号:
密码:
验证码:   换一换
  忘记密码?
三方登录: 微信登录   QQ登录   微博登录 

下载须知

1: 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。
2: 试题试卷类文档,如果标题没有明确说明有答案则都视为没有答案,请知晓。
3: 文件的所有权益归上传用户所有。
4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
5. 本站仅提供交流平台,并不能对任何下载内容负责。
6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

版权提示 | 免责声明

本文(物流数据仓库模型设计方法及规范V1.0ppt课件.ppt)为本站会员(小陳)主动上传,文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对上载内容本身不做任何修改或编辑。 若此文所含内容侵犯了您的版权或隐私,请立即通知文库网(发送邮件至13560552955@163.com或直接QQ联系客服),我们立即给予删除!

物流数据仓库模型设计方法及规范V1.0ppt课件.ppt

1、物流数据仓库模型设计方法及规范 物流数据仓库数据模型设计 方法及规范 1 1 模型概述 2 建模方法 3 建模规范 议题 物流EDW模型总体架构 TI Staging TO ODS TW DW TA DM/Repor t 物流EDW分为四层: 1.TI/Staging层作业为数据源数据的接口层;表结构和数据源一致,如需要增加识别数据 源的字段; 2.TO/ODS层作为数据源数据的整合存储层,会保存一定时间段的历史数据;可支持基 本的业务报表;表结构和TI层一致,如需增加识别历史的字段; 3.TW/DW层作为数据仓库的模型层,采用星型模型设计,维表采用逆规范化设计,维 表主键为整数序列,事实表的

2、编码转换为维表的主键,事实表需要尽量简化,不允许 保存描述信息; 4.TA/DM/Report主要是汇总事实表和保存为报表需要的计算结果,尽量为汇总级别的星 型模型,允许在某些情况将指标和描述信息保存在同一表中。 3 1 模型概述 2 建模方法 3 建模规范 议题 建模过程 建模过程分为5个阶段: 1. 需求及数据源分析 需求分析主要了解业务的流程,业务过程产生的单据,以及单据间的关系,业务过程中 涉及的人、物、组织和事; 数据源分析需要了解单据和业务中所涉及的人、物、组织等的主数据表,人物事之间的 关系表;了解以及这些表中包含的主要信息,还有这些表的数据量。 2. High Level模型设

3、计 将需求分析阶段的所得到实体按照数据仓库总线矩阵进行整理;包含哪些分析主题,每 个主题有哪些事实表,有哪些主数据,这些主数据可以归纳成哪些维表。每个分析主题 或事实表与哪些维度有关。 5 建模过程 建模过程分为5个阶段: 3. DW层模型设计 DW层设计采用数据驱动和业务驱动结合的方法,首先通过数据驱动的方法识别维表的 主要属性,如果需要在通过业务驱动的方法增加业务需要的属性或者层级;先设计维表 ,在设计事实表,事实表可以直接引用维表ID字段,事实表需要保存最低粒度的交易事 实。 维表设计需要考虑维表的数据量,对于大规模维度需要特殊处理: 一种方法是将常用的上面几层单独新建一个维度 另一种方

4、法是将维表的数据按照使用情况,将最近一个阶段用到的记录单独抽出来 最为一个维表,这种情况需要保证,两个表的ID一致,事实表只有一个字段连接全 表和最近使用的表。 定义事实表时,需要将业务系统单据的属性做简化,如果事实表包含同一维表的多个层 级,只保留最低的层级,单据中的多个类型、状态、FLAG字段需要通过杂项维来简化, 减少事实表字段;对于必要的相关单据号,如订单号,直接保留在事实表中,作为退化 维处理,不需要要为退化维建维表。 6 建模过程 建模过程分为5个阶段: 4. DM/报表层模型设计 DM设计采用需求驱动的方法,需求驱动方法步骤: a.调查报表需求, 报表需求需要落实到具体需要分析哪

5、些指标,需要从哪些维度来看,需 要哪些查询条件; b.整理报表需求中的指标和维度,维度整理需要了解维度有哪些层次,每个层次有哪些关 键属性,指标的整理需要了解指标的计算公式,并将指标的计算项落实到,DW层的基 础度量,还需要了解指标的分析的最细粒度,就要分析到哪些维度的哪些层级,参考仓 库模型设计文档仓库维度指标.xlsx; c.整理维度指标矩阵,参考仓库模型设计文档仓库维度指标.xlsx ; d.根据维度指标矩阵整理需要的汇总事实表,可将相同的主题的相同粒度的指标放到一个 汇总事实表。 7 建模过程 建模过程分为5个阶段: 5. 物理模型设计 物流数据仓库采用Hadoop/Hive/Impala的技术架构。 请打大数据开发Team补充这部分内容。 8 1 模型概述 2 建模方法 3 建模规范 议题 建模规范 建模规范参考大数据平台数据模型设计规范.doc 表、字段命名需要参考数据标准.xlsx和数据字典.xls 10 谢谢! Q&A 11

本站链接:文库   一言   我酷   合作


客服QQ:2549714901微博号:文库网官方知乎号:文库网

经营许可证编号: 粤ICP备2021046453号世界地图

文库网官网©版权所有2025营业执照举报