All articles| All Pictures| All Softwares| All Video| Go home page| Write articles| Upload pictures

Reading number is top 10 articles
ASP.NET中文件上传下载方法集合_[Asp.Net教程]
PHP+MYSQL实例:网站在线人数的程序代码_[PHP教程]
Apache伪静态html(URL,Rewrite)设置法_php资料_编程技术
ASP.NET开发经验(2):ASP.NET中的一些图形处理_[Asp.Net教程]
新瓶旧酒ASP.NET,AJAX(5),-,客户端脚本编程(Sys.UI命名空间下的类和快捷方法)_[Asp.Net教程]
SESSION的使用及原理_[Asp.Net教程]
c#时间增加并对比做法_[Asp.Net教程]
PHP实例:PHP取GB2312编码字符串首字母的方法_php资料_编程技术
扩展GridView(三)——单击命令按钮弹出确认框_[Asp.Net教程]
动态创建内容时所用的W3C,DOM属性和方法_.net资料_编程技术
Reading number is top 10 pictures
A man's favorite things7
Cesarean section, bloody, silently into it!1
Japan sexy beauty passion photo
美女和狗狗2
美奂绝伦的风景
一个武林高手的故事
西班牙山村小景3
Black and white also sexy--YanLiu2
Average female college students3
美洲杯宝贝的雨中风情2
Download software ranking
The Bermuda triangle2
Eclipse 4.2.2 For Win64
I'm come from Beijing2
Tram sex maniac 2 (H) rar bag16
Boxer's Top ten classic battle5
Ashlynn Video5
实战黑客不求人
Tram sex maniac 2 (H) rar bag6
好色的外科大夫
Red cliff
delv published in(发表于) 2013/12/30 4:44:06 Edit(编辑)
数据仓库数据建模的几种思路_mssql学习_编程技术

数据仓库数据建模的几种思路_mssql学习_编程技术

数据仓库数据建模的几种思路_mssql学习_编程技术-你的首页-uuhomepage.com
上周针对数据仓库建模的方向进行了常时间讨论,尝试找到一种适合阿里巴巴数据仓库平台发展的建模方法论。数据仓库接典型的两种数据仓库建模的理论是维度建模和基于主题域的实体关系建模,这两种方式分别以Kimball和Immon两位大师为代表。维度建模以数据分析需求为驱动,倡导总线架构:一致的事实和一致的维度,这种数据模型易于用户理解和数据分析操作。基于主题域的实体关系建模以源系统数据为驱动,整合企业的所有数据,站在企业级的高度对数据进行抽象,整合,采用3NF的实体关系理论建模,这种数据建模方式以更为抽象的方式尝试建立一个相对稳定的数据模型,并能描述企业级的数据关系。在工业界往往把两种方式结合起来运用数据仓库的不同数据层次结构中。
我们上周主要是针对采用基于主题域的实体关系建模中数据整合的方式进行较为深入的讨论,讨论了以下三种思路:
以属性聚集的方式同一主题域中不同实体的属性。比如对于会员、公司、客户等等实体对象我们都有地址属性信息、名称标识属性信息等等,这种思路就是把属性内聚性高的字段整合在一起,并把不同的属性打上类型标识以树表的形式存放。它的优点是:第一,模型稳定性好,外围系统变化了字段,只需要添加不同的类型,不需要进行表结构的变更;第二,减少大量冗余记历史数据。它的缺点是:第一,丢失了很多实体的属性标识信息,我们从模型上将看不到一个会员究竟有哪些地址属性,只能通过查询类型代码才能获取这些信息;第二,它极度的膨胀数据表的记录数,因为它采用竖表的形式存放;第三,应用起来很难,效率是一个大问题,因为我们往往要使用一个实体的多个字段,就会有很多join操作和竖转横的操作。第四:属性聚集也是一件比较难操作的过程,应为这是一个抽象的过程,对建模人员的业务背景知识和抽象能力都提出了很高的要求;第五:虽然减少了冗余的记历史数据,但是记历史的操作也较为复杂。
采用面向对象建模的方式,抽象不同实体的共同属性,然后再一步步采用继承、组合等面向对象的思想具体化实体。他的优点是模型模型概念比较清晰,缺点也是模型相对不是很稳定,整合后的数据的后续应该也面临重新组合的问题。
贴源的建模方式: 采用基本保持源系统的方式进行建模,重点放在数据的标准化,一致化,和数据业务意义的梳理。这种做法和我们目前数据仓库的做法比较类似。它具有实施比较容易,快速实现,前台可以直接使用数据;缺点是整合度不高,模型不稳定。
模型终究是为数据分析应用服务的,具体采用什么方式建模需要根据实际业务特点和源系统的特点决定。阿里巴巴的源系统具有变化快,数据分析应该变化快的特点,响应速度也要快的特点,而且我们要求不同系统之间整合的需求并不是很大,往往深度的数据整合带来的是应用上的不方便。因此,我个人觉得采用贴源的方式是当前更优的方案。
本文来自CSDN博客,转载请标明出处:http://blog.csdn.net/wsbupt/archive/2009/12/30/5109309.aspx




添加到del.icio.us 添加到新浪ViVi 添加到百度搜藏 添加到POCO网摘 添加到天天网摘365Key 添加到和讯网摘 添加到天极网摘 添加到黑米书签 添加到QQ书签 添加到雅虎收藏 添加到奇客发现 diigo it 添加到饭否 添加到飞豆订阅 添加到抓虾收藏 添加到鲜果订阅 digg it 貼到funP 添加到有道阅读 Live Favorites 添加到Newsvine 打印本页 用Email发送本页 在Facebook上分享


Disclaimer Privacy Policy About us Site Map

If you have any requirements, please contact webmaster。(如果有什么要求,请联系站长)
Copyright ©2011-
uuhomepage.com, Inc. All rights reserved.