发布单位:武汉态物科技有限公司 日期:2022-9-7





先介绍一下,什么是数据模型?
数据模型是现实数据特征的抽象,用于描述一组数据的概念和定义。数据模型是数据库中数据的存储方式,是数据库系统的基础。在数据库中,数据的物理结构又称数据的存储结构,就是数据元素在计算机存储器中的表示及其配置;数据的逻辑结构则是指数据元素之间的逻辑关系,它是数据在用户或程序员面前的表现形式,数据的存储结构不一定与逻辑结构一致。
没有好的模型,只有合适的模型。
一个模型可能对数据集a比较合适,但是对数据集b就不合适。
这里的合适可以用两个含糊的条件来判断:模型能达到你预期的效果。耗用的计算资源较小。但无论如何,评价一个模型如何,一定要结合使用场景的。
数据建模种类
1、关系建模(3nf)
定义:通过实体关系(e-r)体现企业经营活动的业务要素和业务规则,通过满足 3nf 设计消除数据冗余。
优点:模型稳定、灵活、扩展性强
缺点:-一定数据访问的便利性和业务的可理解性
适用性:适用基础数据的组织和管理(ods层)
应用行业:非互联网行业,如传统金融、证券行业、电信行业、零售、航空等
3nf表间关系:1-1;n-1;1-n;n-n;
数据库的设计:从事物出发、减少冗余;
数据的仓库:从分析出发
维度建模
1、维度和指标的概念
按照维度表、事实表构建数据模型,通过指标评价企业经营活动。
维度一般包括:地区、时间、部门、产品等等。
指标一般包括:销售数量、销售金额、平均销售金额等等。
2、星型模型
星型模是一种-的数据关系,它由一个事实表和一组维表组成。每个维表都有一个维作为主键,所有这些维的主键组合成事实表的主键。强调的是对维度进行预处理,将多个维度集合到一个事实表,形成一个宽表。这也是我们在使用 hive 时,经常会看到一些大宽表的原因,大宽表一般都是事实表,包含了维度关联的主键和一些度量信息,而维度表则是事实表里面维度的具体信息,使用时候一般通过 join 来组合数据,相对来说对olap 的分析比较方便。
|
相关信息
北京
上海
天津
重庆
河北
山西
内蒙古
辽宁
吉林
黑龙江
江苏
浙江
安徽
福建
江西
山东
河南
湖北
湖南
广东
广西
海南
四川
贵州
云南
西藏
陕西
甘肃
青海
宁夏
新疆
本站图片和信息均为用户自行发布,用户上传发布的图片或文章如侵犯了您的合法权益,请与我们联系,我们将及时处理,共同维护诚信公平网络环境!