数仓入门基础-5-雪花模型与星型模型

简书 · · 68 次点击 · · 开始浏览    

个人博客:https://renwula.github.io/,本系列基于互联网公司数仓,使用hive搭建数仓


星型模型与雪花模型,应该是数仓面试者最喜欢提的问题,也是比较容易理解的概念。

1.星型架构是一种非正规化的结构,多维数据集的每一个维度都直接与事实表相连接,不存在渐变维度,所以数据有一定的冗余,例图如下:

星型模型

2.当有一个或多个维表没有直接连接到事实表上,而是通过其他维表连接到事实表上时,其图解就像多个雪花连接在一起,故称雪花模型。雪花模型是对星型模型的扩展。它对星型模型的维表进一步层次化,原有的各维表可能被扩展为小的事实表,形成一些局部的 "层次 " 区域,这些被分解的表都连接到主维度表而不是事实表。如图 2,将地域维表又分解为国家,省份,城市等维表。它的优点是 :通过最大限度地减少数据存储量以及联合较小的维表来改善查询性能。雪花型结构去除了数据冗余。

雪花模型

一般在互联网公司推崇星型模型,使用便利方便

本文来自:简书

感谢作者:简书

查看原文:数仓入门基础-5-雪花模型与星型模型

68 次点击  
加入收藏 微博
暂无回复
添加一条新回复 (您需要 登录 后才能回复 没有账号 ?)
  • 请尽量让自己的回复能够对别人有帮助
  • 支持 Markdown 格式, **粗体**、~~删除线~~、`单行代码`
  • 支持 @ 本站用户;支持表情(输入 : 提示),见 Emoji cheat sheet
  • 图片支持拖拽、截图粘贴等方式上传