失眠网,内容丰富有趣,生活中的好帮手!
失眠网 > CDA Level 1 数据分析师:5 多维数据模型

CDA Level 1 数据分析师:5 多维数据模型

时间:2019-07-31 03:18:49

相关推荐

CDA Level 1 数据分析师:5 多维数据模型

多维数据模型

1. 多维数据分析模型概述

1. 以字段或记录作为数据的引用、操作、计算的基本单位的数据2. 维度和度量:维度一般文本型(时间、用户、支付状态),度量一般数值型(单价、数量)3. 透视透视:需要三个元素:维度,度量,汇总计算规则4. 连接零散数据和人类认知的方法:1. 数据透视 2. 零散数据深入规则的发掘(2.3级涉及)5. 维度表:只包含维度信息;事实表:既有维度又有数值6. 主键:一个表有且只有一个主键,可单字段或多字段联合主键,一般命名ID,不存在空值和重复值,所有数据都用来修饰和扩充主键7. 连接信息孤岛的方法:OLAP,链接了不同DW和多维数据集8. 多维数据模型:多维数据集,立方体CUBE。定义:可以从多角度用数据全面映射某种业务实际情况。是多维的数据环境,如需要找到销售业绩下降的原因,不仅要看销售,还要看市场,质量,生产等,因此需要全面汇总。9. 宽表:所有需要的数据都汇总在一个表。一般是无法满足的,因为主键的原因,不能描述主键信息的不能在宽表中,所以会有一些一些信息无法囊括。这就是为什么需要OLAP,因为主键极限。

2. 创建多维数据模型的方法

1. 相临两表连接汇总:通过公共字段连接两表,选择不同表字段分别作为维度,度量,汇总规则2. 影响连接汇总三要素:1. 筛选器方向 1. 维度筛选度量,筛选器方向决定维度和度量的出处,维度指向度量2. 1对多时:1是维度,多是度量3. OLAP连接时,出度量字段的作为主表2. 对应关系:一对一,一对多,多对多1. 一对一:主键与主键。必须有相同的主键,实际场景几乎不会出现。有的时候暂时没有出错,但是可能会出错。2. 一对多:主键与非主键。常见的都是一对多,单向筛选方向,一表筛选多表。3. 多对多:非主键与非主键。一般不能用,避免使用。3. 两种汇总方式:类型1:合并维度,汇总度量,维度筛选度量类型2:合并维度,汇总维度下不同公共字段对应的度量,维度选取公共字段,公共字段筛选度量(一般不使用类型2)4. 三种模式:1. 星型模式:一个事实表和多个维度表相连2. 雪花模式:维度表和维度表相连3. 星座模式:多个事实表公共字段相连

3. 5W2H思维模型

1. WHEN ,WHO ,WAHT ,WHY ,WHERE ,HOW MUCH ,HOW TO DO

4. 基本透视规则

1. SUM, COUNT, DISTINCTCOUNT, AVERAGE(平均值陷阱,主键均值), MAX, MIN2. 平均值陷阱:Average求得的总平均值是主键的总平均值:总所有数据除以主键的个数(总行数)3. 维度嵌套:一个维度下再分一个维度,但不要在结果中显示过多的维度信息,可以使用切片器的方法(筛选器,只显示选择的条件)4. 筛选维度和汇总维度:一个结果包含这两个维度

5. 透视规则的扩展

1. 对比计算规则:1. 均比:实际值与平均值的对比、同类型产品销售情况(了解大小,且需要了解大小的好坏程度)2. 基准比:实际值与基准值对比、成绩水平3. 目标比:实际值他目标值之间的对比、销售业绩绩效4. 标准比:实际值与标准值之间对比、工厂工作水平绩效(邻居家小孩,与车间其他人的对比)考虑到工作难易程度5. 占比:部分与总体的对比、不同区域销售额占比2. 时间下汇总:1. MTD:月初2. QTD:季度初3. YTD:年初4. 环比:当期值与上期值对比(跨月:.2与.1对比)5. 同比:当期值与同期值对比(跨年:.2无.2对比)3. 对比汇总公式:1. 对比百分比公式:实际值/对比值 *100%2. 差值百分比公式:(实际值-对比值)/对比值*100%4. 行间透视:针对每行值分别求得整体汇总值、类似于开窗函数

6. 多维透视分析应用

经销商进销存情况分析1. 需要5W1H确定数据2. 进销存的分别事实表,产品表,订单表

如果觉得《CDA Level 1 数据分析师:5 多维数据模型》对你有帮助,请点赞、收藏,并留下你的观点哦!

本内容不代表本网观点和政治立场,如有侵犯你的权益请联系我们处理。
网友评论
网友评论仅供其表达个人看法,并不表明网站立场。