目录
1. 航班数据格式2. 开启数据库文件上传功能3. 上传CSV文件4. 创建图表5. Dashboard操作6. Pivot表7. 折线图(多线)8. 给Dashboard添加markdown描述9. 给dashboard添加过滤器10. 发布Dashboard11. 给charts图表和Dashboard添加注释12 高级分析12.1 创建基础图表12.2 滚动求均值12.3 时间比较12.4 数据重采样13 最终的Dashboard图片1. 航班数据格式
主要字段信息如下:
部门:用Orange、Yellow、Purple代替票价舱的类型单程或往返航班日期航班起始地和目的地航班飞行距离
下载方式:
从github下载地址进行下载,用浏览器直接打开文件了,可以使用linux的wget命令进行下载,再上传到本地
2. 开启数据库文件上传功能
3. 上传CSV文件
此时会在mysql中创建表tutorial_flights, 且superset的table数据集中也会有tutorial_flights数据集
4. 创建图表
5. Dashboard操作
点击和拖拽图表的右下角,可以修改图表的大小,最后点击保存
6. Pivot表
- 其中ABC表示字符串,#表示数字,时钟符号表示时间
7. 折线图(多线)
8. 给Dashboard添加markdown描述
鼠标放到</> markdown选项上,然后按住鼠标左键进行拖拽,移动到合适位置,松开鼠标即可
9. 给dashboard添加过滤器
- 从上面的两张图可以看出,在Dashboard的过滤器中应用过滤后,Dashbaord的其它图表都会应用此过滤条件
10. 发布Dashboard
可以点击编辑按钮,然后拖拽图表,进行位置的调整,最后保存即可
11. 给charts图表和Dashboard添加注释
- 可以查看charts图表和Dashboard都已经有注释了
12 高级分析
12.1 创建基础图表
12.2 滚动求均值
滚动求平均值,本示例滚动周期为7天10月7号的值为10月1号-10月7号的平均值,10月8号的值为10月2号-10月8号的平均值因为基础图表的时间范围时10月1号到10月31号,所以10月1号到10月6号没有滚动平均值12.3 时间比较
- 例如10月10号的值 = 10月10号的值 - 10月3号的值
10月10号实线的值:表示10月10号的真实值10月10号虚线的值:表示10月3号的真实值
12.4 数据重采样
采样周期为7天,取此周期的中位数每7天有一个数据点例如10月15号的值 = 10月9号到10月15号,这7天的中位数值所以图表只有10月1号、10月8号、10月15号、10月22号、10月29号,共5个值
13 最终的Dashboard图片
如果觉得《Superset航班数据可视化实战》对你有帮助,请点赞、收藏,并留下你的观点哦!