tableau教程 快速入门
先基础了解你的数据
- 先选数据源
- 了解你的数据源
- 字段含义、字段类型
- 数据更新频率、数据量、波动频率范围
- 决定了你的时间颗粒度
- 例子:
- 页面转化率(约小时级别+日级别)
- 财务营收收(日+周+月级别)
- 细粒度只看最近的x小时/天/周
- 想清楚你的需求、定义、dash 大概样子
- 如果需要多表看,则join 数据, 了解下方的各种join 区别
- 原理注意:MongoDB 经BI connector unwind后,把数据独立一个表
- 架构介绍
- tableau client/server <-> (cached)SQL data source (dremio) <-> BI connector <-> synced MongoDB(NoSQL) @China <-> MongoShake <-> MongoDB(Prod Secondary) @Foreign County
- another : tableau client/server <-> (cached)SQL data source (dremio) <-> hive(hadoop) <-> DB Secondary <-> DB router / Syncer <-> DB (Prod Secondary)
- web browser <-> (cached) tableau server <-> (cached)SQL data source (dremio)
- 了解这个有助于找问题、debug
基础图形
柱状-group
A
advance part
Performance issue:
教学资源:
优化
- tableau 可以做很多dash,所以很多时候各种dash 都可以做,甚至监控也可以
- 所以很多时候 管理后台的各种dash 统计、图是不需要在code 了
- 监控粒度为每小时
- 查询优化
- 查询中dremio缓存:
- 转化后的sql 执行在dremio
- 没cache
- 转化后的sql 执行在dremio—> MongoDB
- 转化后的sql 执行在dremio—> hive
tableau教程 快速入门
原文:https://www.cnblogs.com/no7dw/p/12637649.html