解构Tableau可视化:从底层原理到玩转高级图表
这篇书评可能有关键情节透露
姜斌老师新书在其公众号预告时就在关注,年初甫一上市就买回来,但并没认真翻阅。最近趁着有些闲暇时间,花了两天认真看完,特别在这里分享并推荐给数据可视化和Tableau爱好者。
作者简介
姜斌,网名“扫地sir”,首都师范心理学学士,北京大学应用心理学硕士,由财务岗位转型为专职数据分析。
2018年开始钻研Tableau,熟悉Tableau底层原理和可视化技巧,擅长Tableau高级复杂图表的原理拆解和制作,曾两次荣获 Tableau 中国区官方Viz Challenge 的冠军。
公号:参悟Tableau
B站:扫地sir
本书配套视频:解构Tableau可视化原理
书籍概述
姜斌老师接触Tableau的时间点恰恰也是包括我在内很多人了解Tableau的时候,大概在2018年前后,或许是由于某数据分析社群,也或许是大咖的引入。但这些年依然在宣传推广Tableau并笔耕不辍的,国内的Tableau爱好者并不多,喜乐君、姜斌都在其列。
喜乐君最近几年陆续推出好几本大作以及知识付费课程,将Tableau计算原理和可视化阐述的甚为详尽,有理论和实操的剖析,更有底层原理的解析。如果要推荐Tableau学习的资料,喜乐君的系列图书当之无愧首推。不过,窃以为吐槽国产BI软件、卷入行业纷争并不是什么好事,虽然给的理由是“哀其不幸怒其不争”,但外界观察者多少能品出点门户之见的味道。倒不如沉入工具和业务中,为Tableau新人和业务方做好服务,以此来培育和壮大Tableau爱好者群体。
姜斌老师在其公众号上写了大量的Tableau可视化高级图表的剖析和制作文章,文章质量很高,从此受益的Tableau爱好者不在少数。如今,姜斌老师将过往使用和服务大企业的知识和经验凝练成书,这就有了我们看到的《解构Tableau可视化原理》一书。
《解构Tableau可视化原理》的主体归结起来:
1、对于Tableau绘图的基本逻辑姜斌给出了个人理解,比如影响Tableau绘图的有哪些要素、有哪些关键概念?Tableau视图区只有行列功能区、标记栏和字段区,但就是这种极简可视化区域可以创造各种炫目的可视化效果,相比之下PowerBI的就显得臃肿许多。特别强调的是,学习Tableau需要搞懂的基本概念是数据类型,也就是数据字段是连续还是离散、是维度还是度量,这是Tableau作图产生那么多变化的来源之一,这也是其他可视化工具的基础概念和知识。Tableau作图主要依靠行列胶囊和图形标记栏,行列胶囊分别放置什么字段、每个字段是什么样的数据类型和属性,这一定程度决定了数据的展现方式。因此,这些基础和关键的概念是学习Tableau需要搞懂的第一道坎。

2、Tableau进阶的门槛在于能否搞定各种Tableau计算类型,这包括行级别计算、聚合计算、详细级别计算LOD以及表计算。这就是新手与高手之间的一道鸿沟,突破了它就是击败了Tableau学习最大的拦路虎,往后学习就简单多了,同样字段计算也是其他可视化工具比如PowerBI的DAX最大难点之一。姜斌老师在本书中分别进行了详细讲解,同样喜乐君的书以及相关课程也给出了自己的理解和阐述。LOD计算和表计算比较抽象,也别难以理解,国内外出名的Tableau文档书籍视频我基本都看过,能够通俗易懂阐明道理的少之又少。

3、姜斌老师对于高级图表的钻研很深,因此我们看到在《解构Tableau可视化原理》一书中,用了相当大的篇幅来讲述各种高级和复杂图表的的制作过程。并且根据底层原理的异同,姜斌老师大体给高级图表做了分类,包括点线类、甘特条形图类、条形图类、地理地图类、圆形类,我们日常所见的抖动图、凹凸图、蜂窝图、跑马灯图等等都能找到各自的类属。如果都能从零到1将书中的图表复刻出来,那基本上常用的Tableau高级图表就掌握七七八八,更复杂更困难的图表所使用的技巧很多都源于此。
4、Tableau可视化不止于静态图表的制作,更在于图表联动和交互,也就是BI看板设计。我以为,BI看板更考验的是设计和审美功底,这并不是一个数据分析人员特别需要关注的,专业设计师更擅长。但考虑到Tableau不同的应用场景,比如演示汇报、数据新闻、信息图,掌握基本的交互和BI设计也是一个数据分析师必要能力。姜斌老师在这本书并没有着墨于BI设计,但诠释了图表交互上十分重要的筛选器、集动作、参数动作、数据桶、下钻、动态度量值等重要知识。考虑到成书时间,如果再学习tableau后续更新的动态区间可见性功能,那么Tableau可视化更灵活。
5、考虑到中国式报表特殊偏好,姜斌老师也提供了交叉表优化的一些技巧。而前不久Tableau官方在可视化拓展市场更新了Tableau Table拓展,这也说明数据分析人员对于交叉表使用和优化的强烈需求,以后制作交叉表更为便利。


正如我以往文章中多次提及的那样,数据分析师不必过分追求高级复杂图表。图要服务于业务,不可本末倒置,基本的三图一表(柱形图/条形图、折线图、散点图、交叉表)和“智能显示”区域的图表基本能满足日常场景。如果有闲暇时间或者想锻炼Tableau功力,完全可以去复刻Tableau社区内的各种炫酷图表,但平日里还是内容要重于形式,分析和思考的的过程重于分析的展现。
此外,在学习Tableau可视化的过程中,我有两个建议供参考。第一,有兴趣的朋友可以去翻翻R语言大神Hadley Wickham的ggplot2 图形语法的材料,他改进的ggplot2绘图系统是可视化领域相当流行和可行的模式,这也是我过去一年学习R语言比较大的收获之一。以这种图形语法去学习可视化,知识的掌握会简单的多深入的多。第二,在绘图前首先要做到“心中有表”,要明确绘图需要哪些基础字段、每个字段是什么数据类型、不存在的字段如何经过计算构造出来,最后是字段与可视化元素之间如何映射。姜斌老师这本书在拆解和剖析高级图表制作时,使用了图表背后的交叉表来验证结果,就是这个道理。
最后,以图书的形式讲述可视化毕竟不是很直观,虽然书中制作过程提供了基本步骤,但还是不如视频的展现形式显而易见,而且本书中省略了一些文字可能让读者困惑。有兴趣的朋友可以实际操练,或者去B站、油管上检索相关视频学习。