数据处理方法和工具的紧密耦合也是数据角色演变后的结果,随着它们的成熟,反而加强了让工具定义工作:研究生课程宣传如何通过学习 python 计算笔记本成为一名数据科学家,训练营告诉你要学 D3 软件这样你才可以成为一名数据可视化开发,无数的工作坊帮助你学习 Tableau 软件来成为一名分析师。
但是由 分析师 / 数据科学家 / 产品经理 所做的工作并不是离散的、孤立的数据可视化片刻。在这些领域中用的某一数据处理方法在本质上和在另一领域用到的没有任何不同。恰恰相反:如果将一种方法中使用到的技能和方法结合到另一种方法中,可能会非常有用。
我们看到这些步骤是孤立的,不是因为这是使用它们的最佳方式,而是因为它们目前是处于孤立状态下运行的。
这就是为什么我们应该避开“分析师做的数据可视化与数据科学家做的不一样”的观点。我们看到这些步骤是孤立的,不是因为这是使用它们的最佳方式,而是因为它们目前是处于孤立状态下运行的。这就是便利规则被创建的原因,例如“不要用饼图”或“从不使用彩虹配色方案”或“最大化你的 数据墨水比 【2】”。即使在孤立状态之外的进行数据分析任务时,这些便利规则仍会受到挑战,但这些步骤是将原始数据转化为洞察和行动的过程的一部分。这个过程横跨从早期对数据的完全探索到最后给股东和领导层的汇报。(【2】数据墨水比(Data-Ink-Ratio):图形中的数据墨水量除以图形中的总墨水量,即在展示介质/页面上,用于展示数据所用的“墨水”量与介质/页面上全部“墨水”量之间的比值。其中数据墨水指的是图表中不可删除的核心内容。数据墨水比值越大,即意味着数据可视化图表中的冗余信息越少,不可删除的核心内容越多。)