随着数据大环境(data climate)越来越快地发展,数据可视化的趋势永远在转变和变化。在过去五年、当下或更远的未来,我们处于什么位置?一些重要的事情正在发生……

数据的意义

让我们从如何思考及如何处理数据开始,下面的数据演化流已经清楚地展示了这个流程:

简单地说,从原始数据开始。原始数据是指被感应器、人类或其它任何方式记录下来的数据,它们以其原始的形式(数字、符号或文字)存储下来。第二步,将数据以表、列和电子表格的形式组织起来,那样我们能够开始理解数据。这个步骤一旦开始后,我们可通过提供上下文细节,将处理过的数据转化为信息位,以解释某些数据点的意义,以及它们之间是如何关联的。这之后,数据被定型,一旦我能够感知那些信息、理解它,并且和我之前的记忆与经验相联系在一起后,我就获得了知识。这最终给了我智慧,以让我根据来自原始数据点的那些知识做出未来的决策。

我也认为数据演化流和在如今的数据可视化世界中事物如何发展之间存在松散的相关性。

首先我想分享一些利用数据可视化获得洞察的例子,数据是形成理解的基础,也能够让下次决策变得更加明智。

数据的关联性:1986年挑战者号灾难

我非常清楚地记得第一次看到爱德华·塔夫特出版的《视觉的解释》(Visual Explanation)一书中这篇文章的情形,我永远不会忘记。我多次用这个例子是因为它证明了理解数据、选择正确数据点的重要性。

作为事故调查的一部分,那些负责允许飞船发射的人员给出了以下数据作为证据,表明他们无法预测危险。想到这些火箭工程师被认为是地球上最聪明的人,令人感到吃惊的是他们认为用这种格式展示他们的案例已经足够好了。

作为他们统计证据的一部分,工程师们只在25架可发射的火箭中查看了9架,并且限于一个很小的技术因素范围内。但是最重要的问题是似乎没有人将火箭发射失败与发射当天的气温联系起来。

塔夫特重新设计了图表,专注于准确的相关性。

正如你所见,挑战者号发射时的气温大约为27华氏度,这一温度低于最低的发射温度,刚好是会造成(火箭)受损的最高指数。

图中还清楚地显示,气温越高对火箭损害的越小。现在,你可以说这张图看起来完全不像“火箭科学”,它只是证实了发现最具关联性的数据并不总是那样直截了当的。许多人说,塔夫特的案例忽略了涉及到的数据与物理的大部分复杂性,但是在我眼中这仍是一个重要的教训。

美国海洋学家和制图师马修·莫里所从事的一项早期大数据项目是一个很好的例子。他汇聚了数以万计航海日志中的数据而编制了第一部海洋地图集。

它的重要性在于其帮助船只更快、更安全地到达目的地。如果你能更快地到达,意味着你能够在战争或商业上占取先机。

领英的网络可视化图:承认复杂性

在过去五年左右的时间中,我们看到了诸多可视化利用了这个想法。像这张领英的网络可视化图,描述了社交网络令人惊讶的复杂性。 它只对处理后的数据(数据演变图)进行了可视化,但可以说它并没有将数据转化为有意义的信息。

如果你把数据可视化看做设计世界中的新范式,那种展示数据力量的想法是完全有意义的。全都是关于证明你拥有数据、有权访问它、可以理解它或是说你有能力操纵它。

另一个例子是布伦丹·达文斯为EE完成的作品,该作品展示了人们在城市生活的一天中谈论的内容。这些可视化的有趣性在于承认复杂性。他们几乎把这些当作荣誉勋章而戴上。

一些人说它们比其它东西更有艺术性。它们很漂亮,不要误会我,我认为用无形的数据世界来吸引观看者是绝对至关重要的,以此来获得它们在数据文化演变中应有的地位。然而,我们当然可以说,这样的可视化,实际上很难让我们从中获得知识或洞见。

早期交互式的数据可视化例子也存在着类似的争议。十年前数据可视化的基本原理是一屏显示全部的数据集,然后通过动态的筛选来审视数据,就像本·福瑞的这个例子一样。本·福瑞研究两位被测试者的DNA模式。作为新手来说,很难从这些可视化图中获得任何知识。当然,这类工具的主要受众是内容专家。此外,这一类探索仍然为数据可视化的演变带来了巨大的贡献。

新探索:数据新闻

我们也开始看到数据新闻领域中一些有趣的探索,现在已经算是流行了许多年的一种趋势。这里的方法提供了丰富的数据可视化,但是与此同时为读者提供上下文信息。这是考虑了终端用户,也就是下面案例中的意大利杂志IL的读者。

随着更广泛的受众对数据解释渴望的增加,为非专家用户编辑数据真的有助于他们理解更广泛的内容,从而获取有意义的信息。

越来越多的实体开始以同样的方式展示它们的数据,其中包括Bloomberg的例子。这是一篇交互式的文章,引导用户通过一组特定的数据来了解美国人的死因。使用交互版本更有效的是信息可以排序并以叙述的方式展示。除了上下文信息,可以突出特定数据点为读者创建重点,反过来减少了一些复杂性。

数据可视化和UI/UX设计的交叉点

我认为我们正在见证一个令人兴奋的转折点,那就是使用跨学科的技能去创建更逼真、更直观、更丰富的数据驱动的用户体验。这正是我们在Signal Noise所采用的方法。这绝不是什么新概念,一如既往,伟大的想法得到普遍的认可是需要时间的。我们开始更加习惯数据和数据的展示,至少部分是因为本·施奈德曼的工作,早在90年代他便先驱性地开创了诸多这类想法。

为了理解任何较大的数据集,我们需要考虑人是如何感知信息、以及如何才能使我们更好地处理信息。在非常复杂的数据分析软件Spotfire上的施奈德曼的工作可能是最成功的。他还开发了一套原则,从开始创建概览、然后是缩放、筛选,最终提供所需的细节。先展示数据点的全部图谱,这样你就可以快速地定义极值、边界值和均值的位置。当你有个小错误时,第二步就是对引起了你注意的个别数据点进行更进一步的调查。随着你对所选数据点或内容有了更多的发现,你就能以更大粒度更进一步根据需要审视数据。

接下来的几组例子更是很好地证明了这一点。我认为目前数据新闻正处于数据可视化前沿,特别是来自《纽约时报》的。

这个例子非常适用于施耐德的口头禅。这篇文章用255张图表解释在经济衰退时如何重塑经济。这听起来很可怕,当然,看起来也有大量的数据点。你最先看到的是在同一刻度上所有图表叠加的概览,让你看到所有的异常值、极端值。每个图表显示一个不同行业的工作数量。绿色表示增加,红色为减少。

随着你向下滑动,可视化会展开,图表扩大。因此,你可以单独地看每一个图表。就像在Bloomberg的例子中那样,它们以编辑内容的形式提供额外的上下文信息,拖拽出特定的图表通过数据引导读者。因此滑动整个图表可以看到从全局到缩放、筛选,最后到所需的更多信息。正如施耐德所宣传的那样。

移至财务部分,一个运作得非常好的,当然也给我个人提供了大量灵感的例子便是这个CMC市场的金融交易平台。这个极其丰富和整体化的平台花了几年开发成功,但我认为他们对金融股票数据的可视化和沟通形式几乎都正确。

考虑一下用户类型。从业余人士到专家的任何人都需要能够使用这个平台来做出明智的决定来选择股票和进行交易活动。而这关键是大量定制界面的能力。你可以选择看看单个指数图表,它有时是多个(有时是几千个)股票的展示,为的是理解或预测在该指数图表中的某个股票的走势。同样你可以一次看12张 图表,其中混合着一些情绪信息。这取决于用户想要在任何给定的点上所消耗的信息量。

交互式和直观的界面元素,如滑块、允许用户调整某些参数,理解他们的投资组合也许会被怎样影响到。以新闻形式出现的提示性信息或警告帮助用户更好地理解市场中发生的事。把所有事情组合在一起,你会得到极其丰富的数据体验。我认为这是精准的合并数据可视化和我们看到更多的UI/UX专业知识的方法。我们称之为“数据设计”(Data Design)。

进一步谈到定制,我认为我们将很快看到更多的个性化信息。

相互联系的生活

随着我们的生活有着越来越多的联系,我们会看到更多以自我为中心的数据可视化。想一下智能设备以及它们改进的速度有多快,在它们会认识你并能够反映你的生活这点上会因为数据展示的形式而变得有趣。在先前的例子中,你需要额外的上下文信息去提取含义,对于个人数据来说这不再那么必要。当你看到你手机上的步数,你直接就理解了它与你的动作如何关联。同样,你不再需要像Nest的智能调温器包含着很多上下文信息,因为你在特定的环境中使用它,其中显示的数据是显而易见的。反过来,我们就能够将那些需要配合多个用户类型和用户需求的所有不必要信息去掉。这里的挑战是设计出用户可以识别出属于他们自己的数据,我们称之为“告诉我你认识我”。

这导致我最后的一个例子更具隐喻性。在多数创意行业,一切都在绕圈子,我们常常是在极繁和极简之间轮回。我认为我们现在介于两者之间,开始从那些复杂的可视化转向更简洁、更少的可视化世界。

这是Hammerhead厂家给骑行爱好者设计的导航设备。显然,你在骑车时不想受到手机的干扰。这个设备根据你的设置使用简单的几个LED灯来跟踪你的路径,告诉你前方有转弯。全设备只有一个按钮,当你看到一个坑你便可以按下它。之后其他用户经过此地时,也将会收到一个警示。

许多数据、许多洞见,但是只有极少极少的反馈。这全是关于在对的地点、对的时间给用户传递正确的信息。

这是作为数据设计师将要探索的方向:世界变得越来越复杂,我们将要探索出一条更简单的路径去理解环绕着我们的数据。

原文发布时间为:2017-04-19

本文来自云栖社区合作伙伴“大数据文摘”,了解相关信息可以关注“BigDataDigest”微信公众号

还在把可视化当佐证观点的画图软件?你需要这份进阶攻略相关推荐

  1. Dataset:机器学习和深度学习中对数据集进行高级绘图(数据集可视化,箱线图等)的简介、应用之详细攻略——daidingdaiding

    Dataset:机器学习和深度学习中对数据集进行高级绘图(数据集可视化,箱线图等)的简介.应用之详细攻略--daidingdaiding 目录 箱线图 箱线图 箱线图(box plots):这些图显示 ...

  2. ML之SIFT_FLANN:FLANN算法的简介、使用方法(对图片提取SIFT特征并利用FLANN方法实现计算图像相似度并可视化案例)之详细攻略

    ML之SIFT_FLANN:FLANN算法的简介.使用方法(对图片提取SIFT特征并利用FLANN方法实现计算图像相似度并可视化案例)之详细攻略 目录 FLANN算法 1.flann的搜索步骤 (1) ...

  3. AI之AutoML:Ludwig(无需编写代码/易于使用的界面和可视化自动机器学习工具)的简介、安装、使用方法之详细攻略

    AI之AutoML:Ludwig(无需编写代码/易于使用的界面和可视化自动机器学习工具)的简介.安装.使用方法之详细攻略 目录 Ludwig的简介 Ludwig(无需编写代码/易于使用的界面和可视化自 ...

  4. Graphviz:利用可视化工具Graphviz将dot数据进行图像可视化或者图像保存(两大方法)之详细攻略

    Graphviz:利用可视化工具Graphviz将dot数据进行图像可视化或者图像保存(两大方法)之详细攻略 目录 graph_feature函数:为给定的特征生成特征谱系图

  5. Excel:Excel使用技巧经验总结之(利用Excel自带功能统计各个字段不同类别及其个数并进行图表可视化+非编程实现)图文教程之详细攻略

    Excel:Excel使用技巧经验总结之(利用Excel自带功能统计各个字段不同类别及其个数并进行图表可视化+非编程实现)图文教程之详细攻略 目录 利用Excel自带筛选功能统计各个字段不同类别及其个 ...

  6. DataScience:数据可视化的简介(意义+六大优势)、使用工具之详细攻略

    DataScience:数据可视化的简介(意义+六大优势).使用工具之详细攻略 导读:源于人.机器和互联网本身的数据并不能为管理人员和其他决策者提供有价值的见解,必须整理.规范和进一步解释数据,然后进 ...

  7. Py之matplotlibseaborn :matplotlibseaborn绘图的高级进阶之高级图可视化(基础图(直方图等),箱线图、密度图、小提琴图等)简介、案例应用之详细攻略

    Py之matplotlib&seaborn :matplotlib&seaborn绘图的高级进阶之高级图可视化(基础图(直方图等),箱线图.密度图.小提琴图等)简介.案例应用之详细攻略 ...

  8. Python语言学习之图表可视化:python语言中可视化工具包的简介、安装、使用方法、经典案例之详细攻略

    Python语言学习之图表可视化:python语言中可视化工具包的简介.安装.使用方法.经典案例之详细攻略 目录 python语言中可视化工具包的简介 python语言中可视化工具包的安装 pytho ...

  9. DL之CNN:卷积神经网络算法简介之原理简介(步幅/填充/特征图)、七大层级结构(动态图详解卷积/池化+方块法理解卷积运算)、CNN各层作用及其可视化等之详细攻略

    DL之CNN:卷积神经网络算法简介之原理简介(步幅/填充/特征图).七大层级结构(动态图详解卷积/池化+方块法理解卷积运算).CNN各层作用及其可视化等之详细攻略 目录 CNN 的层级结构及相关概念 ...

最新文章

  1. html点击保持,如何保持:点击元素后的活动CSS样式
  2. 学python入门书-如何学习Python,以及新手如何入门?
  3. python grpc 并发_用Python进行gRPC接口测试(二)
  4. 傅里叶变换和逆傅里叶变换numpy
  5. 关于JAVA中的synchronized,一段不错的解释...
  6. 本周两场直播丨通过源码了解openGauss多线程架构;Oracle数据库索引分裂详解。...
  7. AT1219 歴史の研究 解题报告
  8. Kraft 0.50 发布,小型文档管理程序
  9. 为什么要使用boost::enable_shared_from_thisT
  10. 个税计算公式excel_我月薪1万,为啥个税只交150块捏?
  11. 菏泽学院计算机学院康鸿雁,菏泽学院在山东省大学生软件设计大赛中获佳绩
  12. Android 使用Loader轻松实现仿微信图片加载
  13. Property ‘validationMessageSource‘ threw exception
  14. fatal error C1088
  15. 内网环境下的横向移动总结
  16. VC++实现打开文件和打开所在文件夹的功能(附源码)
  17. 科学论文类型分类(letter,nbsp;p…
  18. 做一名合格的网络管理员
  19. AI人才创新发展联盟(AIHIA)执行委员会一届一次会议胜利闭幕
  20. python爬虫笔记一:爬取豆瓣中指定的明星所有图片

热门文章

  1. CORS请求Request携带Cookie失败占用License解决方案
  2. Springboot+MyBatis-Plus整合Layui实现分页
  3. 国产开源项目的七宗罪
  4. 独立开发变现周刊(第89期):一个 AI 小工具,两个月内赚7.3万美元
  5. Python 中的find()函数
  6. 关于配置远程仓库gitee无法连接配置微服务的问题
  7. java的classpath是什么_Java中的classpath
  8. office使用细节摘记:ppt篇
  9. 与我相亲的剩女竟然是个小三
  10. 网络视频直播系统,搭建直播服务器环境