何为数据素养(Data Literacy)?
数据素养,并非只是简单语词,而是具有丰富层次的复杂概念。

学者曾给出过一个相对正式的定义,称数据素养是“解读、处理、分析和反思数据的能力”。具备数据素养意味着能够理解什么是数据及其特征(来源、类型、格式和数据属性), 数据应用(比如数据分析、商业智能、数据科学、决策支持、人工智能、自动化和分析), 数据技术(比如模式发现、模式识别和预测),和数据通信(例如,数说故事,基于实据的推理、决策支持和可视化)。

回到当下生活,全球疫情尚未平息,大多数人依然不得不困守家中,欲知外界情况,其所接受的信息也只能通过各类媒体。而令人感到困扰的是,所接触的各种相关事件报道和涉及的数字以及统计名词,大多给人以似是而非,似懂非懂的感觉,而且难以着手进行具体的比对和分析。这的确是很麻烦的一个情况,已经造成大众在一定程度上的盲从轻信,或者疑虑不安。

这表明整个社会的数据素养还远远不足,同时也指出具备该素养的重要性远胜于昔,甚至已经有了一定的紧迫性。如果人们不对数据的产生和处理方法有足够了解的话,就不太容易认清和理解何为良好的数据分析内容。比如,关于病毒在不同表面甚至空气中的存活时间,当面对不同的报告时,你如何判断应该相信哪一种说法。而拥有必要的数据素养能够让人们足以辨认可靠信息,而且采信得当。

Kirk Borne,是一名世界级的数据科学家,自2015起任职于 global technology and consulting firm Booz Allen Hamilton。他的工作岗位涉及数据科学家,数据科学研究员和执行顾问,并在跨多个学科的数据科学、机器学习和人工智能领域提供思想领导、指导、培训和咨询活动。此前,他在乔治梅森大学(George Mason University)担任了十二年的天体物理学教授职位,负责研究生和本科生的数据科学项目的教学和研究工作。更在此之前,他花了近20年时间在NASA空间科学项目,支持数据系统的各种活动,包括担任NASA哈勃太空望远镜数据档案项目科学家,以及NASA天文数据中心和空间科学数据操作办公室的签约经理。

Kirk Borne,兼具影响力和实干能力,笔者整理了一下Kirk Borne 近期做过的与数据科学相关的讲座和访谈资料,以领读的形式与大家分享。这一次的主题是为什么数据素养在生活中如此重要,以及如何以此来提升生活品质。

以下引出Kirk Borne的观点文字。

数据素养已成时代热词

近年来,越来越多的人对数据素养愈发重视,在我看来,原因体现在三个层面。

个体层面. 如今社会上已有大量的数据相关的职业机会和工作需求。我的教学经验也表明,大多数学生一旦理解了数据素养的内涵和重要性,就像发现了宝藏一样,因为这里面有的确有无尽的价值可以挖掘和创造。

企业或组织层面. 对于企业或组织来说,大多依然缺乏足够的能力来利用他们已有的庞大数据储备来进行业务洞察、工作创新和价值创造。数据现在已经是其最有价值的资产之一,而且可再生。这意味着相同的数据可以在不同的应用程序和场景中使用和复用,并以此来推动项目前行以及衍生各种可能的价值。

市场的力量. 此外,由于数字化带来的强大便利性,市场力量也会使得那些具备数据驱动能力和拥有数据素养的雇员的企业获益。以此看来,越晚做数字化转型的企业,会在人材获取和创造价值方面,越来越缺乏竞争力。

具备数据素养的基本步骤

第一,要有一个清醒的认识:数据无处不在,几乎任何事物都可以进行数字化转变,也都可产生,使用或是消费数据。这些包括聊天机器人、在线推荐系统、自动驾车、预测建模、预测维护、欺诈检测、索赔处理、社会情绪分析、假新闻检测、面部识别和短信自动补全等。因此,能够清晰意识到有如此多的数据和数据应用程序已经渗透到我们的日常生活中是具备数据素养的开始。

第二,要意识到几乎每一个人和事物,其行为或活动都在产生数据,这些数据为人或组织以及几乎每一个行业,工作场景,和市场提供了与产品,决策和行为相关的参考信息。此处,期待人们可以能够设想自己实质上同时是数据的贡献者和消费者。

第三,人们应该看到,他们必须不断学习,并参与到全世界的数字化变革进程之中。我在教学中,通过将这些“复杂”的事物,比如数据科学、机器学习和人工智能等,类比成人们在日常生活中可以理解的认知行为,像发现有东西来了(侦测目标),认出是什么东西(识别目标),如何应对(决策支持),而进行教导以达到较好的教学效果。

我的听众们通常会惊讶地发现,对他们来说,竟然这么简单,就能入门那些原本看似很难的复杂话题。如果这些步骤都做到了,他们就会有动力去学习更多的内容。如果这暂时还不起作用,我就试着引导他们观看自己感兴趣的和针对性的内容,可以是健康,金融,网上购物,体育,娱乐,娱乐,旅游,科学,等等。例如,当我在乔治梅森大学(George Mason University)教授数据科学研究生课程时,有一个关于地理空间数据库和空间分析的单元。作为教学内容的一部分,我介绍了地理信息系统(GIS)。顺便说下,GIS是一个高度技术性的话题,不可能人人都熟悉,所以我要求学生先完成一项简单的作业:打开一个web浏览器,并搜索“GIS地理空间”+其他他们感兴趣的东西(科学和技术主题的领域内,最好),然后回来报告他们的发现。十多年来,每年都教这门课——每年,我和我的学生们都对我们的发现感到惊讶而趣味满满。

数据素养与社会责任

我曾经在GMU教过一门关于数据伦理学的课程,其实本可以轻松地将这门课重新命名为“数据素养”。在授课中,我摘录了三本书《如何用统计来说谎》( How to Lie with Statistics)、《如何用地图来说谎》(How to Lie with Maps)和《视觉与统计思维》(Visual and Statistical Thinking)。之所以选择这些书,背后的想法是为了说明:人们如何可以有意或无意地成为有偏差数据结果的生产者并受其影响。

我会用图表和统计结果的正反实例,向学生展示他们作为社会一员,应该如何开始思考这些事情。如今,有责任感的人真的需要具备一些数据、统计和信息科学方面的素养,以应对公共话语在数据使用中经常伴随的认知偏差。

100多年前,著名作家h·g·威尔斯(H.G. Wells)就曾说过:“迟早,统计思维将和读写能力一样,成为高效率人士的必要素质。”现在,这一说法将包括数据素养和分析思维在内。我认为在数据伦理学课上,最有趣的练习是第一天的课堂活动。我曾选取过一段20多年前从新闻中听到的一位著名政治家的言论,那位政治家层曾说:“我很震惊,这个国家有一半的学生在标准化考试中成绩低于平均水平。” 我就以此作为课堂话题让学生们来讨论, 于是引出了一系列非常有趣的对话,内容是关于不同类型数据分布中的统计和平均值(平均值、中位数和模式)。可见,这里面的内容牵涉甚广,纷繁复杂,很有必要专门学习一下。

我必须承认,每当一个新学生找我(在我担任本科生导师的数据科学主任时),问我是选我的数据伦理学呢,还是上学校的普通伦理学,我告诉他们,普通伦理学很好,但是在我的课上,我会教大家如何撒谎(幽默的目的!)。果然,他们“上套”了,每次都来我的课! 具体地说,我教学生如何辨认在理论和实践上,各种有意无意的,利用统计数据撒谎的方法。

我这样做有三个原因:
帮助学生认识世界上的统计偏差和谬误。
当他们遇到这些问题时,指导他们如何解决这些问题。
示范如何在自己的数据相关活动中避免类似的问题。

我给学生的这些练习涉及了所谓的统计学素养和数据素养,因为在统计学、数据科学、机器学习和人工智能方面的数据应用中存在着普遍的认知以及物理偏差,我需要我的学生要对此有充分的认识。

数据素养如何影响企业或组织的成功?

数据素养是数据普遍化概念的一个重要组成部分,而这个概念对企业或组织发展至少有五个推动作用:

数据意识——员工对企业或组织使用(或可以使用)的数据的普遍性和类型的意识不断增强,也就是说员工不断意识到组织结构内数据的重要性。

数据相关性——员工开始在实际工作中,感受到数据与自己在业务中的角色之间的具体联系。

数据素养——员工学会读懂、处理,使用、分析和反思日常工作以及生活中的相关数据。可见这是本文的主题。

数据科学——大多数员工通过学习而具备如何从数据挖掘有用信息和进行合理推断

数据能力紧迫性——员工们真切意识到,不能使用和分析数据会严重影响公司业务(也可能影响他们的职业生涯)。

企业发展与数据素养

近年来,许多企业已经认识到数据素养的重要性,并积极进行着相应培训,我看到很多这样的项目正在世界各地如雨后春笋般涌现。遗憾的是,还有更多的企业尚未如此行动,我期待那些还没有加入的人和企业需要尽快看到拥有充足数据素养的雇员所能带来的种种好处。我对此有切身体会:几年前,我被一家小公司(少于100名员工)邀请去做一个为期两天的关于数据科学的培训课程,实际上,当天的内容涵盖了我刚刚描述的数据普遍化的五个方面。让人印象深刻的是,公司老板要求他们的每一个员工都参加这次活动,而不仅仅局限于技术和业务人员。最兴奋的与会者之一竟然是前台接待员,她非常喜欢那次所学到的新东西。可以看到,这些企业主真正理解到了这种数据素养培训机会对他们的员工和他们公司业务的重要性。两年后,他们成功地将公司卖给了一家更大的公司,数据素养功不可没。

提升全民数据素养,社会需要做哪些事?

首先,社会整体需要真正接受和认可数据的价值。我的意思是,数据通常被描述为一些侵入性的、破坏性的或者对普通人来说太复杂的东西,这一点需要数据教学相关的从业人员多多澄清。

其次,需要有更多成功案例,比如用户增长,精细运营,商业分析等,让大众对数据科学的作用具有信心。同时,在教育、新闻、商务交流和日常谈话中都应该提倡正确的数据应用,这样可以大幅度避免人们勿误解或者误用数据科学。

第三,需要讨论企业如何通过数据创造就业、市场、机会和社会新利益,使得产学研一体,发挥合力。

第四,教育系统必须在所有的课程中(当然是在适合年龄的层次上)更有力度地、有意识地、创造性地引入数据科学,统计学,计算科学等内容,因为世界是已经进入数字化进程,不可逆转。

Kirk Borne的总结

我的看法如下:由于现在的数字信息技术加持、智能设备发展、各种商业和个人行为的层出不穷,使得数据已经渗透到我们的日常生活中。通过数据,世界变得可以计算。而数据素养的重点不应该放在数学、算法或工程上。相反,应该放在让大众理解到—数据科学和分析是普遍具有吸引力的,数据读写是可访问的,数据流畅性是可以实现的。显然,数据资产和数据素养的普遍化对所有企业和组织都至关重要,因为只有具备充足数据素养的专业人员组成的团队才有能力处理大量不同的数据源,得知数据能够告诉他们什么,并为任何企业不断提供行业洞见,决策支持和各种物质与非物质的价值。因此,数据素养已不仅仅是一种数学技能——它完全成为一种生活技能。

笔者简评

数据科学这个领域,近年来被媒体炒作得甚嚣尘上,许多人因此而激情满满,很愿意加入到这个行业的从业者队伍中来。但问题是,很多人找不到在这个领域学习和实践的下手处,有的陷于各种技术学习,如Python,R,数学模型等,而不能自拔导致看不到职业方向;有的被一些数据空谈者带错方向,整日忙于作言无实意的数据报告,这也都是数据科学素养缺乏的体现。Kirk Borne提供了一条非常稳健切实的培养路径,那就是从日常生活中的数据问题出发,考虑目的与手段涉及的种种环节,而逐一厘清这其中的数据流向,从而使人站在原点在来规划和把握自己的数据素养成长路径。

后续我会逐步介绍包括他在内的几位有成就的数据科学家重要讲话和教学资料,并加以一定的解读和评注,以保证文意贯通,而作领读之用,文后附上几篇参考文字,以供大家参考,期待可以自内向外地来增益大家在数据科学方面的素养。

参考文字
https://www.sas.com/ko_kr/insights/articles/analytics/data-scientist-data-literacy.html#/
https://www.aitimejournal.com/data-science-interview-with-kirk-borne-principal-data-scientist-booz-allen-hamilton

想获取更多内容,请关注海数据实验室公众号。

本期分享到这里,我们会每天更新内容,咱们下期再见,期待您的再次光临。有什么建议,比如想了解的知识、内容中的问题、想要的资料、下次分享的内容、学习遇到的问题等,请在下方留言。如果喜欢请关注。社群推荐:

更多有关数据分析的精彩内容欢迎加入海数据在线数据分析交流群,有什么想法或者疑问都可在里面提出,与同行零距离交流,共同成长进步,请识别下面二维码加火星小海马微信,邀你进群。

顶级数据科学家谈数据素养相关推荐

  1. 如何区分大数据下的三大利器:数据科学家,数据工程师与数据分析师

    与其他一些相关工程职位一样,数据科学家的影响力与互联网同进同退.数据工程师和数据分析师与数据科学家携手共同完成这幅"大数据时代"巨作.他们共同努力拟定数据平台要求,基础和高级算法, ...

  2. 攀登数据科学家和数据工程师之间的隔墙

    来源 | 数据派 THU 机器学习的教育和研究重点往往集中在数据科学过程的模型构建.训练.测试和优化等方面.要使这些模型投入使用,需要一套工程专长和组织结构,对于其中的标准尚不存在.有一个架构可以指导 ...

  3. 独家 | 攀登数据科学家和数据工程师之间的隔墙

    作者:Byron Allen 翻译:陈丹 校对:吴振东 本文约2400字,建议阅读10分钟 本文为大家介绍了数据科学家和数据工程师之间的鸿沟,并提供了Production ML作为解决方案. 标签:机 ...

  4. 如何解决数据科学家、数据工程师和生产工程师的阻抗失配问题

    构建一个可扩展.可靠和高性能的机器学习(ML)基础架构并不容易.这比用Python构建一个分析模型要花费更多的精力. Uber已经为许多生产中的用例运行了其可扩展和不依赖框架的机器学习平台Michel ...

  5. 数据分析师,BI开发人员,数据科学家和数据工程师的角色

    数据分析师,BI开发人员,数据科学家和数据工程师的角色 本文由Saeed Aghabozorgi和Polong Lin共同撰写后,本人翻译而来,原文在此: https://cognitiveclass ...

  6. 数据科学家、数据工程师、数据分析师的区别有什么

    随着大数据的愈演愈热,相关大数据的职业也成为热门,给人才发展带来带来了很多机会.数据科学家.数据工程师.数据分析师已经成为大数据行业最热门的职位.它们是如何定义的?具体是做什么工作的?需要哪些技能? ...

  7. 如何区分数据科学家,数据工程师与数据分析师

    与其他一些相关工程职位一样,数据科学家的影响力与互联网同进同退.数据工程师和数据分析师与数据科学家携手共同完成这幅"大数据时代"巨作. 三者之间的定义又是如何区分的呢? 数据科学家 ...

  8. 独家 | 11步转行数据科学家 (送给数据员/ MIS / BI分析师)

    来源:Analytics Vidhya 翻译:国相洁 校对:丁楠雅 本文约7100字,建议阅读10+分钟. 本文为从数据分析/数据仓库/商业智能跳转到数据科学家提供了学习路径. 数据科学作为一个专业领 ...

  9. netflix 数据科学家_数据科学和机器学习在Netflix中的应用

    netflix 数据科学家 数据科学 , 机器学习 , 技术 (Data Science, Machine Learning, Technology) Using data science, Netf ...

最新文章

  1. python java web_Python 与 Java 使用 websocket 通信
  2. 日常积累的一些linux和运维的东西 [转]
  3. HDU 2955 Robberies
  4. 广州成立大数据产业协同创新联盟
  5. /root/.bashrc与/etc/profile的异同
  6. GATT之Device information Service
  7. php输出json到表格,PHP中把数据库查询结果输出为json格式
  8. leetcode 242. 有效的字母异位词 思考分析
  9. 肖仰华 | 领域知识图谱落地实践中的问题与对策
  10. bug的一生:如何体现测试专业度?
  11. STL之stack容器
  12. jest java_使用JestClient操作ElasticSearch的简单demo
  13. [Python3 填坑] 008 索引君的朋友 in
  14. MongoDB学习(黑马教程)-4-数据库MongoDB的更新(修改)文档操作
  15. 新能源电动汽车的充电
  16. 国内有名的文化与教育调查研究咨询公司
  17. aabResGuard使用
  18. 小程序列表页tab切换swiper并滚动到上次位置
  19. 服务器怎么查服务端数据
  20. [动态规划] 放置街灯 Uva 10859 - Placing Lampposts

热门文章

  1. 【scipy.sparse中csr.matrix的用法】
  2. 【kong系列八】之HMAC认证hmac-auth插件
  3. 英语中的定义单词(Defining Vocabulary)
  4. 《C++ 开发从入门到精通》——1.5 技术解惑
  5. NDK编译FFmpeg
  6. php 以自动打字程序,【图片】vbs程序 表白小姐姐 自动打字!_vbs吧_百度贴吧...
  7. 【案例分享】使用ActiveReports报表工具,在.NET MVC模式下动态创建报表
  8. 将老人拉出无声的世界,AI是怎么做的?
  9. spring mvc前端页面中文乱码问题解决思路
  10. 基于EasyX 的五子棋小游戏。