【天池大数据竞赛】“数智教育”2019数据可视化竞赛亚军方案总结

  “数智教育”是我第二次参加天池的可视化的竞赛,对于我们来说,比赛最吸引人的地方在于天池的竞赛数据基于真实应用场景,在系统的设计与开发的过程,去解决一些实际应用的问题,是一件“让技术有温度”的事儿。在比赛的过程,我们锻炼了我们数据分析的能力,前端开发能力和可视化方面的知识。答辩的过程,也让我们开阔了视野和思路,受益良多~下面为相关的链接:

  比赛官网链接:官网链接

  答辩PPT链接:答辩PPT

  作品线上链接:作品链接

  代码链接:方案代码

一、赛题背景

  下面引用官网的赛题背景与需求:

  教育中大数据分析目的包括改善学生成绩,服务教务设计,优化学生服务。而学生成绩中有一系列重要的信息往往被我们常规研究所忽视。通过大数据分析和可视化展示,挖掘重要信息,改善学生服务,对于教学改进意义重大。美国教育部门构建“学习分析系统”,旨在向教育工作者提供了解学生到底是在“怎样”学习的更多、更好、更精确信息。利用大数据的学习分析能够向教育工作者提供有用的信息,从而帮助其回答这些不太好回答的现实问题。未来学生的学习行为画像、考试分数、发展潜力方向等所有重要的信息等数据价值将会持续被显现出来,大数据将掀起新的教育革命,比如革新学生的学习、教师的教学、教育政策制定的方式与方法。

  为了更好的优化教学大数据应用场景,比赛通过学校教育数据分析和可视化工作,探索面向学生、校园的数据分析体系,募集优秀数据分析及可视化方案,设计并形成数据分析门户,从而更好服务精细化教学管理工作。

  就参赛的整体经验来说,赛题的主办方非常希望作品能够与他们的学校深入合作,进而帮助他们进行系统的落地。

二、作品分析

  比赛公开效实中学的存量数据,其中包括学生的信息数据(已脱敏)、教师信息数据、学生成绩数据、学生消费数据等,需求是开发一个信息门户,通过可视化的手段来服务学校的教学管理工作。

  首先,比赛的赛题和方向很具体,需求也很明确,并给出较为完善的数据,基于我们对于业务场景的理解,我们的作品亮点主要有二:

  第一,作品需要分层。根据需求,信息门户的使用人群一定有区别,不同的人群所关注的要点也不相同:学校领导层次如校长、年级主任等需要了解学校的整体overview,其并不会关系到学生层次的信息;班主任与授课教师会更加关注自己所带班级的整体水平,与其他班级的差距等;学生个人和学生家长则会更加关心学生个人或所在班级的整体水平。因此,系统进行分层是十分必要的。

  第二,作品需要解决具体的问题。我们所理解的可视化,很大一方面的作用是结合人们的先验知识,辅助使用者进行决策,去解决一些实际的问题。因此我们开发了学生成绩提升模块、贫困生帮扶模块和高考学科七选三模块。

三、其他团队亮点方案

  在参与比赛答辩的过程中,我们也认真倾听了其他队伍的解决方案和亮点,总结如下:

1. 学生关系探索

  如何根据数据探究学生之间的关系呢?CVTEDM团队分析了学生的考勤数据和消费数据,探究了学生的“共现现象”,并且根据共现频率组织了共现网络。通过节点的相似度来评价学生的亲密度。并且对于结果的验证,通过探究学生的是否处于同一班级或同一宿舍来进行验证,结果的准确率达到80%多。

  由于我们在现场也在准备答辩,所有听的不是很仔细,我觉着这部分的确是非常有意思的探索,而且我们也没有想到这个问题。后面答辩视频沉淀下来后再仔细研究学习。总结起来,亮点如下:

  • 通过“共现现象”来映射学生之间的关系
  • 通过共现频率组织共现网络
  • 采用节点的相似度来评价学生的亲密度
  • 对于结果的验证,也比较合理,结合使用者的先验知识,结果可信度较高

  这个部分,我听的不是很细致,后面自己也会仔细的探索一下

2. 天气与考勤关联探索

  根据时间,爬取当地的天气数据,并且探究天气与考勤直接的关系。下面是我的脑洞:

  • 在我们的认知中,天气和学生的考勤,总体应该呈现一定的相关性,但是关联度如何?
  • 既然已经验证了天气与学生考勤之间的关联性,可以分学生群体,比如学生成绩在平均之上的群体,他们的考勤与天气情况的关联性如何?那么成绩较差的群体,他们的关联性如何?可以发现一些有意思的pattern(人的主观能动性和客观环境因素之间的关系?个人比较感兴趣??)

3. 学科与未来大学专业推荐

  有些学生在高中阶段即有比较明确的学科目标和专业规划,但是有的大学专业对学生的高考学科有所限制,他们的团队收集了一些专业的必须的课程,并做出了相关的推荐。

  这个idea也很不错,对于一些学生,对于一些专业有主观上的倾向,那么这个方案就可以解决这个问题。对于没有主观倾向的同学,就可以通过我们的推荐方式得到相关学科的推荐。

4. 弦图表示学科组合

  采用弦图来表示学科的选择组合,其中弦长表示单个学科的选择人数。连接线表示两个学科的选择关系,连接线的粗细表示学科组合的选择的人数。Chord Diagram样例图如下:

  • 可以尝试将学科的推荐指数映射到弦的宽度上去。
  • 弦图具有更加高效的表达,对于学科的选择情况的展示,弦图比我们的作品的展示形式更加直观。数据的可读性更好。

5. 学生作息规律检测

  根据学生的考勤数据,去推测学生的作息规律情况,进而与学生的成绩进行对应。

四、作品缺点

  作品的设计思想与设计流程请参见答辩PPT,我们对于作品本身的定位是一个演示demo,在具体的商业应用方面存在以下一些需要完善的地方:

1. 缺少数据导入

  实际的业务场景中,数据是一直不断更新和迭代的,我们的作品需要提供一个接口,允许用户随时可以输入数据,系统也需要将数据进行归档整理,并进行实际的应用。

2. 系统的可扩展性

  后知后觉,在答辩的过程中,有评委老师就作品的可扩展性提出问题,但是我们在这方面没有什么实践经验,所以回答的不好。比如在实际应用中,如果有一个新的功能部分需要扩展,那么我们的作品在可扩展性方面有没有什么考虑?

  在作品的设计过程中,我们对这个方面的考虑是比较少的,我们对于比赛的理解是设计并开发针对教育方面的可视化系统,可能更偏向于模式的探索与发现,作品更像一个demo,而不是一个可以直接应用的系统。在以后的开发和实践中,也需要多加考虑

3. 预测模型

  答辩过程中,评委有谈及关于学生成绩预测问题,首先对于学生的成绩的预测,我们的作品采用ARIMA时序预测来完成,因为我认为学生的成绩有较强的时间相关性,有的学生成绩在一段时间内,成绩处于上升或下降趋势。相较于采用LightGBM等基于树模型的算法,需要所有学生的成绩数据来进行预测,同时成绩方面没有较多的特征,数据存量也较少,因此可能效果会不好。

  评委也有提到训练数据更新的问题,比如每次的小型考试的成绩也进行记录,那样将会极大的丰富学生的成绩训练集,采用LGB和XGBoost等算法可能将会有更大的应用空间。

五、总结

  我所理解的可视化大致分为两种:大屏可视化和可视化应用。大屏可视化可能会关注组件本身在大屏上的展示效果问题、数据实时更新、三维模块(如GIS、Map等)的设计与渲染等;可视化应用会关注平台本身的作用,如辅助使用者并结合使用者的知识进行决策,数据可视化的本质即为帮助别人更好的理解数据,如何高效的、优雅的为使用者提供数据信息则是这种系统的目标。

  我们在比赛的过程中,立足于应用场景,常常会站在使用者的角度思考,作品能够为别人解决什么问题,如何去高效的解决并得到清晰的结论。在今后的设计或开发中,也希望自己能够多积累技术知识,多思考总结,并多交流(这次通过答辩也可以得到新的很多的灵感),让自己的作品的品质有更大的提升~

【天池大数据竞赛】“数智教育”2019数据可视化竞赛亚军方案总结相关推荐

  1. “数智教育”数据分析——持续更新中

    0.准备工作 0.1 数据来源:"数智教育"数据可视化创新大赛 0.2 使用工具:SQL.Tableau.Python 0.3 文章仅用来展示数据处理和可视化工具熟练度,以供求职实 ...

  2. mysql limt取指定数据条数 top取指定数据条数

    mysql选择指定范围行的记录 limit param1, param2 param1 : 开始搜索的指针 .从0开始计. param2 : 搜索的条数. 例: 前四条记录: SELECT * FRO ...

  3. SREWorks 数智服务尝鲜,你的数据准备好了吗?

    什么是数智服务? SREWorks 是一款基于"数据化.智能化"理念构筑的云原生运维平台:以"数智"思想为内核,围绕应用的交付.监测.管理.控制.运营.服务六部 ...

  4. 传智教育1月12日在深交所成功挂牌上市,教育行业A股IPO第一股今诞生!

    今日(1月12日),国内IT职业培训行业头部企业--江苏传智播客教育科技股份有限公司(以下简称"传智教育"或"公司")正式在深交所中小板挂牌上市,股票简称&qu ...

  5. 科技云报道:重塑增长新动能,“数智融合”捷径该如何走?

    科技云报道原创. 如果说,过去是数字化转型的试验阶段,实施的是开荒动土.选种育苗,那么当前要进行的是精耕细作.植树造林. 数字化转型已进入了由个别行业.个别场景的"点状应用"向各行 ...

  6. 2019数据技术嘉年华主会场,数据英雄荟萃一堂共论道

    第九届数据技术嘉年华在大家的期待中如约而至,来自不同行业.不同领域的专家和技术爱好者欢聚一堂,共赴一场属于数据的盛宴.本次大会以 "开源 • 智能 • 云数据 - 自主驱动发展 创新引领未来 ...

  7. 袋鼠云数智之旅·德清站|受邀出席数字旅游最佳实践高峰论坛,分享数智良渚建设经验

    浙江省旅游业发展"十四五"规划提出了建成"现代化旅游经济强省"的目标,并充分强调数字赋能的重要性.当前,数字化转型升级催生新业态新模式,旅游产业正焕发生机,成为 ...

  8. 数字时代下,企业运营管理的“数智”变革

    在市场竞争与技术发展的双重推动下,企业数字化转型已成大势.与以往不同,此次转型带来的是企业的整体框架升级,渗透到企业的生产.决策.经营等各个环节之中.企业的经营管理可以通过数字化框架,形成一整套高效流 ...

  9. 金电联行程小龙:数智赋能驱动产业数字化转型

    当前,信息化.数字化正在对经济发展产生着深刻的影响,人类社会已经进入了一个前所未有的数字经济时代.对于企业和组织来说,这是挑战,更是机遇.加快数字化转型的脚步,抓住数字经济新业态带来的机遇,已经成为了 ...

  10. 放大器非线性失真研究装置设计报告_大工学子荣获2020全国大学生电子设计竞赛辽宁省最高奖“TI”杯...

    11月10日,2020全国大学生电子设计竞赛辽宁赛区竞赛成绩公布.我校选拔的21支代表队,共获得一等奖8项.二等奖7项.其中,由创新创业学院李胜铭.吴振宇老师指导,来自电信学院苏子粱.宗承澳.陈瑞三名 ...

最新文章

  1. java通过反射,泛型将定义的对象与对象之间互转
  2. 记录这两日悲哀的血泪史,以便后来人能绕行
  3. 2019第十届蓝桥杯比赛总结(B组c/c++)
  4. java 抽象类和接口有什么区别
  5. 基于Vue实现后台系统权限控制
  6. [单反六]查看快门数
  7. java add方法实例_java.util.TreeSet.add()方法实例
  8. Spring中IoC创建对象方式(构造器注入)
  9. mysql修改数据库与级别_数据库MySQL查看和修改事务隔离级别的实例讲解
  10. java 文件流下载pdf
  11. php自动盖章,在线生成实用又方便 (图片印章)
  12. 建筑工程PPP项目财务风险控制探析
  13. HDU 4461 The Power of Xiangqi
  14. dva的用法_dva 的基本用法
  15. 我所偏爱的 C 语言面向对象编程范式
  16. 2021年CFA最新学习资料!
  17. 无人零售货柜并入行业变革版图,带来智能化提升和消费升级
  18. 饲料颗粒机设计(农业机械)
  19. 手把手带你用next搭建一个完善的react服务端渲染项目(集成antd、redux、样式解决方案)
  20. 网络安全从业者必看 注册网络安全等级测评工程师考证解读

热门文章

  1. powerdesigner下载,注释转换和导出word
  2. VTK实现三维地质建模
  3. aspnetpager 详解 (转)
  4. aspnetpager使用介绍
  5. android 的hook技术,Android Native Hook技术(一)
  6. 智能电话机器人--基于 UniMRCP 实现讯飞 TTS MRCP Server
  7. 日志文件的格式和内容,日志文件的作用,登记日志文件的规则
  8. q-flashplus怎么使用_qflash是什么意思
  9. CMMI 知识扫盲篇
  10. 二、 防火墙中使用的核心技术