本文的文字及图片来源于网络,仅供学习、交流使用,不具有任何商业用途,版权归原作者所有,如有问题请及时联系我们以作处理

以下文章来源于数据森麟 ,作者Lewis Chou

前言

各个心怀梦想的学子们都迈入了自己理想中的大学。只是当我们站在象牙塔前,再回首凝望高中生活,一路走来,是不是会感慨万千呢。都说高考是普通大众改变命运的最好的阶梯,那么大学就是培养能力,形成品格的试验田,而通向这块田地的之路却并不平坦。尤其是一些高考大省的小伙伴儿们,是经历了怎样的拼搏,才一路拼杀过来的呢。

这里就涉及到了各个省份的招生标准和各省的高校资源情况了,毕竟每个省的高校,在本省的招生数量既多,要求又低(差不多是这样…)。

都说高考其实是相对公平的选拔,那么今天我们就用数据来说话,看看全国的教育资源,高校分布到底是怎样,哪里的小伙伴相对来说,更容易踏入大学的校门呢。

数据获取

这里我选择的是“高考网”作为我数据的来源

http://college.gaokao.com/schlist/p1

网站很简单,也没有任何的反爬机制,直接分析页面,获取并保存数据就可以了
这里直接给出代码,不关心数据获取过程的小伙伴儿可以跳过此部分

import requests
from bs4 import BeautifulSoup
import os
import timedef get_data():for i in range(1, 108):print("正在下载第%s页数据" % i)url = 'http://college.gaokao.com/schlist/p%s' % ires = requests.get(url).textcontent = BeautifulSoup(res, "html.parser")college_list = content.find('div', attrs={'class': 'scores_List'}).find_all('dl')items = map(parse_item, college_list)save_to_csv(items)time.sleep(1)def parse_item(item):college_name = item.find('strong')['title']college_attr = item.find_all('li')college_site = college_attr[0].text[6:]college_title = college_attr[1].text[5:]college_type = college_attr[2].text[5:]college_belong = college_attr[3].text[5:]college_nature = college_attr[4].text[5:]college_website = college_attr[5].text[5:]result = {'college_name': college_name,'college_site': college_site,'college_title': college_title,'college_type': college_type,'college_belong': college_belong,'college_nature': college_nature,'college_website': college_website}return resultdef save_to_csv(data):if not os.path.exists(r'college_data.csv'):with open('college_data.csv', 'a+', encoding='utf-8') as f:f.write('name,site,title,type,belong,nature,website\n')for d in data:try:row = '{},{},{},{},{},{},{}'.format(d['college_name'],d['college_site'],d['college_title'],d['college_type'],d['college_belong'],d['college_nature'],d['college_website'])f.write(row)f.write('\n')except:continueelse:with open('college_data.csv', 'a+', encoding='utf-8') as f:for d in data:try:row = '{},{},{},{},{},{},{}'.format(d['college_name'],d['college_site'],d['college_title'],d['college_type'],d['college_belong'],d['college_nature'],d['college_website'])f.write(row)f.write('\n')except:continueif __name__ == '__main__':get_data()

我们来看下最后拿到的数据

数据还是比较整齐的,下面就进入到数据分析阶段

高校总数量排行

先不考虑高校质量、级别等因素,单单从高校数量方面来看下各个省份的排名情况

排行榜

总体排名

高校数量前十

高校数量后十

能够看到,高校数量靠前的省份为江苏、山东、湖北、广东,这些可都是高考大省,同时高校数量也是非常多的。而更加著名的高考大省河南河北,同样也有着不错的高校数量,看来这些省份虽然考生多,但是要想考上本省的一个大学,还是比较有优势的。
但是对于贵州、内蒙、青海,西藏等地区的考生来说,高考考出省,也许会是个不错的选择哦。

全国高校热力图

我们再通过一张热力图来看看全国大学的分布情况

不出意外,京畿重地、东南沿海及湖广地区、东北工业区、珠江三角洲和巴蜀地区,是大学比较集中的地区,同时也是我国经济比较发达且人口比较密集的区域,几者之间还是有着千丝万缕的联系的。

地区高校数量段位

在这个图表中,山东和江苏是独一档的存在,东南沿海其他城市紧随其后,不过大西北还是需要继续发展啊,基本是在倒数第一和第二挡位。

高校质量排行

前面的高校数量分析,并没有考虑高校的质量,即该省份拥有985,211高校的数量。现在就来分析下从高质量高校层面分析,哪些省份又排名靠前呢

高质量高校数量排行

985高校排行

毫无疑问,北京位居第一,其拥有的985高校是其他地区所不能比拟的。紧随其后的是上海,国际化的金融中心,也需要众多高等院校来衬托。山东也不错,位居第三。而前面榜单上的头名江苏则表现不佳,只拥有两所985院校,看来江苏的高校数量多,但是超级名牌大学却不是很多啊。
那么江苏的小伙伴儿,你们的高考困难吗?

211高校排行

拥有211院校的省份相对来说就比较多了,不过还是北京拥有的最多,谁让人家是帝都呢。上海依然位居次席,地位稳稳的,配得上自己的身价。

985211高校综合

我们再把拥有985和211高校的省份综合起来看

北京,上海,江苏,高质量高校三巨头出现了,就是它们。那么,这些省份的考生们,考名牌大学的困难程度是不是要比其他地区低一些呢,我没经历过,我没发言权,哈哈哈哈。

高质量高校热力分布图

京津和长三角地区优势明显,妥妥的高质量院校聚集地。

各地区高质量高校占比

北京高质量高校占比

北京一个省份,占有率高达19%,绝对的全国教育中心,人才聚集地。

高质量高校三巨头占比

三巨头也不遑多让,高达37%的占比,真真是羡煞其他地区了。

占比前十城市高质量高校占比

这个比例,拿走了绝大部分的教育资源,其他地区,没得玩了。

你所在的省份,有优势吗?

高校类别及属性分布

最后,我们再来看看,各种类型及不同属性的高校分布情况

工科和综合性大学是最多的,这应该是和报考人数以及社会需求息息相关的。

全国的高职专科所占比例接近50%,看来这种定向培养专业人才的高校还是有其生存之道的,当然,占有32%的本科院校,依然是广大学子的首选院校。

分析全国的教育资源,高校分布数据,发现不均衡相关推荐

  1. 【数据分享】2020年我国地级市医疗资源空间分布数据(Shp格式/Excel格式)

    医疗资源的配置情况直接反映了一个城市的发展水平,医疗资源相关数据也是经常使用到的数据! 我们发现学者刘海猛在科学数据银行(ScienceDB)平台上分享了2020年我国341个城市(地区.州.盟)的基 ...

  2. 2021年全国A级景区矢量分布数据(11969条)

    一.景区定义 旅游景区是以旅游及其相关活动为主要功能或主要功能之一的空间或地域.本标准中旅游景区是指具有参观游览.休闲度假.康乐健身等功能,具备相应旅游服务设施并提供相应旅游服务的独立管理区.该管理区 ...

  3. 2019年全国5A级旅游景区点位分布数据

    我国的旅游景区质量等级划分为五级,从高到低依次为AAAAA.AAAA.AAA.AA.A级旅游景区.5A级为中国旅游景区最高等级,代表着中国世界级精品的旅游风景区等级. 截至2019年底,文化和旅游部共 ...

  4. 文保数据-历史文化名城、名街、重点保护单位名单+空间分布数据

    1. 数据来源:全国一体化在线政务平台国家文物局综合行政管理平台公服务栏目 http://gl.ncha.gov.cn/#/public-service 2.时间跨度:至2019年 3.区域范围:全国 ...

  5. 基于Hadoop的高校大数据治理融合系统设计与实现

    本文通过深入分析体验大数据生态圈主流技术,调研分析高校常见信息化系统数据特征,以学生相关数据(如图书数据.一卡通数据.就业数据.医院数据.上网数据)为融合分析研究对象,构建了高校大数据治理融合平台.平 ...

  6. 最新全国高校地图出炉:大数据为你好好缕一缕各个城市的高校分布

    导读:全国2956所高校中,普通高等学校2688所,其中本科院校1265所,占比47.1%:专科院校1423所,占比52.9%. 江苏.广东.山东高校数量最多,分别有167所.154所.146所! 城 ...

  7. 轻松实现全国高校地理位置数据爬取(文末附源码和数据集)

    大家好,我是小一 一个城市的历史底蕴,不光可以从经济.文化和人文景点,还可以从高校的数量可以看出来.所以,今天就来试试如何爬取全国高校的分布数据. 以下文章比较适合初学者,老读者请酌情加速阅读. 今天 ...

  8. 千百年教育资源分布不均的问题,好未来、乂学教育等AI+教育项目能向前推动多少?

    (图片来源于网络) 文 | 易不二 来源 | 智能相对论(ID:aixdlun) 教育资源分布不均已经是我国千百年的教育难题,改革开放以来,我国在政治经济文化等方面都取得了举世瞩目的成就,人均受教育年 ...

  9. 大数据应用项目创新大赛_全国高校大数据应用创新大赛

    2015年国务院发布<促进大数据发展行动纲要>,标志着大数据战略正式上升为国家战略.为配合国家大数据战略,加快产业人才培养,教育部增设了"数据科学与大数据技术"本科专业 ...

最新文章

  1. 使用Spyder生成动态二维码遇到的问题 ImportError 、ValueError 、OSError
  2. Appium进行脚本录制操作模拟器
  3. 全世界最顶级的开发者都在使用什么数据库
  4. [Java基础]反射获取成员变量并使用
  5. LeetCode 647. 回文子串(DP/中心扩展)
  6. AtCoder 杂题训练
  7. jdbc增删改查有哪些步骤_JDBC打造通用增删改方法
  8. 几篇关于 Redis集群方面的知识学习
  9. 斑马打印机-RFID打印机 ZT411R最全攻略,从0上手 通过【JAVA生成ZPL指令+ts24.lib+ip:端口】的方式调用打印,无须安装驱动
  10. freemarker ftl java_FreeMarker学习1(Ftl)
  11. 基于华为eNSP的企业网络规划
  12. [转]《博客园精华集》ASP.NET分册第2论筛选结果文章列表
  13. 合肥Android两天十面总结
  14. 微信小程序 一键下载所有图片和视频
  15. 应用笔记3816 ds 1302 估算涓流充电实时时钟的超级电容备份时间
  16. HML_FwLib_8051使用补充说明
  17. Oulipo---KMP
  18. js日历多选(在表单中显示)
  19. 验证身份证号码是否合法
  20. 考虑线程安全的List集合选择

热门文章

  1. 百度地图 - 自定义ECharts覆盖物
  2. 关于SQL的学习记录(三、数据表)
  3. 02 - OAI(OpenAirInterface)核心网搭建过程 - 研0
  4. Flutter:1个人,100天业余时间,能开发出什么?
  5. 一文彻底了解SSD1306驱动0.96寸OLED
  6. Unity实用小工具或脚本——智能包住任意多个物体的碰撞体
  7. 关于在手机端可以看到加入的百度网盘群,在pc段找不到的原因
  8. FPGA实现AD采集
  9. 二手车交易数据接口调用代码返回示例
  10. 2022年度总结:拒绝无效努力,实现破圈成长。