基于百度热力图数据的

中山市中心城区空间结构分析

大家好,我叫梁家俊,是来自中山市规划设计院的“规划师新丁”。经过一年多的规划工作,真切地感受到了如今传统规划所面临的困境。“大数据”如同黑暗中众多亮光中最亮的一束,越来越受到规划界的重视。个人认为城市数据的引入对于规划学科与行业来说,是一种从“定性”到“定量”的跨越。借助全方位、高维度的数据采集以及后期的数据分析,城市问题可以被量化成具体的数据,也许可以让规划向“科学”迈进重要一步。

十月的普通一天,我加入了城市数据研习社。通俗易懂的课程让我这个数据小白迅速掌握了数据与GIS的基础知识,并在小智老师和大鹏老师的指导下,顺利地完成了工作营的作业。

一、百度热力图是什么?

百度热力图是百度在2011年新推出的一款大数据可视化产品。该产品是基于智能手机使用者访问百度产品 ( 如搜索、地图、天气和音乐等 ) 时所携带的位置信息,按照位置聚类,计算各个地区内聚类的人群密度和人流速度。计算结果用不同的颜色和亮度反映人流量的空间差异。

百度热力图可以反映一个时间点的人口集聚情况,也可以反映连续时间段的人口集聚程度变化和不同区域间的人口集聚程度变化,有很大的研究价值。热力图反映的是一个相对的人口集聚情况,不能反映真实的人口数量。

二、研究目的

基于百度热力图独有可以提取实时人口数据的特征,以中山市主城区为研究对象,通过中山市主城区不同时间和不同区域的人口热度变化,发现人口分布的规律。接着根据人在不不同时间点的空间位置规律来识别来识别城市商务办公中心、休闲娱乐中心、复合功能区等城市功能区。(比如人往往在工作日早上9-11点位于办公区域;在周末下午3-5点位于休闲娱乐区域;在晚上10点位于居住区域等)

三、研究对象与研究时间

研究对象:中山市中心城区,包括五区一镇以及五桂山镇一部分;

研究时间:选择工作日和周末两个时间段进行研究。每日的研究时间从早7点到晚23点。

四、研究思路

本次研究主要分为五步:

第一步:数据采集与数据清理,为后序研究做好准备;

第二步:研究工作日早7:00至晚23:00点中山市中心城区连续时间段的人口热度值变化,发现工作日什么时候人口热度比较大,什么区域人口热度比较大;

第三步:研究周末早7:00至晚23:00点中山市中心城区连续时间段的人口热度值变化,,发现周末什么时候人口热度比较大,什么区域人口热度比较大;

第四步:引入热度平均值和热度标准差两个指标,其中热度平均值来分析城市整体人口热度分布情况;热度标准差来分析不同时间段的人口热度变化程度,表征城市的功能复合程度。

第五步:根据工作日和周末人的生活工作习惯以及随之带来的空间位置的变化来分布识别城市商务办公中心、城市休闲娱乐中心、城市居住中心和功能混合最好的区域。

五、数据处理

本次研究采用的数据包括:①研习社提供的12月24日与12月26日两天共68张中心城区热力图(从7点到23点以半小时为频率);②从LSV软件下载的影像图数据(WGS1984坐标系);③与百度热力图同时下载的百度地图

首先,将带有WGS1984坐标系信息的中山市影像图以UTM49度带为投影基准进行栅格投影;而后将百度地图与影像图已经空间矫正;接着采用百度地图纠偏时保存的坐标信息文件将所有热力图进行矫正,此时热力图PNG数据已经带有正确的投影坐标信息。随后裁切中心城区范围以及提取其第四波段,得到本次研究所需的34张热力图PNG文件。

WEEKDAYS 工作日(以周一为例)不同时刻的热力图数据

WEEKDAYS 周末(以周六为例)不同时刻的热力图数据

六、工作日中山市不同时间点人口热度分析

(1)热力规律:

热力高峰出现在8点、11点、21—23点;热力低谷出现在下午16点。

由于百度热力图数据是基于百度系APP使用者的空间分布得来的,因此每个时间段热度值的高低只与使用百度系APP的人数多少有关。基于此设定,再加上个人平时观察到的人使用手机的习惯,来推测热度值变化的场景(此推测基于个人平日观察与猜想,与实际情况可能有出入,特此说明)。

(2)场景推测

a. 在工作日,公司往往早上9点开始上班。7点时大家一般还在睡觉,人口热度很低。8点多大家在上班出行的路上。上班的出行方式主要为小汽车和公共交通,其中中山的公共交通主要为公交汽车。在公共汽车上乘客有大量的时间看手机,使用百度系APP的人数相应增多;另外开车一族虽然不方便操作手机,但是有很大的可能使用百度地图进行导航。综合来看,容易出现人口热度高峰。

b. 早上9点到下午16点是大家上班时间,大部分使用电脑办公,使用手机APP的人数下降,相应的人口热度值下降。其中,中午11点出现一个小的热力高峰,应该是大家准备外出吃午饭,使用手机的机会上升;下午16点出现热力低谷,猜测大家可能是想着马上就要下班,要在下班前把事情做完,工作专注度比较高,使用手机的可能性下降;

c. 下午17点为下班高峰。在回家的路上,乘客使用手机的人数增多,人口热力相应增加;但是值并不是特别高,可能是因为大家的下班时间比较分散,存在加班现象;

d. 晚上18点到21点,有的人在加班工作,有的人在休闲娱乐,使用手机的人数综合看比较正常;

e. 晚上21点、22点和23点,大家躺在床上睡觉之前习惯性的玩手机,再次出现热力高峰。

七、工作日中山市不同区域人口热力分析

将热力图数据重分类为七类,类别越大,该区域集聚程度越高(图面表现为颜色越深)。本次研究将4、5类定义为次热力区,6、7类定义为高热力区。

a. 7点-9点是起床和上班时间,高热区仅有兼具员工住宿功能的火炬区科技园一处;次热区主要为利和广场周边居住区、电子科技大学宿舍区与顺景花园片区。可看出此时间段市民以居住区集聚为主。

b. 10点-12点与15-18点是工作时间,高热区有利和-京华片区、电子科技大学-溢彩荟片区、大信新都汇片区以及人民医院;次热区主要为火炬科技园片区、盛景尚峰片区、富业广场片区以及火炬科技园片区,此时间段以工作与医疗区域集聚为主。

c. 13点-14点是午休时间,热区有利和-京华片区、电子科技大学片区以及人民医院片区;次热区主要为张家边片区、兴中广场至旧城区片区以及盛景尚峰片区。可看出此时市民往往向周边休闲区域进行餐饮活动,并且在上班前回到工作区域。

d. 19点-23点是晚饭及休息时间。高热区有电子科技大学片区、广东理工学院片区与利和-京华片区;次热区主要为西区富华道片区、张家边片区与火炬逸景花园片区。集聚主要体现在居住片区,可看出工作日市民晚上娱乐活动不频繁,基本以回家休息结束一天的辛勤工作。

八、周末中山市不同时间点人口热力分析

(1)热力规律

在周末,中心城区热力度高峰出现在:13点、17—19点、22点。市民出行较为分散,午后逐渐聚集成高峰。

(2)场景推测

a. 一周的工作过后,周末早上市民往往睡懒觉,起床后的早上也以家里活动为主,手机用户比较少,相应的人口热度比较低;

b. 到了中午13点钟,市民开始出门吃饭,或是吃完饭出门。交通出行开始发生,使用手机的频率上升,相应的形成人口热力小高峰;

c. 下午14到16点,市民或是在家中休息,或是在外休闲娱乐,使用手机的频率不高,热力值相应下降。但这个时间段的热力值比上午热力值高,说明市民在下午的活跃度更高一些;

d. 晚上17到19点,市民出门准备吃晚饭,迎来新一轮交通出行,使用手机的频率上升,并形成了人口热度最高峰;

e. 20到21点市民回到家中休息或是在外休闲娱乐,使用手机的频率下降,热力值相应下降

f. 晚上22点大家躺在床上睡觉之前习惯性的玩手机,再次出现热力高峰。

九、周末中山市不同区域人口热力分析

与工作日相同,将热力图数据重分类为七类。类别越大,该区域集聚程度越高(图面表现为颜色越深)。本次研究将4、5类定义为次热力区,6、7类定义为高热力区。

a. 7点-10点的周末,高热区为广东理工大学职业学院、电子科技大学片区与张家边片区,次热区为中山路居住区片、火炬科技园以及博爱与悦来南路交界的居住区。可看出大部分市民都充分享受周末难得的懒觉时间。

b. 11点-14点,高热区为电子科技大学-溢彩荟片区、利和-京华片区与大信新都汇片区;次热区主要为兴中广场至富业广场连片、君汇湾附近商业区域以及顺景花园片区。可看出此时大部分市民开始进行出行休闲。

c. 15点-18点,从热力图中,可看出此时热力分布最为旺盛,市民到了下午时间纷纷出门。高次热区与上午大致相同,不过热度范围则大为增加。

d. 19点-20点与21-23点是周末的晚饭以及夜生活时间。高热区有利和-京华片区、兴中广场片区、电子科技大学片区与大信新都汇片区;次热区主要为张家边片区、西区富华道片区与峰华28片区。相比于工作日的晚上与周末的白天,峰华28、富华道片区等具有夜间休闲活动的区域热度也有所提高。

十、引入两个评价指标:热力平均值与热力标准差

为了后面的城市功能评价,引入两个新的评价指标:热力平均值与热力标准差。

热力平均值表征一个区域整体的热度水平。平均值越高,说明区域的整体热度越大,分布的人口越多,反之则人口越少。比如城市中心区往往热力平均值较高,郊区热力平均值较低。

热力标准差表征一个区域不同时段的人口热度变化程度。标准差越低,表明区域不同时间的人口热度变化越小,人口热度变化越平缓。反之表明区域不同时间的人口热度变化越剧烈。热力标准差是评价区域功能复合的重要标准,城市单一功能区如城市商务中心、城市休闲中心往往工作时间段人口聚集,但到了晚上人去楼空,人口热度变化较大,标准差相应较大;城市混合功能区城市功能混合,工作时间和休息时间均有人口分布,人口热度变化较小,标准差相应较小。

十一、基于热力平均值和热力标准差的中山市城市功能评价:

综合周末与工作日两天样本数据,利用热力平均值因子,可识别出平均高的区域为城市热力核心区;利用热力标准差因子,可识别出标准差高的区域为城市单一功能区;标准差低的区域为城市复合功能区。

经过识别后,可得出以下结果:

(1)城市热力核心区为京华-利和片区、电子科技大学片区、大信新都汇片区、火炬区科技园片区 、张家边片区、沙边市场、假日广场区域、富业广场区域、中山市汽车总站片区。

(2)城市混合功能区为电子科技大学片区、大信新都汇片区、火炬区科技园片区 、张家边片区4个区域。这4个区域为目前中山市居住、休闲、工作多功能混合最为成熟的区域。

(3)城市单一功能区为利和-京华片区、天悦城片区、兴中广场片区、中医院、大信海岸家园、大信芊翠家园、假日广场片区、人民医院、映翠豪庭、博爱医院、大东裕办公区、盛景尚峰、奕翠园、远洋广场、白沙湾市场片区、凯茵新城、沙边市场片区、太阳城广场、火炬城东汽车站。

十二、中山市中心城区城市功能区详细识别:

结合特定时段的热力值与标准差值,可识别出更为详细的城市功能区。

(1)单一功能区的详细识别

a. 城市商务办公区识别:工作日10点和15点的人口热度值最高同时全天高标准差的区域

经过识别,其中特征最为明显的有五片区域,分别是利和-京华片区、大信新都汇、大东裕办公区、盛景尚峰、火炬区科技园。除火炬区科技园外,其余均为传统的写字楼商务办公区。这几个办公区域在中心城区已初步形成规模。

b. 城市居住区识别:工作日和周末早上7点和晚上22点的人口热度值高同时全天高标准差的区域。

经过识别,其中特征最为明显的有东区奕翠园、恒大绿洲区域、时代云图、大信海岸家园、白沙湾市场区域以及沙边市场区域。其中,奕翠园、恒大绿洲、时代云图、大信海岸家园均为商品房类的居住小区;而白沙湾及沙边市场区域则以旧型公寓以及旅馆招待所为主。

c. 城市休闲区识别:周末15点和晚上20点的人口分布热度高及高标准差的区域。

经过识别,其中特征最为明显的有利和-京华片区、大信新都汇、兴中广场片区、天悦城广场、远洋广场、富业广场、太阳城广场。利和-京华片区、大信新都汇、富业广场、兴中广场均为传统商圈区域,区位优势明显。而近年新建成的天悦城、太阳城广场、远洋广场等新商圈虽初具规模,但综合热度较传统商圈还是略微逊色。

(2)复合功能区的详细识别

主要为工作日和周末日平均热力值高及标准差较低的区域。与十一小节相同,经过识别,其中特征最为明显的有电子科技大学-溢彩荟片区、大信新都汇片区、火炬区科技园片区、张家边片区。其中,大信新都汇片区与张家边片区周边都为传统居住区,目前已形成成熟的城市功能复合区;而电子科技大学为学校带动区域发展的典型区域,目前已逐渐成为良好的复合功能区;火炬区科技园则是园区带动区域发展的类型,虽然已处于近郊地带,但周边功能配套齐全,形成小有规模的复合功能区。

十三、工作营总结

首先,感谢小智老师悉心的课后辅导,大鹏老师和颖子老师的深入浅出的课程以及晓生和冯臻两个小伙伴能平时和我一起研究,让我这个数据小白这次做了一份让自己比较满意的作业。

由于研究时间所限,这次研究还有一些不严谨的地方。比如,每天的热力情况虽然近似但却不尽不同,工作日和周末只选取一天的样本显得太少,特别是周末的样本恰逢圣诞佳节,对研究结果也肯定有所影响;人口聚集程度仅仅是城市研究的一个因子,本次研究也只能从人口的聚集程度上对城市的功能进行识别和评价,未免不够全面。相信结合其他路况、城市poi等其他因子会让结果更为令人信服等等。

不过通过这次作业,加深了我对城市动态数据的了解,也加快了我掌握arcgis分析的脚步,收获和进步还是很大的。希望以后能继续努力,成为一名真正的数据达人。


作品成果:

热力图原始文本数据处理_梁家俊:基于百度热力图数据的中山市中心城区空间结构分析...相关推荐

  1. 热力图原始文本数据处理_观点丨基于百度热力图的街道活力时空分布特征分析——以江西省南昌市历史城区为例...

    摘自: 闵忠荣,丁帆.基于百度热力图的街道活力时空分布特征分析--以江西省南昌市历史城区为例[J].城市发展研究,2020,27(02):31-36. 如需查看全文,请点击文末"阅读原文&q ...

  2. python文本数据处理_从 App 描述介绍文字中发掘 Python 文本数据预处理实例

    本文为 AI 研习社编译的技术博客,原标题 What App Descriptions Tell Us: Text Data Preprocessing in Python,作者为 Finn Qiao ...

  3. es查询大文本效率_【搜索引擎】 4-ES在大数据量下提高查询效率方案

    在一些公司里,很多数据都喜欢丢到 ES 里,甚至有的人把其充当数据库的使用,这样是很危险的.很可能过个半年一年ES数据量就很大了,然后当时的申请的ES机器配置不高,查询速度变慢.所以,一开始架构评审应 ...

  4. [MODIS数据处理#9]例四:基于MCD12Q2数据集初步分析中国植被物候空间分布特征

    文章目录 一.MCD12Q2介绍 二.问题描述 三.预处理 1.提取子数据集 2.波段提取 3.拼接 4.栅格投影 5.裁剪 四.获取生长季长度 五.获取生长季始.末所在日期 系列文章目录: MODI ...

  5. excel图片地址直接显示图_图片转表格基于百度AI

    失踪日久,皆因进来学业繁重,其实就是没好好学习.偶遇一有趣需求,方才始更一篇.     需求如下:图片内表格,需直接将图片转换为excel表格. 初步构想,迅捷在线转换,奈何没找到直接转换,图片转pd ...

  6. 层 数据仓库_小尝试:基于指标体系的数据仓库搭建和数据可视化

    关于作者:小姬,某知名互联网公司产品专家,对数据采集.生产.加工有所了解,期望多和大家交流数据知识,以数据作为提出好问题的基础,挖掘商业价值. 0x00 前言 我将整理文章分享数据工作中的经验,因为业 ...

  7. 姜思达和机器人_中国偏见地图曝光:百度大数据看穿了一切

    近日,由百度搜索出品的<枇杷来了>汇集<奇葩说>人气选手马薇薇.肖骁.姜思达获得众多网友的关注.节目现场,三人对话百度人工智能小度机器人(简称:小度),并解读由百度搜索.百度大 ...

  8. 实时热力图_呈贡哪里人气最旺?百度热力图告诉你,原来人都聚集在这些地方!...

    那么,你了解呈贡有多少人口吗? 按照呈贡区人民政府网站关于呈贡区基本情况的介绍,呈贡总辖区面积为461平方公里,下辖龙城.斗南.吴家营.雨花.洛龙.乌龙.马金铺.大渔.洛羊和七甸10个街道.其中,马金 ...

  9. 张家俊:关于ChatGPT八个技术问题的猜想

    文 | 张家俊@知乎 看到ChatGPT的华丽诞生,心情很复杂,既高兴.惊喜,也感到恐慌,高兴和惊喜的是没有预料到这么快就见证了自然语言处理(NLP)技术的重大突破,体验到通用技术的无限魅力.恐慌的是 ...

最新文章

  1. numa节点_漫步云端NUMA调度
  2. Android进阶(六)Binder机制
  3. 如何正确选择仓储物流供应商?
  4. Android public class MyApplication extends MultiDexApplication使用
  5. matlab出错及解决办法,Linux下使用Matlab符号函数出错的解决办法
  6. Kernel Crash kdump 使用指南
  7. git的历史版本拉分支、回撤revert、回退reset
  8. 从零开始搭建webpack+react开发环境
  9. Spring Boot中级篇-集成Swagger2分组文档
  10. 网易云短信接口(验证码类短信||通知类短信)
  11. python实现将点云的.bin格式文件转化为.txt格式
  12. 幼儿-综合素质【8】
  13. [常用办公软件] wps怎么自动生成目录?wps自动生成目录的设置教程
  14. 游戏开发中防外挂的那些事儿
  15. java blockingqueue_Java BlockingQueue take()用法及代码示例
  16. spread运算符_JavaScript中的Spread运算符有什么用?
  17. maven 配置 (个人记录向)
  18. 美网站评10大经典愚人节办公室恶作剧
  19. c++的几个刷题网站(不只有c++)
  20. Rails的静态资源管理(三)—— 开发环境的Asset Pipelin

热门文章

  1. openwrt 实用插件地址
  2. 数据分析--数据清洗详解流程
  3. oracle锁模式详解,oracle 锁讲解之一
  4. Day 8 - Candle | RIPS 2017 PHP代码安全审计挑战(RIPSTECH PRESENTS PHP SECURITY CALENDAR)/ Writeup
  5. 四套上市公司家族、股权关联数据助力公司金融深度研究
  6. 【嵌入式08】基于IIC和SPI协议的温湿度采集与OLED显示
  7. 程序员顺便了解了解养生
  8. BBB学习(十):操作BBB I2C接口
  9. oracle 游标while循环嵌套,oracle游标循环的嵌套
  10. HTML 五十五 视频