时空大数据至少带有三个信息:用户id,时间,空间

一、由GPS生成OD

1、读取数据

importpandas as pd#读取数据

data = pd.read_csv(r'data-sample/TaxiData-Sample',header =None)#给数据命名列

data.columns = ['VehicleNum', 'Stime', 'Lng', 'Lat', 'OpenStatus', 'Speed']

① pd.read_csv()

路径名字符串前要加r。

header=None表示原始文件没有列索引,自动加上列索引0,1,2...。

header=0表示第0行作为列索引。

可以通过name属性指定新的索引名字,如names=range(2,4)。

② data.columns

data.index返回一个index类型的行索引列表

data.columns返回一个index类型的列索引列表

#显示数据的前5行

data.head(5)

VehicleNum —— 车牌

Stime —— 时间

Lng —— 经度

Lat —— 纬度

OpenStatus —— 是否有乘客(0没乘客,1有乘客)

Speed —— 速度

type(data)

type(data['Lng'])

type(data[['Lng']])

当我们读一个数据的时候,我们读进来的就是DataFrame格式的数据表,而一个DataFrame中的每一列,则为一个Series也就是说,DataFrame由多个Series组成。

如果我们想取DataFrame的某一列,想得到的是Series:data[列名]

如果我们想取DataFrame的某一列或者某几列,想得到的是DataFrame:data2[[列名,列名]]

2、筛选数据

在筛选数据的时候,我们一般用data[条件]的格式,其中的条件,是对data每一行数据的true和false布尔变量的Series

data['VehicleNum'] == 22271

得到一个Series,可以作为筛选条件。

data[data['VehicleNum'] == 22271]

想要去掉所筛选的数据,有两种方法

data[data['VehicleNum'] != 22271]

data[-(data['VehicleNum'] == 22271)]

data[-(条件)]

data2 = data[(data['VehicleNum']==22271)|(data['VehicleNum']==23873)]

data2

data2['Speed2'] = data2['Speed']*2data2.loc[4] #取某一行,以index来取

data2.iloc[1000] #以绝对位置来取(就是从上往下数第1000行)

iloc是按照行数取值,而loc按着index名取值

data2.drop(['Speed2'],axis=1) #删除Speed2列

在获取某行某列的数据时,记得一定要用iloc(按表目前排列的顺序取),不能用loc(按index取)

因为很多时候我们做完筛选、排序等操作,表就不是按index来排列,用loc取行就会取错行,或者直接报错(没有这个index)

#获取Stime列的第4行数据

data['Stime'].iloc[3]

3、出租车OD提取

python大数据使用教程_python时空大数据相关推荐

  1. TransBigData:一款基于 Python 的超酷炫交通时空大数据工具包

    今天分享一次Python交通数据分析与可视化的实战!其中主要是使用TransBigData库快速高效地处理.分析.挖掘出租车GPS数据. 所介绍的相关技术开发了Python开源库TransBigDat ...

  2. 时空大数据可视化表达分析,看MapGIS七大“超能力”

    文章转载自微信公众号中地数码MapGIS,版权归原作者及刊载媒体所有. 伴随着人们探索空间的过程,信息的获取范围也从局部地面.全球地表.地球各个圈层扩展到地球内外的整个空间,从原有的二维平面空间基准逐 ...

  3. 时空大数据解决方案-最新全套文件

    时空大数据解决方案-最新全套文件 一.建设背景 二.思路架构 三.建设方案 四.获取 - 时空大数据全套最新解决方案合集 一.建设背景 时空大数据是同时具有时间信息标签.地理位置标签的一种数据,是时间 ...

  4. 时空大数据与智慧城市

    时空大数据是什么 时空大数据是指通过采集.记录和处理不同时间.不同空间下的海量数据,从中得出有关时间.地点和活动的有价值信息和知识. 这些数据一般来自于交通.气象.人口.地理.经济.社会等多个领域,包 ...

  5. 基于百度时空大数据的城市计算(讲座精华笔记)

    基于百度时空大数据的城市计算(讲座精华笔记) THU数据派 2017-05-27 23:24 [导读]本文整理自2017年5月24日,百度自动驾驶事业部创始团队成员.高级技术顾问秦伟俊博士在清华大数据 ...

  6. 山东省地理信息时空大数据中心建设方法

    山东省地理信息时空大数据中心建设方法 刘现印 山东省国土测绘院,山东 济南 250013 摘要:大数据时代对地理信息数据管理.应用和服务提出了新的要求.分析了我国地理信息数据管理及应用存在的问题,以山 ...

  7. 交通时空大数据如何分析,我写了本书!

    Datawhale干货 余庆:同济大学博士,Datawhale读者 大数据时代到来,随着智能设备与物联网技术的普及,人在社会生产活动中会产生大量的数据.在我们的日常活动中,手机会记录下我们到访过的地点 ...

  8. 时空大数据赋能智慧城市的思考和实践

    来源: 超图集团 时空大数据和新型智慧城市是当下地信产业的两大热词,这两者的奇妙关联将擦出怎样精彩的火花?时空大数据如何赋能城市智能与城市智慧,让智慧城市建设迈上新的高度? 2月6日至7日,由中国地理 ...

  9. 中科创星投资云游九州,布局时空大数据

    时间和空间是几乎所有数据的共同特征,时空维度的大数据分析对商业服务.智慧城市.环境保护.现代农业和公共安全等众多领域均有重要意义. 近日,专注于"硬科技"领域的投资平台中科创星,向 ...

最新文章

  1. python合并多个excel为一个_Python合并多个Excel数据
  2. s4800扫描电镜的CSS3_日立S4800扫描电镜中文使用手册
  3. centos 7 防火墙和端口配置
  4. Android系统性能优化(64)---build.设置
  5. Codeforces Round #301 (Div. 2) B. School Marks 构造/贪心
  6. NeHe_Lesson8 Blending
  7. 以太坊虚拟机 EVM(3)交易流(FISCO BCOS为例)
  8. 容器技术Docker K8s 37 Serverless Kubernetes(ASK)详解-Serverless容器进化
  9. java的代码大全_java代码大全
  10. 自动驾驶轨迹预测算法:NeurIPS挑战赛冠军方案
  11. 使用unity制作游戏——打砖块
  12. python怎么判断质数和合数_如何快速判断是质数还是合数 - 草稿
  13. 【数据压缩】使用Audacity软件分析浊音、清音爆破音的时域及频域特性。
  14. Android 上唯一好用的图片标注 App:马克标注
  15. 从程序中学习UKF-SLAM(一)
  16. 关于世界杯的一篇文章-ChatGPT
  17. Solana中的跨合约调用 及 Program Derived Addresses
  18. 城市C友会【官方牵头更多的线下交流的机会,你有怎样的期待?】
  19. maple 解代数方程组得多项式_Maple与数学实验
  20. 爱江山更爱美人服务器维修,微信爱江山更爱美人修改版-微信爱江山更爱美人VIP满级修改版预约 v1.0.0-友情手机站...

热门文章

  1. Unity编辑视图中相机没了?你可能不小心碰到了它
  2. 如何一键重装Win11系统 一键重装系统方法
  3. 公网SSH远程树莓派【内网穿透】 2-2
  4. java俄罗斯方块实训心得_俄罗斯方块心得体会
  5. 基于socket实现虚拟手柄使用手机控制电脑游戏(下)-手机端虚拟手柄
  6. Kwp2000协议的应用(程序原理篇)
  7. 使用Python moviepy模块进行视频剪辑源码演示
  8. 关于使用idea在maven项目中出现Error:java: Annotation processing is not supported for module cycles.Pleas的问题解决方法
  9. 独臂博士单手敲代码获奖 30 余项
  10. 不加好友,QQ强制聊天三法