简介

出租车公司记录了每一次载客交易发生的信息细节,包括上下客时间、经纬度、路程距离、支付方式、支付金额、缴税额等信息。详细的数据,为出租车公司的运营提供了极大的帮助,例如,了解哪些时间段比较热门,对应增加运行车次;哪些地区需求比较广泛,调度更多车辆前往。这些数据,使得乘客的需求得到了及时的响应,而驾驶员的收入也得到了提高,进而整个社会的效率得到了提高。

出租车公司把载客日志保存在阿里云日志服务上,利用日志服务可靠的存储,以及快速统计计算,挖掘日志中有用信息。本文将展示出租车公司如何使用阿里云日志服务来挖掘数据中的信息。

数据样例:

RatecodeID:  1VendorID:  2__source__:  11.164.232.105    __topic__:  dropoff_latitude:  40.743995666503906    dropoff_longitude:  -73.983505249023437extra:  0    fare_amount:  9    improvement_surcharge:  0.3    mta_tax:  0.5    passenger_count:  2    payment_type:  1    pickup_latitude:  40.761466979980469    pickup_longitude:  -73.96246337890625    store_and_fwd_flag:  N    tip_amount:  1.96    tolls_amount:  0    total_amount:  11.76    tpep_dropoff_datetime:  2016-02-14 11:03:13    tpep_dropoff_time:  1455418993    tpep_pickup_datetime:  2016-02-14 10:53:57    tpep_pickup_time:  1455418437    trip_distance:  2.02

查询链接

常见的统计

  1. 分时段乘车人次,查看哪些时段比较热门

    *| select count(1) as deals, sum(passenger_count) as passengers,
    (tpep_pickup_time %(24*3600)/3600+8)%24 as time
    group by (tpep_pickup_time %(24*3600)/3600+8)%24 order by time limit 24

从结果中可以看出,上午上班时间,以及晚上下班后,是乘车需求最旺盛的时候,出租车公司可以相应的调度更多的车辆。
  1. 分时段平均乘车里程

    *| select  avg(trip_distance)  as trip_distance,
    (tpep_pickup_time %(24*3600)/3600+8)%24 as time
    group by  time order by time limit 24

某些时刻,对乘车里程的需求也挺旺盛,出租车公司在对应的时候也需要准备更多的车辆。

  1. 分时段平均乘车分钟数,单位里程需要的秒数,看看哪些时段比较堵

    *| select  avg(tpep_dropoff_time-tpep_pickup_time)/60  as driving_minutes,
    (tpep_pickup_time %(24*3600)/3600+8)%24 as time  group by (tpep_pickup_time %(24*3600)/3600+8)%24 order by time limit 24

    *| select  sum(tpep_dropoff_time-tpep_pickup_time)/sum(trip_distance)  as driving_minutes,
    (tpep_pickup_time %(24*3600)/3600+8)%24 as time
    group by time order by time limit 24


    一些时刻特别堵,需要准备更多车辆来应对需求。

  2. 分时段平均乘车费用,看看哪些时间赚的多

    *| select  avg(total_amount)  as dollars,
    (tpep_pickup_time %(24*3600)/3600+8)%24 as time
    group by time order by time limit 24

    凌晨4点钟的客单价比较高,有经济压力的驾驶员可以选择在这个时候提供服务。

  3. 看看账单范围分布情况

    *| select case when total_amount < 1 then 'bill_0_1'
    when total_amount < 10 then 'bill_1_10' 
  4. total_amount < 30 then 'bill_20_30'
  5. total_amount < 40 then 'bill_30_40'
  6. total_amount < 50 then 'bill_10_50'
  7. total_amount < 100 then 'bill_50_100'
  8. total_amount < 1000 then 'bill_100_1000'
  9. 'bill_1000_' end
    as bill_level , count(1) as count group by
    bill_level
    order by count desc

    
    ![bill_range.png](http://ata2-img.cn-hangzhou.img-pub.aliyun-inc.com/272f5a5a89f580e587355a12175a8a88.png)
    从成交金额的成交区间,可以看出大部分的成交金额在1到20(美元)之间。

dashboard

日志服务提供dashboard展示和分享所有的指标

dashboard链接

试用日志服务

查询链接
dashboard链接
以下5个子帐号供试用,请随机选择一个登录,若登录不成功请换一个子帐号尝试:

登录地址 用户名 密码
链接 sls_reader1@1654218965343050 pnX-32m-MHH-xbm
链接 sls_reader2@1654218965343050 pnX-32m-MHH-xbm
链接 sls_reader3@1654218965343050 pnX-32m-MHH-xbm
链接 sls_reader4@1654218965343050 pnX-32m-MHH-xbm
链接 sls_reader5@1654218965343050 pnX-32m-MHH-xbm

日志系列--行车轨迹日志的统计分析相关推荐

  1. IBM X系列服务器IMM日志采集

    IBM X系列服务器IMM日志采集 IBM服务器素来以稳定著称,但有时候难免也会出现一些故障.在出现故障时怎么排除故障,除了依靠经验判断定位故障外,还有没有更好的办法呢? IBM X系列服务器提供了I ...

  2. nginx系列之三:日志配置

    ** 前言 ** nginx系列之一:nginx入门 nginx系列之二:配置文件解读 nginx系列之三:日志配置 nginx系列之四:web服务器 nginx系列之五: 负载均衡 nginx系列之 ...

  3. mysql 开发进阶篇系列 41 mysql日志之慢查询日志

    一.概述 慢查询日志记录了所有的超过sql语句( 超时参数long_query_time单位 秒),获得表锁定的时间不算作执行时间.慢日志默认写入到参数datadir(数据目录)指定的路径下.默认文件 ...

  4. ASP.NET企业开发框架IsLine FrameWork系列之八--AppLogProvider日志框架(下)

    ASP.NET企业开发框架IsLine FrameWork系列之八--AppLogProvider日志框架(下) 接上文 上面的配置实例是按照将日志写入文本文件来配置的(节点具体含义见上文),程序调用 ...

  5. ASP.NET企业开发框架IsLine FrameWork系列之七--AppLogProvider日志框架(上)

    ASP.NET企业开发框架IsLine FrameWork系列之七--AppLogProvider日志框架(上) 日志与异常 部署系统以后,管理员需要有一套强大的日志系统来诊断和修复配置上的问题,这就 ...

  6. 【深入浅出etcd系列】3. 日志同步

    概论 分布式共识算法(consensus algorithm)通常的做法就是在多个节点上复制状态机.分布在不同服务器上的状态机执行着相同的状态变化,即使其中几台机器挂掉,整个集群还能继续运作. 复制状 ...

  7. MySQL日志系列(2):binlog日志管理

    目录 传送门 binlog 日志索引文件 查看当前日志文件SQL命令 binlog日志文件更新 binlog日志文件删除 自动删除日志文件配置 手动删除日志文件 暂时停止binlog日志 使用binl ...

  8. Zabbix监控系统系列之八:日志监控

    ======= 系列目录 ======= Zabbix监控系统系列之一 : Server部署 Zabbix监控系统系列之二 : 初始化配置 Zabbix监控系统系列之三 :版本升级 Zabbix监控系 ...

  9. MySQL日志系列(1):MySQL各种日志

    目录 传送门 MySQL日志分类 错误日志 查看错误日志 设置错误文件 通用查询日志 查看通用查询日志 设置通用查询日志 binlog 查看binlog日志 设置binlog 慢查询日志 查看慢查询日 ...

最新文章

  1. 使用PowerShell调用MTools分析MongoDB性能并发送邮件
  2. SOA面向服务架构打包部署
  3. 万物上链: 5G 起跑
  4. 趣学python3(32)-enumerate,zip
  5. 【Awsome】GitHub 资源汇总(更新中)
  6. 7-7 字符串修改 (15 分)
  7. Ubuntu安装pycharm并且激活
  8. 容器编排技术 -- AWS EC2快速入门
  9. 脚本同步mysql数据_windows下数据库文件使用脚本同步到linux下的mysql数据库中
  10. Python多线程编程基础2:如何创建线程
  11. php在客户端禁用cookie时让session不失效的解决方法
  12. 关于Unable to load annotation processor factory 的故障
  13. VS2008下改变项目的默认属性
  14. bzoj 1237: [SCOI2008]配对(DP)
  15. 基于python的车牌识别系统设计与实现
  16. 网络游戏防沉迷的理想与现实
  17. 微型计算机的最少配是,只有SD卡大小的微型电脑 配Atom处理器
  18. bzoj1864 [Zjoi2006]三色二叉树
  19. 单片机学习知识点全攻略
  20. javascript学习之路1

热门文章

  1. 常用的一些英语俚语140条
  2. 用WebClinet实现SharePoint上文档库中文件的上传与下载
  3. Mysql 配置同局域网下连接
  4. upload上传和下载文件
  5. 服务器bios下修改启动项,怎么修改bios启动项
  6. JavaScript——回调函数 + 函数自调用
  7. 如何下载video标签中的视频资源以blob:http开头地址的资源m3u8
  8. 关于使用apksigner.bat对APK进行重新签名记录
  9. npm升级报错Error: EINVAL: invalid argument, mkdir解决办法
  10. MySQL 的连接时长控制--interactive_timeout和wait_timeout