数据:全国2013-2016所有企业间的投融资信息数据

作业要求

1、查看全国城际控股型投资关系

要求:
① 通过“data.xlsx”导出csv后,直接通过gephi看全国投资情况,有什么发现?
② 分别筛选出“同城投资”、“跨城投资”的TOP20,比较一下两类投资的数据分布
** 按照2013-2016年的汇总数据来计算
** 分开比较2013-2016四个年度的数据
** 需要绘制柱状图来辅助分析,这里用matplotlib即可

import numpy as np
import pandas as pd
import matplotlib.pyplot as plt
import warnings
warnings.filterwarnings('ignore')
import os
os.chdir('C:\\Users\\Administrator\\Desktop\\项目12中国城市资本流动问题探索')df = pd.read_excel('data.xlsx')
#汇总数据
df = df.groupby(['投资方所在城市','融资方所在城市','年份']).sum().reset_index()#筛选出同城投资的数据
data_tc = df[df['投资方所在城市'] == df['融资方所在城市']]
data_tc = data_tc.sort_values(by='投资企业对数',ascending=False).reset_index()
del data_tc['index']#筛选出跨城投资的数据
data_kc = df[df['投资方所在城市'] != df['融资方所在城市']]
data_kc = data_kc.sort_values(by='投资企业对数',ascending=False).reset_index()
del data_kc['index']#汇总同城投资的数据
tc_sum = data_tc.groupby(['投资方所在城市','融资方所在城市']).sum()
tc_sum = tc_sum.sort_values(by='投资企业对数',ascending=False)
del tc_sum['年份']#汇总跨城投资的数据
kc_sum = data_kc.groupby(['投资方所在城市','融资方所在城市']).sum()
kc_sum = kc_sum.sort_values(by='投资企业对数',ascending=False)
del kc_sum['年份']#绘制柱状图辅助分析
tc_sum.iloc[:20].plot(kind='bar',grid=True,color='blue',figsize=(10,4),alpha=0.8)
kc_sum.iloc[:20].plot(kind='bar',grid=True,color='green',figsize=(10,4),alpha=0.8)


分开比较2013-2016四个年度的数据

#分开比较2013-2016四个年度的数据
def f1(year):tc_year = data_tc[data_tc['年份'] == year].sort_values(by='投资企业对数',ascending=False)kc_year = data_kc[data_kc['年份'] == year].sort_values(by='投资企业对数',ascending=False)tc_year.index = tc_year['投资方所在城市']kc_year.index = kc_year['投资方所在城市'] + '-' + kc_year['融资方所在城市']return(tc_year.iloc[:20],kc_year.iloc[:20])fig,axes = plt.subplots(4,2,figsize=(12,15))
plt.subplots_adjust(wspace=0.2,hspace=1.2)
f1(2013)[0]['投资企业对数'].plot(kind='bar',grid=True,color='blue',alpha=0.8,ax=axes[0,0],title='同城投资-2013年',ylim=[0,40000])
f1(2013)[1]['投资企业对数'].plot(kind='bar',grid=True,color='green',alpha=0.8,ax=axes[0,1],title='跨城投资-2013年',ylim=[0,3000])f1(2014)[0]['投资企业对数'].plot(kind='bar',grid=True,color='blue',alpha=0.8,ax=axes[1,0],title='同城投资-2014年',ylim=[0,40000])
f1(2014)[1]['投资企业对数'].plot(kind='bar',grid=True,color='green',alpha=0.8,ax=axes[1,1],title='跨城投资-2014年',ylim=[0,3000])f1(2015)[0]['投资企业对数'].plot(kind='bar',grid=True,color='blue',alpha=0.8,ax=axes[2,0],title='同城投资-2015年',ylim=[0,40000])
f1(2015)[1]['投资企业对数'].plot(kind='bar',grid=True,color='green',alpha=0.8,ax=axes[2,1],title='跨城投资-2015年',ylim=[0,3000])f1(2016)[0]['投资企业对数'].plot(kind='bar',grid=True,color='blue',alpha=0.8,ax=axes[3,0],title='同城投资-2016年',ylim=[0,40000])
f1(2016)[1]['投资企业对数'].plot(kind='bar',grid=True,color='green',alpha=0.8,ax=axes[3,1],title='跨城投资-2016年',ylim=[0,3000])


过程总结:
1.原始数据中,同一年中的投资数据会重复记录,所以需要将数据以'投资方所在城市','融资方所在城市','年份'这三个字段做一个分组汇总
2.用df.plot(kind = 'bar')来绘制图表,这里index为城市名即可
3.绘制子图时要设置好参数:
wspace是子图之间的垂直间距,hspace是子图的上下间距

结论1:
① 从2013-2016的汇总数据来看,投资比数“同城投资”>“跨城投资”
② “同城投资”中领头的城市为北上广深及部分二线强城市,其中 深圳>北京>上海>>其他城市
③ “跨城投资”中领头的城市仍为北上广深(相互投资),或者北上广深向周边城市投资(城市群)

2、2013-2016年全国跨城市资本流动情况

要求:
① 结合“中国城市代码对照表.xlsx”数据,给2013-2016年“跨城投资”的汇总数据添加城市的经纬度
② 通过2013-2016年“跨城投资”的汇总数据,在gephi中绘制“城市关系图”
** 这里gephi中“点标签”只显示投资笔数TOP20的城市
③ 通过2013-2016年“跨城投资”的汇总数据,在echarts中绘制“全国跨城市资本流动OD图”
** 这里通过qgis的插件,做点转线
** 通过echart制作最后的资本
** 这里line的value为投资笔数

#读取“中国城市代码对照表.xlsx”数据
city = pd.read_excel('中国城市代码对照表.xlsx')
#重新设置kc_sum数据的index
kc_sum.reset_index(inplace=True)
#结合“中国行政代码对照表.xlsx”数据,给2013-2016年“跨城投资”的汇总数据添加城市的经纬度
kc_data = pd.merge(kc_sum,city[['城市名称','经度','纬度']],left_on='投资方所在城市',right_on='城市名称')
kc_data = pd.merge(kc_data,city[['城市名称','经度','纬度']],left_on='融资方所在城市',right_on='城市名称')
kc_data = kc_data[['投资方所在城市','融资方所在城市','投资企业对数','经度_x','纬度_x','经度_y','纬度_y']]
kc_data.columns = ['投资方所在城市','融资方所在城市','投资企业对数','lng_tz','lat_tz','lng_rz','lat_rz']#导出gephi制图所要的边文件
gephi_edges = kc_data[['投资方所在城市','融资方所在城市','投资企业对数']]
gephi_edges.columns = ['source','target','weight']
gephi_edges['weight'] = (gephi_edges['weight']-gephi_edges['weight'].min()) / (gephi_edges['weight'].max()-gephi_edges['weight'].min())
gephi_edges.to_csv('gephi_edges.csv',index=False)#导出gephi制图所要的点文件
citys = list(set(gephi_edges['source'].tolist()+gephi_edges['target'].tolist()))
gephi_nodes = pd.DataFrame({'Id':citys})
top_node = gephi_edges.sort_values(by='weight',ascending=False)
top_node20 = top_node['source'].drop_duplicates().iloc[:20]
df_top_node20 = pd.DataFrame({'Id':top_node20,'Label':top_node20})
gephi_nodes = pd.merge(gephi_nodes,df_top_node20,on='Id',how='left')
gephi_nodes.to_csv('gephi_nodes.csv',index=False)


过程说明:
1.gephi制图所需要导出的csv参考课程资料里的模板:
边文件 → edge_model.csv;
点文件 → node_model.csv(主要注意列名)** 其中边数据的value需要做标准化处理 → 0-1之间** gephi中单独显示某些城市的点标签方法 → 导入数据后,设置label,然后用label来显示标签,其中label只标注top20的数据
2.qgis中需要安装插件“LinePlotter”来转线
3.使用LinePlotter(注意qgis2.12版本才有该插件)得到line.shp文件时,需要为line的属性表添加value字段为投资笔数,因为要保证后续echart制图时数据文件的可执行性
4.shapefile转geojson时:注意shapefile保持wgs84地理坐标系

结论3
① 通过“全国跨城市资本流动OD图”可以明显看到
** 三个亮点密集的区域:长三角城市群、珠三角城市群、北京-天津城市群
** 这三个城市群与成都-重庆西部城市群构成了一个钻石形状
** 在钻石之外,仅有星星点点的东北和西部的几个亮点游离;
** 而这颗大钻石内的资本流动,占据了全国资本流动的90%以上!!
② 通过“城市关系图”可以发现:
** 城际投资的全国城市拓扑关系 → 以“北上深”为中心的城市网络
另外还得思考作为西部偏远的拉萨为什么会在’北上深’中心网络的附近,其原因是什么,还可以看到杭州与嘉兴也备受投资者的青睐,到底谁会更胜一筹

3、 深挖跨城市资本流动:钱从哪里来,到哪里去?

要求:
① 近四年对外控股型投资笔数最多的10个城市是哪些?
② 近四年吸引对外控股型投资笔数最多的10个城市又是哪些?
③ 从2013年到2016年,资本流动两大阵营的变化趋势:“北上深阵营”、“本地化阵营”
** “北上深阵营”:最大的外来投资方为北上深之一的城市
** “本地化阵营”:这里简化计算,将非“北上深阵营”都划入“本地化阵营”
** 该问题从“北上深阵营”历年来城市数量占比来看
** 可以qgis辅助绘制城市空间分布

#近四年对外控股型投资笔数最多的10个城市
kc_sum = kc_sum.reset_index()
result1 = kc_sum[['投资方所在城市','投资企业对数']].groupby('投资方所在城市').sum()
result1 = result1.sort_values(by='投资企业对数',ascending=False).iloc[:10]#近四年吸引对外控股型投资笔数最多的10个城市
result2 = kc_sum[['融资方所在城市','投资企业对数']].groupby('融资方所在城市').sum()
result2 = result2.sort_values(by='投资企业对数',ascending=False).iloc[:10]result1.plot(kind='bar',grid=True,figsize=(10,4),color='red',alpha=0.8)
result2.plot(kind='bar',grid=True,figsize=(10,4),color='black',alpha=0.8)
#创建函数
def f2(year):kc_datai = data_kc[data_kc['年份'] == year]        x = kc_datai[['融资方所在城市','投资企业对数']].groupby('融资方所在城市').max().reset_index()#得到某年融资城市对应的最大外来投资城市city_tz_max = pd.merge(kc_datai,x,on=['融资方所在城市','投资企业对数'],how='right')#划分本地阵营和北上深阵营city_tz_max['阵营'] = 0city_tz_max['阵营'][(city_tz_max['投资方所在城市'] == '北京') | (city_tz_max['投资方所在城市'] == '上海') |(city_tz_max['投资方所在城市'] == '深圳')] = 1city = data_dm[['城市名称','经度','纬度']]#添加融资方所在城市的经纬度city_tz_max = pd.merge(city_tz_max,city,left_on='融资方所在城市',right_on='城市名称')      city_tz_max = city_tz_max[['投资方所在城市','融资方所在城市','阵营','经度','纬度']]#计算两大阵营的城市数量,并放入一个字典dici = {}dici['北上深阵营城市数据量'] = city_tz_max['阵营'].value_counts().iloc[1]dici['本地化阵营城市数据量'] = city_tz_max['阵营'].value_counts().iloc[0]return(city_tz_max,dici)zy_year = pd.DataFrame([f2(2013)[1],f2(2014)[1],f2(2015)[1],f2(2016)[1]],index = ['2013年','2014年','2015年','2016年'])
zy_year['北上深阵营占比'] = zy_year['北上深阵营城市数据量']/(zy_year['北上深阵营城市数据量']+zy_year['本地化阵营城市数据量'])
#绘制堆叠图查看占比情况
zy_year[['北上深阵营城市数据量','本地化阵营城市数据量']].plot(kind='bar',stacked=True,grid=True,colormap='Reds_r',rot=0,figsize=(10,4),ylim=[0,400])f2(2013)[0].to_csv('year2013.csv',index=False)
f2(2014)[0].to_csv('year2014.csv',index=False)
f2(2015)[0].to_csv('year2015.csv',index=False)
f2(2016)[0].to_csv('year2016.csv',index=False)
print('finished!')
过程说明:
① 资本流动两大阵营在计算中,主要以“融资方所在城市”为对象研究
② 资本流动两大阵营变化趋势计算中,可以构建函数,以年份为参数
③ 如何得到某年融资城市对应的最大的外来投资城市?** 首先按照“融资方所在城市”做groupby分组,计算“投资企业对数”的max,得到一个Series** Series通过reset_index转化为dataframe** 再通过和源数据merge,找到该融资城市的最大外来投资对应的“投资方城市”,这里merge中的参数 on = ['融资方所在城市','投资企业对数']
④ 为了在qgis中制图,需要给数据添加经纬度信息,这里只需要添加“融资方所在城市”的经纬度
⑤ 为了qgis更好识别阵营类型,数据“阵营”字段用数字表示:0代表“本地化阵营”,1代表“北上深阵营”
⑥ qgis中制图时,既不属于“本地化阵营”又不属于“北上深阵营”的城市,颜色填充和“本地化阵营”一样即可(已分类-->阵营-最大值-->颜色填充)



结论4
① 通过“对外控股型投资笔数-城市排名TOP10”可以看出
** 北京、上海、深圳毫无悬念地包揽了前三名,且在量级上远远超过了其他城市 → 北上深在一定程度上控制着全国的资金流向和经济命脉
** 杭州 → 第四名,表现最为亮眼的省会城市,崛起的新一线城市
** 广州 → 第五名,江湖人称“北上广”三兄弟的广州,在对外投资的控制力上已经与另两位兄弟渐行渐远了
** 前10名中有5名都是长三角区域的城市,可以看到长三角地区资本的活跃程度
② 通过“吸引对外控股型投资笔数-城市排名TOP10”可以看出
** 吸引外来控股型投资笔数最多的前三名的仍然是北上深
** 在外来资本流入城市的榜单中,嘉兴挤掉了南京,进入前十名 → 相比资本对外输出,嘉兴是一个更受资本青睐的城市



2013年

2014年

2015年

2016年

结论5
“北上深阵营”高歌猛进,“本地化阵营”节节败退
① 2013年,“北上深阵营”的地盘仅仅局限于国内少数相对发达地区,以及各省省会城市
② 随着时间的推移,“北上深阵营”的势力范围逐步扩大,东北和内蒙的大部分地区纳入了“北上深阵营”
③ 越来越多的中小型城市也逐渐成为“北上深阵营”的一员
④ 2014年,90%的控股型城际投资去向了99个城市,而到了2016年,90%的城际投资只去向了60个城市
→ “北上深”越来越强大的资本力量,正在逐步地穿透中国经济的底层——三四线城市

中国城市资本流动问题探索相关推荐

  1. 数分笔记整理25 - 数据处理项目 - 中国城市资本流动问题探索

    [项目12] 中国城市资本流动问题探索 ''' [项目12] 中国城市资本流动问题探索数据:全国2013-2016所有企业间的投融资信息数据作业要求 1.查看全国城际控股型投资关系 要求: ① 通过& ...

  2. 中国城市资本流动问题探索(Python)

    项目要求:探索全国2013-2016年资本流动问题 项目数据:data.xlsx,中国城市代码对照表.xlsx 项目过程: 查看全国城际控股型投资关系 原始数据中,同一年中的投资数据会重复记录,所以需 ...

  3. Python 数据分析微专业课程--项目实战11 中国城市资本流动问题探索

    1.项目说明 通过全国2013-2016城市间投融资信息数据,分析资本在各城市间的流动情况. 2.项目具体要求 1.查看全国城际控股型投资关系 要求:分别筛选出"同城投资".&qu ...

  4. 报名 | 基于大数据的中国城市技术社会治理探索

    本讲座选取北京.深圳.成都三个城市基于大数据手段的技术社会治理探索的四个街道(区)的典型案例,以社区社会资本.行政资源配置力度为划分标准,将这些街区的探索实践归纳为四种中国城市大数据技术社会治理模式. ...

  5. 2023 中国城市商业魅力排行榜:探索西安商业活力与无限机遇【探索中国城市商业魅力排行榜】

    文章目录 探索中国城市商业魅力排行榜 评估指标 价值和意义 结语 探索中国城市商业魅力排行榜 随着中国经济的迅速崛起,中国各个城市商业中心纷纷崭露头角,展现出令人瞩目的商业魅力.为了揭示这些城市商业的 ...

  6. 中国城市园林绿化行业十四五规划方向与投资前景建议报告2022版

    中国城市园林绿化行业十四五规划方向与投资前景建议报告2022版 --------------------------------------- [修订日期]:2021年12月 [搜索鸿晟信合研究院查看 ...

  7. 中国城市商业银行产业模式展望及布局规模前景分析报告2021-2027年

    中国城市商业银行产业模式展望及布局规模前景分析报告2021-2027年 HS--HS--HS--HS--HS--HS--HS--HS--HS--HS--HS--HS-- [修订日期]:2021年10月 ...

  8. 以新型数据治理构筑城市发展新引擎,中国电子和清华大学联合发布 《2021中国城市数据治理工程白皮书》

    8月20日,中国电子和清华大学联合发布<2021中国城市数据治理工程白皮书>.中国电子党组书记.董事长芮晓武,清华大学党委常委.常务副校长王希勤,全国人大常委.社会建设委员会副主任委员.清 ...

  9. 新华三发布《中国城市数字经济指数白皮书(2019)》,融绘数字中国蓝图用数据记录城市数字化转型进程!

    2017年,新华三发布的<中国城市数字经济指数白皮书(2017)>是业内首个面向国内城市数字经济领域的评价白皮书,发布了对中国40余个城市的数字经济发展评价结果. 2018版白皮书则将研究 ...

  10. 大数据︱中国城市谁在腾飞?谁又在衰落?

    我们可能要完全接受"城市分化"的必然规律. 1,城市在分化,楼市在分化,人口在分化,经济在分化-,在老潘看来,分化是市场和自然生态的普世规律. 人为的,政策,更多只是延缓分化的速度 ...

最新文章

  1. brave浏览器_区块链浏览器 Brave 为广告观看者提供 BAT 代币奖励
  2. Rustup 管理工具
  3. linux网络编程之网络字节序、主机字节序、大端、小端
  4. 【Java】关于Java中的各种流
  5. 是单向链表吗_一步一步教你从零开始写C语言链表
  6. Java Web学习总结(27)——JavaEE中Web服务器、Web容器、Application服务器区别及联系
  7. docker 基础之数据管理
  8. RDMA over TCP的协议栈工作过程浅析
  9. iOS 获取本地视频的缩略图
  10. python web框架的基础:WSGI、uWSGI、Nginx、web框架的关系
  11. 莫烦python讲得好差_莫烦PYTHON——PyTorch——DQN 代码详解
  12. 手机号码归属地查询,手机号码归属地批量查询
  13. 永洪bi mysql连接配置_永洪BI 如果不同步数据是做的数据库直连吗?
  14. MyQQ框架火山SDK
  15. IOS逆向(9)DebugServer + LLDB
  16. 【网络教程】苹果MACCMS10怎样设置伪静态
  17. 文字-汉字-生僻字:生僻字1
  18. 家里的网络太慢了,怎么办?
  19. 在Ubuntu18.04 LTS下升级Python版本
  20. 各种输入方法总结(C++)

热门文章

  1. php 获取windows进程,PHP获取python进程并终止它。Xamp/Windows
  2. Python opencv:实现与自己同框对话的视频特效
  3. 物联网NB-IoT技术商用正全面铺开 竞争日趋激烈
  4. CentOS7 分区合并
  5. 手把带你学会红外避障循迹模块
  6. Centos7.5部署MySQL5.7基于GTID主从复制+并行复制+半同步复制+读写分离(ProxySQL) 环境- 运维笔记 (完整版)
  7. vue中用cdn引入优化vender.js大小,和cdn 引入mint-ui的问题
  8. 外贸邮箱能群发吗?用哪个外贸邮箱发开发信回复率高?
  9. hdu6438(优先队列)
  10. bwt比对算法 C语言,BWT比对算法