^___^一个程序员的淘宝店:点击打开链接,助你快速学习python技术的一臂之力,不喜欢看广告的请忽略这条!

0、IT桔子和36Kr在专栏文章中(http://zhuanlan.zhihu.com/p/20714713),抓取IT橘子和36Kr的各公司的投融资数据,试图分析中国各家基金之间的互动关系。

1、知乎沧海横流,看行业起伏,抓取并汇总所有的答案,方便大家阅读,找出2015年最热门和最衰落的行业。

2、汽车之家大数据画像:宝马车主究竟有多任性?利用论坛发言的抓取以及NLP,对各种车型的车主做画像。

3、天猫、京东、淘宝等电商网站超越咨询顾问的算力,在用户理解和维护,抓取各大电商的评论及销量数据,对各种商品(颗粒度可到款式)沿时间序列的销量以及用户的消费场景进行分析。甚至还可以根据用户评价做情感分析,实时监控产品在消费者心目中的形象,对新发布的产品及时监控,以便调整策略。

4、58同城的房产、安居客、Q房网、搜房等房产网站下半年深圳房价将如何发展 ,抓取房产买卖及租售信息,对热热闹闹的房价问题进行分析。

5、大众点评、美团网等餐饮及消费类网站黄焖鸡米饭是怎么火起来的?抓取各种店面的开业情况以及用户消费和评价,了解周边变化的口味,所谓是“舌尖上的爬虫”。以及各种变化的口味,比如:啤酒在衰退,重庆小面在崛起。

6、58同城等分类信息网站花10万买贡茶配方,贵不贵?抓取招商加盟的数据,对定价进行分析,帮助网友解惑。

7、拉勾网、中华英才网等招聘网站互联网行业哪个职位比较有前途?抓取各类职位信息,分析最热门的职位以及薪水。

8、挂号网等医疗信息网站如何评价挂号网? 抓取医生信息并于宏观情况进行交叉对比。

9、应用宝等App市场你用 Python 做过什么有趣的数据挖掘/分析项目? 对各个App的发展情况进行跟踪及预测。(顺便吹一下牛,我们这个榜单很早就发现小红书App的快速增长趋势以及在年轻人中的极佳口碑)

10、携程、去哪儿及12306等交通出行类网站,对航班及高铁等信息进行抓取,能从一个侧面反映经济是否正在走入下行通道。

11、雪球等财经类网站抓取雪球KOL或者高回报用户的行为,找出推荐股票

12、58同城二手车、易车等汽车类网站一年当中买车的最佳时间为何时?什么品牌或者型号的二手车残值高?更保值?反之,什么类型的贬值较快? - 二手车,找出最佳的买车时间以及最保值的汽车。

13、神州租车、一嗨租车等租车类网站抓取它们列举出来的租车信息,长期跟踪租车价格及数量等信息

14、各类信托网站通过抓取信托的数据,了解信托项目的类型及规模

https://blog.csdn.net/weixin_40061167/article/details/78701150

有哪些网站值得用python爬虫获取很有价值的数据相关推荐

  1. Python爬虫获取基金持仓股票数据

    Python爬虫小实战 . 通过Python爬虫获取基金持仓股票数据,按照基金持仓金额对股票进行排行,并储存在本地数据库. from urllib import request from bs4 im ...

  2. python 爬虫 获取bilibili search搜索数据,返回json格式

    话不多说直接上代码 测试用例 : 搜索java为关键词的 时长在60分钟以上的视频 import requests import json import osheaders = {"user ...

  3. python 爬虫,获取携程网站机票数据

    爬取携程机票数据 from prettytable import PrettyTable import requests import jsondef xiecheng(dcity, acity, d ...

  4. 突破次元壁障,Python爬虫获取二次元女友

    突破次元壁障,Python爬虫获取二次元女友 前言 程序说明 二次元女友获取程序 观察网页结构 页面解析 创建图片保存路径 图片下载 格式转换 爬取结果展示 完整程序 前言 (又到了常见的无中生友环节 ...

  5. Python爬虫获取异步加载站点pexels并下载图片(Python爬虫实战3)

    Python爬虫获取异步加载站点pexels并下载图片(Python爬虫实战3) 1. 异步加载爬虫 对于静态页面爬虫很容易获取到站点的数据内容,然而静态页面需要全量加载站点的所有数据,对于网站的访问 ...

  6. Python爬虫 | Python爬虫获取女友图片

    Python爬虫 | Python爬虫获取女友图片 前言 程序说明 二次元女友获取程序 观察网页结构 页面解析 创建图片保存路径 图片下载 格式转换 爬取结果展示 完整程序 前言 (又到了常见的无中生 ...

  7. 教你使用Python爬虫获取电子书资源实战!喜欢学习的小伙伴过来看啦!

    最近在学习Python,相对java来说python简单易学.语法简单,工具丰富,开箱即用,适用面广做全栈开发那是极好的,对于小型应用的开发,虽然运行效率慢点,但开发效率极高.大大提高了咱们的生产力. ...

  8. python爬虫获取基金数据2

    用sklearn分析基金数据<1> python爬虫获取基金数据<2> 数据预处理:数据清洗.生成样本数据<3> 用sklearn训练样本数据<4> 用 ...

  9. Python 爬虫 | 获取历史涨停数据

    最近想研究一下连板的个股有没有什么规律(暴富我来了),这一篇主要就是做数据准备的. 目录 1.数据获取 2.代码实现 1.数据获取 数据来源就是问财,查指定日期的涨停即可获得当日的数据. 2.代码实现 ...

最新文章

  1. 026_PPT知识汇总
  2. Servlet 获取IllegelStateException
  3. linux wm虚拟机网络,复制多台虚拟机及简单的网络配置
  4. Asp.net大文件下载
  5. Java——获取当前线程的对象(currentThread())(两种方式)
  6. 学成在线--3.CMS页面管理开发(自定义条件查询)
  7. vb上传文件到MySQL_ASP.NET上传文件到数据库VB版
  8. curl java 转换_Linux CURL学习(转)
  9. 双十一凌晨苹果发布会,新 Mac 有望搭载 ARM 架构自研芯片
  10. 【毕业答辩】如何制作优秀的毕业论文答辩PPT?
  11. linux 内核网络,数据接收流程图
  12. 高教杯数学建模国赛论文模板+2013到2019年的国赛优秀论文+2020年数学建模论文心得---数学建模友友必看
  13. Mac卸载creative cloud
  14. 冒险岛2服务器位置,《冒险岛2》二测造梦测试服务器开放公告
  15. Linux系统软件安装
  16. 基于Zynq的光流法软硬件协同实现
  17. 电脑壁纸桌面放计算机,电脑壁纸
  18. (中)苹果有开源,但又怎样呢?
  19. Android ROM定制——界面美化基础
  20. 数据分析 VS 算法模型,如何高效分工合作?

热门文章

  1. 【java】dispose()方法与setVisible()方法
  2. GML:地理信息管理的飞跃
  3. unordered_multimap类
  4. 达内培训费用python
  5. 谷歌金山词霸是完全免费的吗?谷歌自己的软件呢?
  6. Win10局域网添加XP下共享的打印机
  7. js 前进 后退 刷新
  8. icomoon字体图标的下载与使用
  9. 基于Android的图片分享软件
  10. 为什么苹果官网设计如此吸引人?