练习要求:

在“http://money.cnn.com/data/dow30/”上抓取道指成分股数据并将30家公司的代码、公司名称和最近一次成交价放到一个列表中输出。

代码:

# -*- coding: utf-8 -*-
"""
Spyder EditorThis is a temporary script file.
"""
import requests
import re
r = requests.get("https://money.cnn.com/data/dow30/") #爬取网页内容
reg = re.compile('class="wsod_symbol">(.*?)<\/a>.*?<span.*?">(.*?)<\/span>.*?\n.*?class="wsod_stream">(.*?)<\/span>') #预编译正则表达式
ans = re.findall(reg, r.text) #利用正则表达式解析内容
print("%-7s%-20s%-10s" % ('Code','Name','Prize')) #占位输出
for key in ans:print("%-7s%-20s%-10s" % (key[0],key[1],key[2]))

运行效果:

python爬虫练习2:取道指成分股数据相关推荐

  1. python爬虫:抓取道指成分股数据

    题目要求 在"http://money.cnn.com/data/dow30/"上抓取道指成分股数据并将30家公司的代码.公司名称和最近一次成交价放到一个列表中输出. 代码 imp ...

  2. AJAX教程美食滤镜,Python爬虫实例——爬取美团美食数据

    1.分析美团美食网页的url参数构成 1)搜索要点 美团美食,地址:北京,搜索关键词:火锅 2)爬取的url https://bj.meituan.com/s/%E7%81%AB%E9%94%85/ ...

  3. Python爬虫4.2 — ajax(动态网页数据抓取)用法教程

    Python爬虫4.2 - ajax[动态网页数据]用法教程 综述 AJAX 介绍 什么是AJAX 实例说明 请求分析 获取方式 实例说明 其他博文链接 综述 本系列文档用于对Python爬虫技术的学 ...

  4. python爬虫——使用selenium爬取微博数据(一)

    python爬虫--使用selenium爬取微博数据(二) 写在前面 之前因为在组里做和nlp相关的项目,需要自己构建数据集,采用selenium爬取了几十万条微博数据,学习了很多,想在这里分享一下如 ...

  5. python爬虫实战之异步爬取数据

    python爬虫实战之异步爬取数据 文章目录 前言 一.需求 二.使用步骤 1.思路 2.引入库 3.代码如下 总结 前言 python中异步编程的主要三种方法:回调函数.生成器函数.线程大法. 以进 ...

  6. Python爬虫:抓取多级页面数据

    前面讲解的爬虫案例都是单级页面数据抓取,但有些时候,只抓取一个单级页面是无法完成数据提取的.本节讲解如何使用爬虫抓取多级页面的数据. 在爬虫的过程中,多级页面抓取是经常遇见的.下面以抓取二级页面为例, ...

  7. Python爬虫入门实战之猫眼电影数据抓取(理论篇)

    前言 本文可能篇幅较长,但是绝对干货满满,提供了大量的学习资源和途径.达到让读者独立自主的编写基础网络爬虫的目标,这也是本文的主旨,输出有价值能够真正帮助到读者的知识,即授人以鱼不如授人以渔,让我们直 ...

  8. Python爬虫学习之第七天---数据提取-lxml模块和Xpath使用

    爬虫学习之第七天-数据提取-lxml模块和Xpath使用 知识点:了解 lxml模块和xpath语法的关系了解 lxml模块的使用场景了解 lxml模块的安装了解 谷歌浏览器xpath helper插 ...

  9. 一个月入门Python爬虫,轻松爬取大规模数据

    如果你仔细观察,就不难发现,懂爬虫.学习爬虫的人越来越多,一方面,互联网可以获取的数据越来越多,另一方面,像 Python这样一个月入门Python爬虫,轻松爬的编程语言提供越来越多的优秀工具,让爬虫 ...

  10. python爬虫scrapy框架爬取网页数据_Scrapy-Python

    scrapy Scrapy:Python的爬虫框架 实例Demo 抓取:汽车之家.瓜子.链家 等数据信息 版本+环境库 Python2.7 + Scrapy1.12 初窥Scrapy Scrapy是一 ...

最新文章

  1. Spring Boot 2.4.5、2.3.10 发布
  2. stl非变易算法(二)
  3. c一:指针引用(int * p )和指针(int * q)的区别
  4. 超图数据集管理基本操作 - 隐藏系统字段和添加字段索引
  5. Visual C++——加速键
  6. 播放视频比较好的框架
  7. jsp将鼠标放到那显示信息
  8. 一份从入门到精通NLP的完整指南 | NLPer
  9. 网页修改iPhone13在线源码 – 无需SVIP
  10. Hadoop的Python框架指南
  11. [六字真言]1.唵.遁入佛门之异常.md
  12. 宅家36天咸鱼翻身入职腾讯,值得收藏!
  13. [转]linux命令技巧
  14. 线性表的顺序存储结构--数组(顺序表)、栈、队列
  15. 通过Kali模拟CC攻击进行WEB压力测试实操
  16. Linux小知识--通过MAC地址查询厂家OUI(成功率很高)
  17. Wpremig的AH之战题解
  18. 一键让网页变黑白色调
  19. 有没有人被向量空间、内积空间、欧式空间、希尔伯特空间、巴拿赫空间概念折磨的?
  20. 百度掉队了?正好相反,未来掉队的或许是腾讯阿里

热门文章

  1. Jpg格式如何变成gif动图?仅需三步快速合成gif
  2. 实现原理 扫描枪_条码扫描枪原理
  3. 饿了么高级设计师:界面视觉设计 5 要素
  4. MyBatis Plus 联合查询
  5. POJO, VO什么的是个什么鬼?
  6. 浏览器大全推荐丨这26款浏览器你用过几个?
  7. iOS打包Framework
  8. 5. 视图——Django
  9. 从图形和算法层面来看LIO-SAM残差问题
  10. 【谷歌浏览器】国内如何配置谷歌浏览器使用