python爬虫练习2:取道指成分股数据
练习要求:
在“http://money.cnn.com/data/dow30/”上抓取道指成分股数据并将30家公司的代码、公司名称和最近一次成交价放到一个列表中输出。
代码:
# -*- coding: utf-8 -*-
"""
Spyder EditorThis is a temporary script file.
"""
import requests
import re
r = requests.get("https://money.cnn.com/data/dow30/") #爬取网页内容
reg = re.compile('class="wsod_symbol">(.*?)<\/a>.*?<span.*?">(.*?)<\/span>.*?\n.*?class="wsod_stream">(.*?)<\/span>') #预编译正则表达式
ans = re.findall(reg, r.text) #利用正则表达式解析内容
print("%-7s%-20s%-10s" % ('Code','Name','Prize')) #占位输出
for key in ans:print("%-7s%-20s%-10s" % (key[0],key[1],key[2]))
运行效果:
python爬虫练习2:取道指成分股数据相关推荐
- python爬虫:抓取道指成分股数据
题目要求 在"http://money.cnn.com/data/dow30/"上抓取道指成分股数据并将30家公司的代码.公司名称和最近一次成交价放到一个列表中输出. 代码 imp ...
- AJAX教程美食滤镜,Python爬虫实例——爬取美团美食数据
1.分析美团美食网页的url参数构成 1)搜索要点 美团美食,地址:北京,搜索关键词:火锅 2)爬取的url https://bj.meituan.com/s/%E7%81%AB%E9%94%85/ ...
- Python爬虫4.2 — ajax(动态网页数据抓取)用法教程
Python爬虫4.2 - ajax[动态网页数据]用法教程 综述 AJAX 介绍 什么是AJAX 实例说明 请求分析 获取方式 实例说明 其他博文链接 综述 本系列文档用于对Python爬虫技术的学 ...
- python爬虫——使用selenium爬取微博数据(一)
python爬虫--使用selenium爬取微博数据(二) 写在前面 之前因为在组里做和nlp相关的项目,需要自己构建数据集,采用selenium爬取了几十万条微博数据,学习了很多,想在这里分享一下如 ...
- python爬虫实战之异步爬取数据
python爬虫实战之异步爬取数据 文章目录 前言 一.需求 二.使用步骤 1.思路 2.引入库 3.代码如下 总结 前言 python中异步编程的主要三种方法:回调函数.生成器函数.线程大法. 以进 ...
- Python爬虫:抓取多级页面数据
前面讲解的爬虫案例都是单级页面数据抓取,但有些时候,只抓取一个单级页面是无法完成数据提取的.本节讲解如何使用爬虫抓取多级页面的数据. 在爬虫的过程中,多级页面抓取是经常遇见的.下面以抓取二级页面为例, ...
- Python爬虫入门实战之猫眼电影数据抓取(理论篇)
前言 本文可能篇幅较长,但是绝对干货满满,提供了大量的学习资源和途径.达到让读者独立自主的编写基础网络爬虫的目标,这也是本文的主旨,输出有价值能够真正帮助到读者的知识,即授人以鱼不如授人以渔,让我们直 ...
- Python爬虫学习之第七天---数据提取-lxml模块和Xpath使用
爬虫学习之第七天-数据提取-lxml模块和Xpath使用 知识点:了解 lxml模块和xpath语法的关系了解 lxml模块的使用场景了解 lxml模块的安装了解 谷歌浏览器xpath helper插 ...
- 一个月入门Python爬虫,轻松爬取大规模数据
如果你仔细观察,就不难发现,懂爬虫.学习爬虫的人越来越多,一方面,互联网可以获取的数据越来越多,另一方面,像 Python这样一个月入门Python爬虫,轻松爬的编程语言提供越来越多的优秀工具,让爬虫 ...
- python爬虫scrapy框架爬取网页数据_Scrapy-Python
scrapy Scrapy:Python的爬虫框架 实例Demo 抓取:汽车之家.瓜子.链家 等数据信息 版本+环境库 Python2.7 + Scrapy1.12 初窥Scrapy Scrapy是一 ...
最新文章
- Spring Boot 2.4.5、2.3.10 发布
- stl非变易算法(二)
- c一:指针引用(int * p )和指针(int * q)的区别
- 超图数据集管理基本操作 - 隐藏系统字段和添加字段索引
- Visual C++——加速键
- 播放视频比较好的框架
- jsp将鼠标放到那显示信息
- 一份从入门到精通NLP的完整指南 | NLPer
- 网页修改iPhone13在线源码 – 无需SVIP
- Hadoop的Python框架指南
- [六字真言]1.唵.遁入佛门之异常.md
- 宅家36天咸鱼翻身入职腾讯,值得收藏!
- [转]linux命令技巧
- 线性表的顺序存储结构--数组(顺序表)、栈、队列
- 通过Kali模拟CC攻击进行WEB压力测试实操
- Linux小知识--通过MAC地址查询厂家OUI(成功率很高)
- Wpremig的AH之战题解
- 一键让网页变黑白色调
- 有没有人被向量空间、内积空间、欧式空间、希尔伯特空间、巴拿赫空间概念折磨的?
- 百度掉队了?正好相反,未来掉队的或许是腾讯阿里