python爬虫:英为财情爬取美国十年期国债收益率
from bs4 import BeautifulSoup as bs
from time import sleep
import re
import pandas as pd
from selenium.webdriver.common.by import By
import undetected_chromedriver.v2 as uc
browser = uc.Chrome()
browser.get('具体网址')
sleep(6)
#browser.maximize_window()
sleep(5)
browser.find_element(by=By.XPATH,value='//*[@id="widget"]').click()
sleep(5)
browser.find_element(by=By.XPATH,value = '//*[@id="startDate"]').clear()
browser.find_element(by=By.XPATH,value ='//*[@id="startDate"]').send_keys('2019/01/01')
sleep(2)
browser.find_element(by=By.XPATH,value ='//*[@id="endDate"]').clear()
browser.find_element(by=By.XPATH,value ='//*[@id="endDate"]').send_keys('2020/10/29')
sleep(2)
browser.find_element(by=By.XPATH,value = '//*[@id="applyBtn"]').click()
sleep(8)
print(browser.current_url)
print(browser.page_source)
a= browser.page_source
soup = bs(a,"lxml")
content = soup.find('div',id="results_box").find_all('tbody')[0].find_all('tr')
resultdf = pd.DataFrame({'date': [],
'close': [],
'open': [],
'high': [],
'low': []})
for tr in content:
td = tr.find_all('td')
date = re.findall(r'<td[^>]*>(.*?)</td>',str(td[0]),re.I | re.M)[0]
resultdf=resultdf.append(pd.DataFrame({'date':[date],
'close':[float(td[1].get("data-real-value"))],
'open':[float(td[2].get("data-real-value"))],
'high':[float(td[3].get("data-real-value"))],
'low':[float(td[4].get("data-real-value"))]}),ignore_index=True)
python爬虫:英为财情爬取美国十年期国债收益率相关推荐
- 从入门到入土:Python爬虫学习|实例练手|爬取百度翻译|Selenium出击|绕过反爬机制|
此博客仅用于记录个人学习进度,学识浅薄,若有错误观点欢迎评论区指出.欢迎各位前来交流.(部分材料来源网络,若有侵权,立即删除) 本人博客所有文章纯属学习之用,不涉及商业利益.不合适引用,自当删除! 若 ...
- 从入门到入土:Python爬虫学习|实例练手|爬取猫眼榜单|Xpath定位标签爬取|代码
此博客仅用于记录个人学习进度,学识浅薄,若有错误观点欢迎评论区指出.欢迎各位前来交流.(部分材料来源网络,若有侵权,立即删除) 本人博客所有文章纯属学习之用,不涉及商业利益.不合适引用,自当删除! 若 ...
- 从入门到入土:Python爬虫学习|实例练手|爬取新浪新闻搜索指定内容|Xpath定位标签爬取|代码注释详解
此博客仅用于记录个人学习进度,学识浅薄,若有错误观点欢迎评论区指出.欢迎各位前来交流.(部分材料来源网络,若有侵权,立即删除) 本人博客所有文章纯属学习之用,不涉及商业利益.不合适引用,自当删除! 若 ...
- 从入门到入土:Python爬虫学习|实例练手|爬取百度产品列表|Xpath定位标签爬取|代码注释详解
此博客仅用于记录个人学习进度,学识浅薄,若有错误观点欢迎评论区指出.欢迎各位前来交流.(部分材料来源网络,若有侵权,立即删除) 本人博客所有文章纯属学习之用,不涉及商业利益.不合适引用,自当删除! 若 ...
- Python 爬虫实战,模拟登陆爬取数据
Python 爬虫实战,模拟登陆爬取数据 从0记录爬取某网站上的资源连接: 模拟登陆 爬取数据 保存到本地 结果演示: 源网站展示: 爬到的本地文件展示: 环境准备: python环境安装 略 安装r ...
- Python爬虫利用18行代码爬取虎牙上百张小姐姐图片
Python爬虫利用18行代码爬取虎牙上百张小姐姐图片 下面开始上代码 需要用到的库 import request #页面请求 import time #用于时间延迟 import re #正则表达式 ...
- Python爬虫笔记(3)- 爬取丁香园留言
Python爬虫笔记(3)- 爬取丁香园留言 爬取丁香园留言:主要用到了模拟登录 爬取丁香园留言:主要用到了模拟登录 import requests, json, re, random,time fr ...
- Python爬虫--笔趣阁小说爬取
Python爬虫–笔趣阁小说爬取 爬虫用到的插件 import requests from lxml import etree 小说目录页 以小说"我有百万技能点"为例,在笔趣阁搜 ...
- python爬虫之股票数据定向爬取
python爬虫之股票数据定向爬取 功能描述 目标:获取上交所和深交所所有股票的名称和交易的信息 输出:保存到文件中 技术路线:requests-bs4-re 前期分析 选取原则:股票的信息静态存在H ...
- python爬虫初学实战——免登录爬取easyicon里的vip图标(2)
python爬虫初学实战-免登录爬取easyicon里的vip图标(2) 实验日期:2020-08-09 tips:没看过前面(1)的可以康康,指路 -> 爬取easyicon里的png图标 成 ...
最新文章
- db2case语句_DB2 常用的SQL语句
- 行业洞见 | 一文了解自动驾驶汽车
- Python3 使用[]提取字符
- ​5G+AI时代的高效视频处理
- python excel详解_Python - excel 详解
- Windows 添加用户
- 美国人竟然是这样教育小学
- php操作mysql常用_PHP常用MySql操作
- 程序员面试宝典pdf
- 【钉钉机器人 + 爬虫 + celery】定时发送微博热搜 + 定时发布财经新闻
- 射频电路设计及PCB设计要点
- m3u8 视频下载 ——M3U8 GETTER 批量下载版 使用说明
- 端口映射抖音去水印工具网页源码
- 快速由PCI迁移到PCIe
- linux超线程问题
- ant +design+vue中You may use special comments to disable some warnings. Use // eslint-disable-next-li
- Mac 远程连接树莓派-不使用拓展坞
- 【转载】关于XSS(跨站脚本攻击)和CSRF(跨站请求伪造)
- python里面title_python中title=(.*?)是什么意思
- 去ioe,什么是去IOE呢
热门文章
- 什么是kick-off meeting?
- HP台式机清灰后无法启动的解决办法
- 如何成功对接APP项目资源
- win10如何扩大c盘空间【系统天地】
- Linux7系统克隆到另一个硬盘,Ubuntu14.04 dd命令克隆系统镜像安装到另一台机器上...
- 美国梅西学院计算机科学与技术,新西兰梅西大学计算机科学硕士专业很难吗?看完入学条件就知道了...
- 深扒 | AI艺术品的另类产业链
- ssh连接阿里云服务器报错 Server responded ”Algori thm negotiation failed.”
- android studio连接木木模拟器
- 2019年云计算发展趋势如何 怎么加入云计算行业