目标:每周/月通过东方财富股吧上面的收盘后的股票信息

尝试1:使用request包来爬取,因为可以不用打开浏览器。

问题:使用request只能抓取到股票名字,其他信息抓取不到。查询后得知所需要的信息是在一个动态添加的div标签里面,打开网页后再审查元素里面可以查到,但是网页源代码里面查不到。

尝试2:使用selenium包来爬取,尝试后可以。将抓取到的信息保存在txt文件里。

问题:必须使用浏览器,还必须打开浏览器才行。没有股票代码,只能使用大概的范围。txt保存后需手动导入到excel中

# 获取股票信息
import time
import random
from selenium import webdriverdef get_info(stock_number):global browsertry:browser = webdriver.Chrome(r'G:\Program Files (x86)\Google\Chrome\Application\chromedriver.exe')browser.get(f"https://guba.eastmoney.com/list,{stock_number}.html")stock_name = str(browser.find_element_by_id('stockname').text)stock_price = str(browser.find_element_by_id('hqprice').text)stock_price_variation = str(browser.find_element_by_id('hqzd').text)stock

python使用selenium爬取股票相关信息相关推荐

  1. python中完整爬取股票财务信息和公司基本信息含xpath

    完整代码: 完整代码花了差不多半个月时间写完,数据爬取横跨雪球网.东方财富网.同花顺,提取利润表.资产负债表.主要指标.分红.股东变化信息等,同时获取企业员工.管理人信息及主营业务.企业简介等: 过程 ...

  2. python中完整爬取股票财务信息和公司基本信息

    完整代码: import xlwings as xw import requests from bs4 import BeautifulSoup from datetime import dateti ...

  3. layui获取input信息_python爬虫—用selenium爬取京东商品信息

    python爬虫--用selenium爬取京东商品信息 1.先附上效果图(我偷懒只爬了4页) 2.京东的网址https://www.jd.com/ 3.我这里是不加载图片,加快爬取速度,也可以用Hea ...

  4. [python爬虫] selenium爬取局部动态刷新网站(URL始终固定)

    在爬取网站过程中,通常会遇到局部动态刷新情况,当你点击"下一页"或某一页时,它的数据就进行刷新,但其顶部的URL始终不变.这种局部动态刷新的网站,怎么爬取数据呢?某网站数据显示如下 ...

  5. python爬虫实现爬取网页主页信息(html代码)

    python爬虫实现爬取网页主页信息(html代码) 1.爬取网站源码 urllib整体介绍: urllib是一个包,收集几个模块来处理网址 urllib.request打开和浏览url中内容 url ...

  6. Python POST 爬虫爬取掘金用户信息

    Python POST 爬虫爬取掘金用户信息 1. 概述 Python第三方库requests提供了两种访问http网页的函数,基于GET方式的get()函数和基于POST方式的post()函数. g ...

  7. python 使用 selenium 爬取中国福利彩票双色球历史中奖号码

    python 使用 selenium 爬取中国福利彩票双色球历史中奖号码 前期准备 版本:python3 模块:selenium.time.pprint 一开始使用的是 tree 的方式获取数据,但发 ...

  8. python使用selenium爬取联想官网驱动(一):获取遍历各驱动的下载网址

    python使用selenium爬取联想官网驱动(一):获取遍历各驱动的下载网址然后wget命令试验下载 由于初期学习,所以先拿一个型号的产品驱动试验. (1)以下为在联想某型号产品获取相关驱动下载的 ...

  9. 用 Python selenium爬取股票新闻并存入mysql数据库中带翻页功能demo可下载

    用 Python selenium爬取实时股票新闻并存入mysql数据库中 1.分析需求 2.创建表 3.分析需要爬取的网页内容 4.python里面selenium进行爬虫操作 1.添加包 2.连接 ...

  10. Python爬虫+selenium——爬取淘宝商品信息和数据分析

    浏览器驱动 点击下载chromedrive .将下载的浏览器驱动文件chromedriver丢到Chrome浏览器目录中的Application文件夹下,配置Chrome浏览器位置到PATH环境. 需 ...

最新文章

  1. docker小技巧-清理未使用空间
  2. 安装SQL Server 2012示例数据库
  3. .net core word转pdf_免费在线转换PDF转Word、Word转PDF,办公必备神器
  4. oracle的age datetime,python cx_Oracle插入TIMESTAMP字段后显示格式问题?
  5. phpcmsV9 QQ互联 相关文件配置成功 - 总结篇
  6. redis常用命令(高级篇)
  7. menu什么意思中文意思_pipeline什么意思
  8. mysql序列号生成_超详细的mysql数据库GTID介绍—概念、优缺点、原理、生命周期等
  9. ubuntu 14.04配置lamp粗略
  10. vecm模型怎么写系数_VAR模型与向量VECM模型(7)
  11. JavaWeb学习DAY2—Java web的创建
  12. 【总结整理】openlayer加载搜狗地图,qq地图,mapabc
  13. 从零开始编写minecraft光影包(1)基础阴影绘制
  14. 【年终总结系列 2021】不变的心态应对变化的环境
  15. 阿里P8整理总结,入职大厂必备Java核心知识(附加面试题
  16. 看了我的 mybatis-plus 用法,全公司同事开始悄悄模仿了。。
  17. Android获取设备的SerialNumber(SN)串号以及WIFIMac值
  18. php创建数组教程,PHP 数组
  19. iOS 企业分发 安装包发布
  20. hashcat 使用

热门文章

  1. 从零开始的Python计划#8.2 继承
  2. JVM调试常用命令——jps、(1)
  3. SAP三天大会的三个关键词和三个重头戏
  4. 【图像处理】halcon实现图像中两个圆形轮廓的圆心距
  5. PHPCMS 的栏目英文名称的调用
  6. 618狂欢结束,来聊聊华为云GaussDB NoSQL的蓬勃张力
  7. QuantLib 金融计算——高级话题之模拟跳扩散过程
  8. Unity 清理掉项目中垃圾文件——UnityAssetCleaner
  9. Linux静态库和动态库
  10. VL53L5CX驱动开发(2)----设置自主模式