我正在学习使用beauthoulsoup和python来提取html表。我尝试使用下面的代码为Google提取资产负债表。但是,我似乎无法正确地刮除所有行。在

我不能忽略仅仅是一个分隔符的行,也不能提取总计的行(例如总资产)。在

有什么建议吗?关于简化代码的建议也很有价值。在from bs4 import BeautifulSoup

import requests

def bs_extract(stock_ticker):

url= 'https://finance.yahoo.com/q/bs?s='+str(stock_ticker)+'&annual'

source_code = requests.get(url)

plain_text=source_code.text

soup = BeautifulSoup(plain_text)

c1= ""

c2= ""

c3= ""

c4= ""

c5= ""

table = soup.find("table", { "class" : "yfnc_tabledata1" })

# print (table)

for row in table.findAll("tr"):

cells = row.findAll("td")

if len(cells)==5:

c1=cells[0].find(text=True)

c2=cells[1].find(text=True)

c3=cells[2].find(text=True)

c4=cells[3].find(text=True)

c5=cells[4].find(text=True)

elif len(cells)==6:

c1=cells[1].find(text=True)

c2=cells[2].find(text=True)

c3=cells[3].find(text=True)

c4=cells[4].find(text=True)

c5=cells[5].find(text=True)

elif len(cells)==1:

c1=cells[0].find(text=True)

c2=""

c3=""

c4=""

c5=""

else:

pass

print(c1,c2,c3,c4,c5)

bs_extract('goog')

python资产负债表_用python提取雅虎财务资产负债表相关推荐

  1. 第一章 第一节:Python基础_认识Python

    Python基础入门(全套保姆级教程) 第一章 第一节:Python基础_认识Python 1. 什么是编程 通俗易懂,编程就是用代码编写程序,编写程序有很多种办法,像c语言,javaPython语言 ...

  2. gnuradio上怎么使用python文件_使用Python从PDF文件中提取数据

    前言 数据是数据科学中任何分析的关键,大多数分析中最常用的数据集类型是存储在逗号分隔值(csv)表中的干净数据.然而,由于可移植文档格式(pdf)文件是最常用的文件格式之一,因此每个数据科学家都应该了 ...

  3. java python算法_用Python,Java和C ++示例解释的排序算法

    java python算法 什么是排序算法? (What is a Sorting Algorithm?) Sorting algorithms are a set of instructions t ...

  4. python 字符识别_使用python进行光学字符识别入门

    python 字符识别 语言模型设计 (Language Model Designing) Optical Character Recognition is the conversion of 2-D ...

  5. excel python插件_利用 Python 插件 xlwings 读写 Excel

    Python 通过 xlwings 读取 Excel 数据 去年底公司让我做设备管理,多次委婉拒绝,最终还是做了.其实我比较喜欢技术.做管理后发现现场没有停机率统计,而原始数据有,每次要自己在Exce ...

  6. 网络安全用python吗_使用Python进行网络安全渗透——密码攻击测试器

    相关文章: 本篇将会涉及: HTTP 基本认证 对HTTP Basic认证进行密码暴力攻击测试 什么是HTTP 基本认证 HTTP基本认证(HTTP Basic Authentication)是HTT ...

  7. 动态照片墙 python 实现_利用python生成照片墙的示例代码

    这篇文章主要介绍了利用python生成照片墙的示例代码,文中通过示例代码介绍的非常详细,对大家的学习或者工作具有一定的参考学习价值,需要的朋友们下面随着小编来一起学习学习吧 PIL(Python Im ...

  8. python字符串_(Python基础教程之七)Python字符串操作

    Python基础教程 在SublimeEditor中配置Python环境 Python代码中添加注释 Python中的变量的使用 Python中的数据类型 Python中的关键字 Python字符串操 ...

  9. python范例_最佳Python代码范例

    python范例 Python is a general purpose programming language which is dynamically typed, interpreted, a ...

最新文章

  1. mybatis教程--实现增删改查的入门教程
  2. php简单代码大全,征集常用的PHP简单代码
  3. Qt状态机框架介绍(二)
  4. formatter java_Java编程中的Java Formatter是什么?
  5. 读zepto核心源码学习JS笔记(3)--zepto.init()
  6. Linux C语言 文件操作
  7. linux+top+常用参数,linux的top命令参数详细说明
  8. 页面仔 很丢人么?前端越来越不好干了
  9. Linux文件系统:Linux 内核文件描述符表的演变
  10. python字典有什么用_Python中的字典介绍
  11. 三网 —— 计算机网络、电信网络、广播电视网络(移动网络)
  12. 如何从应用直接跳转AppStore 电话 短信 邮件
  13. 数据可视化工具的意义有哪些
  14. 3D美术8——max——多个bip动画文件,导入,并且合并成一个动画文件
  15. TeXmacs Bibtex文献排序
  16. jQuery 一次定时器_记一次腾讯微信面试
  17. 现代操作系统学习笔记三、死锁
  18. C++的字符串输入方式
  19. c++01(数据类型 运算符 选择结构)
  20. 3675. 唐纳德先生与假骰子

热门文章

  1. 关于STM32 DFU模式【飞控升级】
  2. 微电影广告发展的痛点
  3. 三菱PLC FX3GA系列 FNC59 PLSR 带加减速功能的脉冲输出
  4. 三、javase中类、对象相关概念
  5. redis配置以及密码设置
  6. 自学Web开发第十四天-基于VB和ASP.NET;丰富数据呈现:TreeView控件的使用及与GridView控件联动,深入研究从GridView中取数据
  7. cad2014卡顿的解决方法_AutoCAD 2012运行卡顿怎么办 cad卡顿的原因和解决办法
  8. 通用串行总线 2.0 简介
  9. 银行数字化转型导师坚鹏:银行数据治理和数据质量问题解决
  10. win10下pycharm永久激活