我正在尝试获取此页面上每个块的描述文本内容

用于p标签的html看起来像

http://DataMiningBlog.com  covers current challenges, interviews with leading actors and book reviews related to data mining, analytics and data science.

我的代码:

productDivs = soup.findAll('div', attrs={'class' : 'ProfileCard-content'})

for div in productDivs:

print div.find('p', attrs={'class' : 'ProfileCard-bio u-dir'}).text

这里有什么问题吗?在这里获取异常

Traceback (most recent call last):

File "twitter_user_scrapper.py", line 91, in getImageList

print div.find('p', attrs={'class' : 'ProfileCard-bio u-dir'}).text

AttributeError: 'NoneType' object has no attribute 'text'

解决方案

这个问题可能是某些div与class作为ProfileCard-content可能不会有一个孩子p元素带班-ProfileCard-bio u-dir,这种情况发生时,下面的回报None-

div.find('p', attrs={'class' : ['ProfileCard-bio', 'u-dir']})

这就是您获得的原因AttributeError。您应该获取上面的返回值并将其保存在变量中,并检查是否存在,并且None仅在其不为None时才采用文本。

另外,您应该将class作为所有类的列表,而不是单个字符串,例如-

attrs={'class' : ['ProfileCard-bio', 'u-dir']}

范例-

productDivs = soup.findAll('div', attrs={'class' : 'ProfileCard-content'})

for div in productDivs:

elem = div.find('p', attrs={'class' : ['ProfileCard-bio', 'u-dir']})

if elem:

print elem.text

python提取p标签的文本_从p标签获取文本内容相关推荐

  1. python提取cad中的文字_[python]提取PPT中的文字(包括图片中的文字)

    python是一门很强大的语言,因为有着丰富的第三方库,所以可以说Python是无所不能的. 很多人都知道,Python可以操作Excel,PDF·还有PPT,这篇文章就围绕Python提取PPT中的 ...

  2. 根据大小分割大文本_值得一看的文本检测方法

    作者:晟  沚 前  言 目前深度学习方法做文本检测比较普遍,但是也存在一些时候GPU资源不够,这时候就需要一些其他的方法来检测文本信息,本文主要介绍不使用深度学习进行文本检测的方法.文本检测的瓶颈主 ...

  3. alert获取输入框内容_用JS怎样获取文本框的值

    展开全部 代码示例: document.getElementById("id").innerHTML //获取62616964757a686964616fe59b9ee7ad943 ...

  4. python提取图片文字视频教学_用Python提取视频中的图片

    小编自己码的通用型函数,支持各种常用视频格式,可满足常用需求,亲测效果和速度都不错. 想获取本文数据和完整代码的下载链接,请关注微信公众号"R语言和Python学堂",并回复发文日 ...

  5. python提取发票信息发票识别_(附完整python源码)基于tensorflow、opencv的入门案例_发票识别二:字符分割...

    (附完整python源码)基于tensorflow.opencv的入门案例_发票识别二:字符分割 发布时间:2018-05-14 20:16, 浏览次数:1201 , 标签: python tenso ...

  6. python提取发票信息发票识别_分享一个电子发票信息提取工具(Python)

    电子发票太多,想统计下总额异常困难,网上工具不好用,花了2个小时实现一份,测试过中石油.京东开具的电子发票还行,部分发票名称失败有问题不影响统计,有需要的小伙伴自己拿去改吧. import cmd i ...

  7. python 提取元组中的值_如何从Python元组中提取数据?

    我是Python的新手.对于这些数据,我正在和Jupytier iPython合作.我试图从csv文件中提取数字数据,然后运行Sklearn.我有: 用Pandas打开并读取CSV文件 将数据设置为字 ...

  8. python 提取图片的某个颜色_使用python提取图片中的主体颜色

    上次国庆节去谷歌开发者大会,体验了很多有趣的人工智能项目. 其中有一个颜色匹配的环节,叫做"AI调色板,解码缤纷艺术世界",让我觉得很有意思,回来后,我计划自己实现一个类似的功能. ...

  9. python提取pdf中的图片_提取PDF中内容(表格篇)

    由于(质量优质)PDF较好的阅读性,工作当中难免有文件使用PDF格式保存和流通的.但是由于PDF过于追求视觉的享受,所以在编辑其内容元素上相较微软office系列的确困难.不时会碰到看的到内容却难以直 ...

最新文章

  1. VM 下装ubuntu系统
  2. java pem 私钥_将PEM导入Java密钥库
  3. python 拼音姓名排序_Python一秒将全部中文姓名转为拼音!
  4. put the eye care sticker on the neck is relief
  5. 怎样编写一个Photoshop滤镜(1)
  6. 【转】Hibernate和IBatis对比
  7. 【渝粤教育】 国家开放大学2020年春季 1443卫生信息与文献检索 参考试题
  8. 1年薪水=3盒药?一位癌症晚期病人告诉你:别乱买保险
  9. 透明大页相关内核参数_Alibaba Cloud Linux 2系统中与透明大页THP相关的性能调优方法...
  10. Linux 命令整理-tailf
  11. mkfs.ext3 快速格式化_U盘数据快速恢复
  12. 支持傲腾技术的服务器主板,采用英特尔® 傲腾™ 技术的数据中心存储
  13. 二叉树 java泛型_java二叉树
  14. Kali Linux全网最细安装教程
  15. 数仓建模—数仓建模实战(建模流程/建模工具)
  16. Java根据isbn查询图书信息_图书ISBN查询
  17. 2022建筑架子工(建筑特殊工种)考试练习题及在线模拟考试
  18. 「2020」拼多多数据分析笔试题 | 附解答
  19. SpringMVC的核心架构示意图<搬代码>
  20. 作业2:简答题、编程实践(简单计算器)、思考题

热门文章

  1. 关于Gmsh使用Full_Blosson三角形合并为全四边形以及波前法、Delaunay和自适应算法测试
  2. 机翻galgame新姿势
  3. 转行从事UI设计,这些UI设计的就业方向你要了解
  4. thrift源码研究-transport类体系研究总结
  5. 互联网之子Aaron Swart----技术金字塔上的刀锋
  6. 珍惜光阴,如果浪费的话,就让它们浪费在Information Technology上吧!
  7. 聚力远航·共创辉煌|沃丰科技受邀参加华为中国生态大会2021
  8. WPF应用--字体基本属性设置
  9. DHCP是什么?一文详解其工作过程及配置
  10. 1、window.open跨域问题解决方式