说明

想要获取 a标签里的单词如下所示。

代码

from bs4 import BeautifulSoupf = open("word.txt", "r")  # 设置文件对象
html = f.read()  # 将txt文件的所有内容读入到字符串html中soup = BeautifulSoup(html, 'lxml')# 获取a标签里的文本内容
for item in soup.find_all("a"):print(item.string)# 将单词写入five_star.txt 文件with open('five_star.txt', 'a', encoding='utf-8') as file:file.write(item.string + '\n')f.close()  # 将文件关闭

word.txt 存放的是 a标签所有内容(内容过多 故部分展示)


five_star.txt 输出结果(内容过多 故部分展示)

BeautifulSoup 获取 a标签里的文本内容相关推荐

  1. xpath 取标签下所有文字内容_对Xpath 获取子标签下所有文本的方法详解

    对Xpath 获取子标签下所有文本的方法详解 在爬虫中遇见这种怎么办 想提取名称, 但是 名称不在一个标签里 使用xpath string()方法 例如 data.xpath("string ...

  2. python爬虫提取a标签_Python爬虫库BeautifulSoup获取对象(标签)名,属性,内容,注释

    一.Tag(标签)对象 1.Tag对象与XML或HTML原生文档中的tag相同. from bs4 import BeautifulSoup soup = BeautifulSoup('Extreme ...

  3. python tag对象下有多个标签、属性_Python爬虫库BeautifulSoup获取对象(标签)名,属性,内容,注释...

    Apple iPhone 11 (A2223) 128GB 黑色 移动联通电信4G手机 双卡双待 4999元包邮 去购买 > 如何利用Python爬虫库BeautifulSoup获取对象(标签) ...

  4. Selenium提取数据之标签对象提取文本内容和属性值

    Selenium提取数据之标签对象提取文本内容和属性值 find_element仅仅能够获取元素,不能够直接获取其中的数据,如果需要获取数据需要使用以下方法 对元素执行点击操作element.clic ...

  5. R语言配置可视化内容中的字体为斜体(italic)实战:标题斜体、轴标签斜体、文本内容斜体、或者部分内容斜体

    R语言配置可视化内容中的字体为斜体(italic)实战:标题斜体.轴标签斜体.文本内容斜体.或者部分内容斜体 目录

  6. BeautifulSoup模块过滤掉html标签,只拿文本内容(处理XSS攻击)

    from bs4 import BeautifulSoup#kindeditordef kindeditor(request): s = ''' <li><span style=&q ...

  7. 获取frame 标签里#documents里面的内容

    最近几天在爬一个网站,里面有frame标签. 今天有想获取frame标签下面#documents里面的内容,查了一晚上的资料,幸好找到,明天可以交差了... 一个有frame标签的网站,http:// ...

  8. python获取标签属性值_Python爬虫库BeautifulSoup获取对象(标签)名,属性,内容,注释

    更多python教程请到: 菜鸟教程www.piaodoo.com 人人影视www.sfkyty.com 16影视www.591319.com 星辰影院www.591319.com 一.Tag(标签) ...

  9. Python爬虫入门8:BeautifulSoup获取html标签相关属性

    ☞ ░ 前往老猿Python博客 https://blog.csdn.net/LaoYuanPython ░ 一. 引言 在上节<https://blog.csdn.net/LaoYuanPyt ...

最新文章

  1. 基于Java的RDMA高性能通信库(一):IBM jVerbs库
  2. 记crontab脚本未执行问题排查
  3. 《Unity着色器和屏幕特效开发秘笈(原书第2版)》一2.9 打包和混合纹理
  4. 【代码升级】【iCore3 双核心板】例程二十八:FSMC实验——读写FPGA
  5. python3数据库框架_Python3 MySQL 数据库连接:安装pymysql(mysql数据库驱动), sqlalchemy(ORM框架)。...
  6. 001. 为input type=text 时设置默认值
  7. Linux下编译hiredis
  8. 吉利博越L为何被称为新三好SUV
  9. 网络安全工具100强介绍与下载
  10. 机器人运动学与动力学
  11. 俄罗斯方块游戏开发教程1:整体流程
  12. 【蓝桥杯】:奇怪的分式
  13. vue 图片显示失败 显示默认图片
  14. 老男孩javascript实战源码
  15. 一个屌丝程序猿的人生(八十二)
  16. 民生银行京东三位大咖,手把手教你构建用户画像
  17. 云思智学获得2021年度“育见美好·机构创新服务奖”
  18. 清理服务器多余的图片(文件、数据)
  19. cmd命令窗口mysql查询表数据命令行_cmd常见命令使用 2学时_cmd命令窗口mysql查询表数据命令_cmd格盘命令...
  20. Helix --未完待续

热门文章

  1. 什么是JDK,它有什么用?
  2. Windows错误代码 (Bitlocker)
  3. golang,OpenGL,计算机图形学(一)
  4. JavaScript权威指南第六版中文扫描版电子书下载
  5. 移动硬盘或优盘连接计算机,移动硬盘或优盘连接计算机所使用的接口通常是______。...
  6. catfish CMS访问sitemap.xml出现404错误
  7. 新一代的数据库SQL审计服务 - SQL洞察
  8. 图解数据分析(1) | 数据分析介绍(数据科学家入门·完结)
  9. (1)面向对象开发_java石头剪刀布小游戏大厅之电脑玩家-初学
  10. 【工具小技巧】Cadence Virtuoso Calculator Function Panel计算器函数功能介绍(持续更新……)