BeautifulSoup 获取 a标签里的文本内容
说明
想要获取 a标签里的单词如下所示。
代码
from bs4 import BeautifulSoupf = open("word.txt", "r") # 设置文件对象
html = f.read() # 将txt文件的所有内容读入到字符串html中soup = BeautifulSoup(html, 'lxml')# 获取a标签里的文本内容
for item in soup.find_all("a"):print(item.string)# 将单词写入five_star.txt 文件with open('five_star.txt', 'a', encoding='utf-8') as file:file.write(item.string + '\n')f.close() # 将文件关闭
word.txt
存放的是 a标签所有内容(内容过多 故部分展示)
five_star.txt
输出结果(内容过多 故部分展示)
BeautifulSoup 获取 a标签里的文本内容相关推荐
- xpath 取标签下所有文字内容_对Xpath 获取子标签下所有文本的方法详解
对Xpath 获取子标签下所有文本的方法详解 在爬虫中遇见这种怎么办 想提取名称, 但是 名称不在一个标签里 使用xpath string()方法 例如 data.xpath("string ...
- python爬虫提取a标签_Python爬虫库BeautifulSoup获取对象(标签)名,属性,内容,注释
一.Tag(标签)对象 1.Tag对象与XML或HTML原生文档中的tag相同. from bs4 import BeautifulSoup soup = BeautifulSoup('Extreme ...
- python tag对象下有多个标签、属性_Python爬虫库BeautifulSoup获取对象(标签)名,属性,内容,注释...
Apple iPhone 11 (A2223) 128GB 黑色 移动联通电信4G手机 双卡双待 4999元包邮 去购买 > 如何利用Python爬虫库BeautifulSoup获取对象(标签) ...
- Selenium提取数据之标签对象提取文本内容和属性值
Selenium提取数据之标签对象提取文本内容和属性值 find_element仅仅能够获取元素,不能够直接获取其中的数据,如果需要获取数据需要使用以下方法 对元素执行点击操作element.clic ...
- R语言配置可视化内容中的字体为斜体(italic)实战:标题斜体、轴标签斜体、文本内容斜体、或者部分内容斜体
R语言配置可视化内容中的字体为斜体(italic)实战:标题斜体.轴标签斜体.文本内容斜体.或者部分内容斜体 目录
- BeautifulSoup模块过滤掉html标签,只拿文本内容(处理XSS攻击)
from bs4 import BeautifulSoup#kindeditordef kindeditor(request): s = ''' <li><span style=&q ...
- 获取frame 标签里#documents里面的内容
最近几天在爬一个网站,里面有frame标签. 今天有想获取frame标签下面#documents里面的内容,查了一晚上的资料,幸好找到,明天可以交差了... 一个有frame标签的网站,http:// ...
- python获取标签属性值_Python爬虫库BeautifulSoup获取对象(标签)名,属性,内容,注释
更多python教程请到: 菜鸟教程www.piaodoo.com 人人影视www.sfkyty.com 16影视www.591319.com 星辰影院www.591319.com 一.Tag(标签) ...
- Python爬虫入门8:BeautifulSoup获取html标签相关属性
☞ ░ 前往老猿Python博客 https://blog.csdn.net/LaoYuanPython ░ 一. 引言 在上节<https://blog.csdn.net/LaoYuanPyt ...
最新文章
- 基于Java的RDMA高性能通信库(一):IBM jVerbs库
- 记crontab脚本未执行问题排查
- 《Unity着色器和屏幕特效开发秘笈(原书第2版)》一2.9 打包和混合纹理
- 【代码升级】【iCore3 双核心板】例程二十八:FSMC实验——读写FPGA
- python3数据库框架_Python3 MySQL 数据库连接:安装pymysql(mysql数据库驱动), sqlalchemy(ORM框架)。...
- 001. 为input type=text 时设置默认值
- Linux下编译hiredis
- 吉利博越L为何被称为新三好SUV
- 网络安全工具100强介绍与下载
- 机器人运动学与动力学
- 俄罗斯方块游戏开发教程1:整体流程
- 【蓝桥杯】:奇怪的分式
- vue 图片显示失败 显示默认图片
- 老男孩javascript实战源码
- 一个屌丝程序猿的人生(八十二)
- 民生银行京东三位大咖,手把手教你构建用户画像
- 云思智学获得2021年度“育见美好·机构创新服务奖”
- 清理服务器多余的图片(文件、数据)
- cmd命令窗口mysql查询表数据命令行_cmd常见命令使用 2学时_cmd命令窗口mysql查询表数据命令_cmd格盘命令...
- Helix --未完待续
热门文章
- 什么是JDK,它有什么用?
- Windows错误代码 (Bitlocker)
- golang,OpenGL,计算机图形学(一)
- JavaScript权威指南第六版中文扫描版电子书下载
- 移动硬盘或优盘连接计算机,移动硬盘或优盘连接计算机所使用的接口通常是______。...
- catfish CMS访问sitemap.xml出现404错误
- 新一代的数据库SQL审计服务 - SQL洞察
- 图解数据分析(1) | 数据分析介绍(数据科学家入门·完结)
- (1)面向对象开发_java石头剪刀布小游戏大厅之电脑玩家-初学
- 【工具小技巧】Cadence Virtuoso Calculator Function Panel计算器函数功能介绍(持续更新……)