# -*- coding:UTF-8 -*-
from bs4 import BeautifulSoup
import requests,sys
import codecs##今日娱乐名人排行榜--百度搜索风云榜  http://top.baidu.com/buzz?b=618&fr=topindex
target='http://top.baidu.com/buzz?b=618&fr=topindex'req=requests.get(url=target)
##很重要,视你得到的网页编码
req.encoding='gb2312'##审查元素后找到人名所在的div
html=req.text
bf=BeautifulSoup(html)
texts=bf.find_all('a',class_='list-title')##创建或打开要写入的文件
f = codecs.open("name.txt",'w','utf-8') ##将娱乐名人排行榜的内容存入文件
for text in texts:
##    print(text.string)f.write(str(text.string+'\r\n'))
f.close()##读取文件验证写入的内容
file =  codecs.open('name.txt','r','utf-8')
lines = file.readlines()
names=[]
for line in lines:names.append(line.strip('\r\n'))print(names) #2.x请将此行改为 print names

结果

python 将百度搜索风云榜的关键内容提取并写入txt文件和读取验证相关推荐

  1. Python爬取百度搜索风云榜实时热点.

    Python爬虫实战源码合集(持续更新) 百度搜索风云榜:http://top.baidu.com/ 源码: import os import json from datetime import da ...

  2. 2019百度搜索风云榜公布:元尊、圣墟、逆天邪神位列前三名

    2019年12月16日,百度官方公布了2019年度百度风云榜各大榜单,其中网络小说榜单前十名单也同时出炉. Top1<元尊>,作者:天蚕土豆 从2019年3月份开始,<元尊>就 ...

  3. Spark Streaming系列-5、应用案例: 百度搜索风云榜

    版权声明:本文为博主原创文章,遵循 CC 4.0 BY-SA 版权协议,转载请附上原文出处链接和本声明. 传送门:大数据系列文章目录 官方网址:http://spark.apache.org/. ht ...

  4. 如何用好百度搜索风云榜?

    1,什么是百度搜索风云榜? 百度搜索风云榜是百度网页搜索中,事件,娱乐,生活等十几种类型的热门搜索内容的集合.百度搜索风云榜能够实时更新当前网友最关注,搜索最热门的内容,保证用户以快速便捷的方式对自己 ...

  5. 今日公益明星排行榜--百度搜索风云榜

    今日公益明星排行榜--百度搜索风云榜 今日公益明星排行榜--百度搜索风云榜 undefined posted on 2014-05-11 20:48 lexus 阅读(...) 评论(...) 编辑 ...

  6. 【Spark分布式内存计算框架——Spark Streaming】10. 应用案例:百度搜索风云榜(中)实时数据ETL存储

    5.3 实时数据ETL存储 实时从Kafka Topic消费数据,提取ip地址字段,调用[ip2Region]库解析为省份和城市,存储到HDFS文件中,设置批处理时间间隔BatchInterval为1 ...

  7. 【Spark分布式内存计算框架——Spark Streaming】9. 获取偏移量 应用案例:百度搜索风云榜(上)

    4.4 获取偏移量 当SparkStreaming集成Kafka时,无论是Old Consumer API中Direct方式还是New Consumer API方式获取的数据,每批次的数据封装在Kaf ...

  8. 百度搜索风云榜 准确吗?

    早就知道百度有个搜索风云榜,地址是:http://top.baidu.com/,但经过几天的观察和Google搜索,感觉绝概率上有很大的出入!看来还得继续观察! 备注:通过分析百度风云榜可以看出全民素 ...

  9. 【Spark分布式内存计算框架——Spark Streaming】11. 应用案例:百度搜索风云榜(下)实时窗口统计

    5.5 实时窗口统计 SparkStreaming中提供一些列窗口函数,方便对窗口数据进行分析,文档: http://spark.apache.org/docs/2.4.5/streaming-pro ...

最新文章

  1. Go 指针,标识符命名规范及关键字
  2. 2013年7月29日周一
  3. Python基础学习01
  4. Spark transformation算子案例
  5. 因特网几个“特殊”IP地址的专门用途
  6. python 基础及资料汇总
  7. mysql数据库学习6_MySQL学习(六)
  8. 如何使用 ggplot2 ?
  9. 计算机系统优化的方法.,20种优化电脑开机速度方法!
  10. aspx 微型_最初的十亿分钟:正在向世界授课的微型非营利组织背后的数字
  11. 量子力学对计算机影响,人们对量子力学的理解有误?
  12. Inspect(VB.NET、C#版)软件的的下载和使用
  13. 计算机控制技术结束语,电子商务在线 - 计算机控制技术教学改革探索与实践
  14. One Pixel Attack(对抗攻击) —— 使用差分进化算法寻找最优解
  15. u-boot使用bootargs给内核传参数
  16. HCIE-RS 论述题 组播
  17. STMCubeMX+Proteus仿真DHT11(LCD1602显示)
  18. Linux目录配置与FHS标准
  19. 企业责任彰显品牌价值,EBC金融集团助力投资者财富增值
  20. ORA-12528: TNS: 监听程序: 所有适用例程都无法建立新连

热门文章

  1. vSphere嵌套式搭建深信服HCI记录
  2. java供应链管理系统_供应链管理系统使用JAVA语言的优势
  3. 计算机组成与系统结构输入输出控制实验,计算机组成与系统结构实验讲稿.ppt...
  4. mysql桥梁模式_桥接模式(Bridge Pattern)
  5. 小程序实现签到打卡功能--用户端
  6. 前端流程图、步骤导向图的设计
  7. 魔众相册系统 v1.2.0 系统内核升级,界面显示优化
  8. 基于java的问卷调查系统(Mysql)
  9. element弹出toast提示窗口
  10. 【转】腾讯OCR—自动识别技术,探寻文字真实的容颜