爬取泡面小镇每日第一条新闻

# -*- coding: utf-8 -*-
"""
Created on Thu Feb 21 15:14:43 2019@author: Administrator
"""
from selenium import webdriver
import time
import re
#打开浏览器和网页
dr=webdriver.Chrome()
dr.get('http://www.pmtown.com/archives/category/%E6%97%A9%E6%8A%A5') #获取泡面早报链接
xpath='//*[@id="wrap"]/div/div/div/ul/li[1]/div/h2/a' #早报第一条链接
dr.find_element_by_xpath(xpath).click()
#进行 xpath 整合
time.sleep(5)
sreach_window=dr.window_handles #获取所有打开的窗口
dr.switch_to_window(sreach_window[-1])   #获取最后一个窗口
url=dr.current_url
com_id = re.match(".*archives/(\d+)", url) #读取链接的数字
#print( com_id.group(1))
xpath1='//*[@id="post-%s"]/div/div[2]' %str(com_id.group(1)) #替换数字
print(dr.find_element_by_xpath(xpath1).text)
dr.quit()    

爬取泡面小镇每日第一条新闻相关推荐

  1. 爬取网易云音乐两万条评论储存在MySQL服务器上

    爬取网易云音乐两万条评论储存在MySQL服务器上 最近在公司实习,无聊时看看别人的博客,发现平时学习写写博客是一个很好的学习方法,报平时一些自己写的代码保存下来,遇到的错误踩到的坑也拿出来分享也可也帮 ...

  2. Python爬虫,爬取快看漫画每日更新模块

    文章目录 前言 一.爬虫是什么? 二.使用步骤 1.引入库 2.文件夹准备 3.将列表存储为txt格式文件 4.爬取每日更新页面具体代码: 5.运行结果 总结 前言 根据基本的爬虫知识,爬取快看漫画每 ...

  3. python爬取小说章节_python之如何爬取一篇小说的第一章内容

    现在网上有很多小说网站,但其实,有一些小说网站是没有自己的资源的,那么这些资源是从哪里来的呢?当然是"偷取"别人的数据咯.现在的问题就是,该怎么去爬取别人的资源呢,这里便从简单的开 ...

  4. sql 取重复key中的第一条_SQL每日一题

    写在前面 SQL每日一题是用牛客网的sqlite库的题目进行深度讲解(感觉进度慢的小伙伴可以自行前往刷题),这个系列要开启日更计划,每日一题,一起进步学习. 题目描述 查找最晚入职员工的所有信息,为了 ...

  5. 爬取了 B 站上的 17398 条评论,分析这部二次元番剧为何受到技术宅的追捧?

    这是一篇送给技术宅的福利. 作者 | 量化小白H 责编 | 郭芮 7月番<工作细胞>最终话在十一前放出.这部动漫在B站上评分高达9.7.除了口碑之外,热度也居高不下,更值得关注的是连很多平 ...

  6. 小伙子不讲武德,竟用Python爬取了B站上1.4w条马老师视频数据来分析

    点击上方蓝色小字,关注"涛哥聊Python" 重磅干货,第一时间送达 来源:凹凸数据 看到标题, 啪的一下你就进来了吧! 如果有经常刷B站的小伙伴,肯定都知道B站鬼畜现在的顶流是谁 ...

  7. 关于《后浪》的B站弹幕分析总结(一)——爬取B站视频的上万条弹幕的方法

    目录 一.先尝试爬取1000条 1 .1 查找弹幕所在地址 1.2 代码实现 二.1000条不够我想要更多怎么办? 三.B站弹幕文件里的其他信息有用吗? 注意:这是一篇技术类文章 前几天我做了B站&l ...

  8. Python3爬虫新手项目详解:爬取豆瓣读书的前50条评论内容并显示评分。提示:有的评论不包含评分

    爬取<三体>,相关网页内容如下: https://book.douban.com/subject/2567698/comments/hot?p=1 开始之前我们先明确一下爬虫的基本步骤: ...

  9. requests+selenium 爬取企查查网,1000+条数据轻轻松松

    对于这个我们就很简答了, 我们需要获取公司的具体链接 我们根据如下链接去爬取公司的具体链接: https://blog.csdn.net/qq_44936246/article/details/120 ...

最新文章

  1. python检查列表是否为空_Python 中判断列表是否为空的方法
  2. Linux命令: grep命令
  3. CodeForces - 125C Hobbits' Party(思维+构造)
  4. php怎么解决雪崩或穿透,Redis之缓存击穿、穿透、雪崩、预热,以及如何解决?...
  5. python 判断子序列_Leetcode练习(Python):第392题:判断子序列:给定字符串 s 和 t ,判断 s 是否为 t 的子序列。...
  6. 带你读AI论文丨用于细粒度分类的Transformer结构—TransFG
  7. android json字符串转成json对象_【hive】解析JSON格式字符串
  8. linux下使用SSH实现端口映射
  9. android 歌词 开源,NLyric 网易云音乐歌词自动搜索下载【开源】
  10. applyTo、renderTo 区别
  11. Windows使用Dism备份操作系统快捷命令 系统备份
  12. 全国城市-拼音-编号Json数据(只城市)
  13. 图解图论介绍及应用(1):哥尼斯堡七桥
  14. FX:{6630f2d7-bd52-4072-bfa7-863f3d0c5da0}
  15. 像FIFA一样踢球的AI,比打游戏更强吗?
  16. 【毕设选题推荐】机器人工程专业毕设选题推荐
  17. Flutte 之TextFile(文本输入框)
  18. Windows中文键盘消失
  19. 王杰律师出席“2009软件开发2.0技术大会”
  20. HX/VSAN超融合技术学习笔记

热门文章

  1. 4412 构造数组(区间合并)
  2. Netjava project 简单画板的实现
  3. 通过Cloudreve+云服务器快速搭建一个私人云盘
  4. Android NDK 使用skia
  5. vue使用marked解析markdown文本遇到的坑及解决方法
  6. 输入【ionic start myApp tabs】命令创建项目时失败
  7. 体育教学与计算机技术的结合点,浅析计算机技术在高校体育教学中的应用
  8. STM32入门-区别ORD,BSRR,BRR寄存器
  9. STM32 GPIO BRR和BSRR寄存器
  10. python中模块是什么意思_Python中的模块是什么?3分钟搞懂Python中的模块问题