index.js

/*
const { Chromeless } = require('chromeless');async function run() {const chromeless = new Chromeless();const html = await chromeless// 打开百度.goto('https://www.baidu.com').html();// 打印本地文件路径或者S3 URLconsole.log(html);// 结束await chromeless.end()
}run().catch(console.error.bind(console));
*///const puppeteer = require('puppeteer');
const puppeteer = require('puppeteer-core');
const findChrome = require('./node_modules/carlo/lib/find_chrome');
async function logResponse(res)
{let url = res.request().url();/*if(url.indexOf("/item/134821.html")>0){console.log(url);console.log(await res.text());}*/if(url.indexOf("/list/")>0){console.log(url);console.log(res.request().postData());console.log(await res.json());}
}(async () => {//const browser = await puppeteer.launch();let findChromePath = await findChrome({});let executablePath = findChromePath.executablePath;const browser = await puppeteer.launch({executablePath,headless: true});const page = await browser.newPage();page.on("response",logResponse);/*await page.goto('https://www.zqglink.cn/item/134821.html');await page.waitForSelector("#product-detail");await page.$eval('#product-comment', el => el.click());await page.waitForSelector(".comment-list");const html = await page.$eval('.comment-list', el => el.innerHTML);*/await page.goto('https://www.zqglink.cn/list/');await page.waitForSelector(".pager-container");let pageSize = await page.$eval(".pagesize-selector", el => el.value);console.log(pageSize);await browser.close();
})();

文本框赋值的正确方式

await input_no.click({clickCount: 3});
await input_no.press("Backspace");
await input_no.type("1",{delay:100});

执行:node index.js

chrome headless抓网页相关推荐

  1. 利用Chrome Headless模式网页转PDF

    本文转载于:https://blog.csdn.net/aWDac/article/details/80865754       https://blog.csdn.net/xcl168/articl ...

  2. python chrome headless_[技巧] chrome headless 爬虫抓取websoket 数据

    目录 源起 分析 实践 总结 源起 周末答应了一个朋友帮他看一下一个网站应该怎么爬,费话不说直接先上网站 https://datacenter.jin10.com/price 数据一直在不停的闪,直觉 ...

  3. python chrome headless_实战Chrome Headless数据抓取(上)

    先聊聊数据抓取技术选型 在我看来数据抓取可以分为三种场景: 基本稳定的源站格式或者大量的数据抓取.需要蜘蛛集群调度:使用Java比较方便,可以用WebMagic抓取配合Hadoop调度,如果源站经常改 ...

  4. 反爬虫——使用chrome headless时一些需要注意的细节

    以前我们介绍过chrome headless的用法(https://www.cnblogs.com/apocelipes/p/9264673.html). 今天我们要稍微提一下其中一个细节. 反爬和w ...

  5. python selenium 用法 和 Chrome headless

    From: http://cuiqingcai.com/2599.html Selenium教程:https://www.yiibai.com/selenium selenium 官方参考文档:htt ...

  6. chrome headless php,chrome headless+php实现打印pdf服务

    前言 之前的项目做过浏览器某个页面打印成pdf的服务,所用的是tcpdf这个包,大概思路就是后台写一套跟页面一样的html模版,打印的时候把数据渲染进去,不好的地方在于所见非所得,你得花大把的时间去做 ...

  7. chrome headless截图

    Headless Chrome Headless Chrome 是 Chrome 浏览器的无界面形态,可以在不打开浏览器的前提下,使用所有 Chrome 支持的特性运行你的程序.相比于现代浏览器,He ...

  8. 在Chrome中打开网页时出现以下问题 您的连接不是私密连接 攻击者可能会试图从 x.x.x.x 窃取您的信息(例如:密码、通讯内容或信用卡信息)

    现象:在Chrome中打开网页时出现以下问题 您的连接不是私密连接 攻击者可能会试图从 x.x.x.x 窃取您的信息(例如:密码.通讯内容或信用卡信息). 当点开"了解详情"后显示 ...

  9. Ubuntu 无界面使用selenium chrome + headless

    Ubuntu 无界面使用selenium chrome + headless 1. 安装 selenium : sudo pip install selenium 2. 安装 chromdriver: ...

最新文章

  1. PowerDesigner导入MySQL数据库表
  2. Faster R-CNN教程
  3. 操作系统:第二章 进程管理3 - 进程同步与互斥
  4. Windows 容器
  5. Android 要收费?周鸿祎:这是迟早的事!
  6. python和lua哪个有前途_python和lua数据类型的比较
  7. 软件 规则引擎_如何设计软件规则引擎
  8. 《微观经济学》第六章供给、需求与政府政策
  9. Unable to find gradle task to build
  10. python偶数数列求和_Numpy 斐波纳契数列求和
  11. 浅谈交易开拓者程序化
  12. PythonScript_003_通过Cookie模拟登陆人人网
  13. 龙门标局:白炽灯商标转让所在的类别属于第几类?
  14. context 简介
  15. Pycharm自定义更换背景图,来给代码加个PS~~~
  16. 实现登录与注册界面(1号店)
  17. 苹果计算机手机号隐藏功能,苹果手机隐藏功能大全
  18. 【word 2019 for Mac实用教程】word文档如何去除页眉横线?
  19. 计算机网络做网线,用网线直接把两台电脑联接,怎样做网线
  20. 腾讯云轻量应用服务器卡死怎么连接?

热门文章

  1. 苹果Mac 30周年:那些改变世界的人和Mac电脑
  2. java创建list指定长度_java List 按指定长度分割
  3. 固定table中的TH的高度和TD的宽度
  4. C语言:指针与指针变量
  5. 开曼、BVI等离岸公司为什么都选择开新加坡银行账户
  6. 惯导IMU和惯导INS
  7. 从技术走向管理(李元芳履职记)--摘抄总结
  8. 开机出现 NTLDR is Missing 的解决方法
  9. 【秋招计划】 15日~18日重邮秋季校园招聘宣讲会计划
  10. 微信小程序——富文本