今天我们一起来聊聊PHP爬虫,如果你还是一位PHP的初学者还不是太了解PHP爬虫,那么我这篇文章很适合你,相信看完本篇文章你会对爬虫说“so easy"。话不多说,直接往下看就完事了。

PHP爬虫初体验

先什么都不说,我们先来看一段代码。<?php

$ch = curl_init('http://www.baidu.com');

curl_exec($ch);

curl_close($ch);

执行一下你会发现结果输出的是百度的页面,没错这就是一个最最最基础的爬虫,其实爬虫也就这三步,第一步初始化一个url,第二步执行,第三步关闭。

最最最基础的爬虫 了解之后,我们开始往下扩展。<?php

$ch = curl_init('https://www.baidu.com');

// 如果是https协议加上下面两句

curl_setopt($ch, CURLOPT_SSL_VERIFYPEER, FALSE); // 对认证证书来源的检查

curl_setopt($ch, CURLOPT_SSL_VERIFYHOST, FALSE); //从证书中检查SSL加密算法是否存在

curl_setopt($ch, CURLOPT_RETURNTRANSFER, 1); //执行成功后不直接输出内容

$content = curl_exec($ch);

curl_close($ch);

var_dump($content);

上面代码注释已经很明白了,需要注意的是curl_exec()执行返回的结果正常情况下是true或false,而为了获取具体的内容我们需要将CURLOPT_RETURNTRANSFER设置为1,这样执行之后就不会直接输出了,我们也能对所获取的数据进行操作。

上面获取页面数据(爬虫)方法其实属于get,那么post应该怎么做呢

PHP爬虫之POST提交(基础)

我们知道提交表单的方式一般是post,那么我们应该利用curl做post提交呢?

首先,我们先自己写一个接收post数据的接口<?php

$arr = $_POST;

echo "接收到的用户名为:" . $arr['username'] . '密码为:' . $arr['password'];

写的很简单(方便初学者理解,一切从简哈),就是将post接收到的数据打印出来。

下面是爬虫代码<?php

$url = 'http://www.test1.wang/post.php';

$data = 'username=K先生&password=123456';

$ch = curl_init($url);

curl_setopt($ch, CURLOPT_HEADER, 0);//不显示响应头

curl_setopt($ch, CURLOPT_RETURNTRANSFER, 1);//执行成功后不直接输出内容

curl_setopt($ch, CURLOPT_POST, 1); //post

curl_setopt($ch, CURLOPT_POSTFIELDS, $data);//提交的数据

$content = curl_exec($ch);//执行

var_dump($content);

自己着手试一试,应该就能明白PHP爬虫是个啥了,有啥问题,记得留言哈。我一定会回复的。

php爬虫post,一起来掌握PHP爬虫(基础篇)相关推荐

  1. php 爬虫_Scrapy 爬虫完整案例-基础篇

    1 Scrapy 爬虫完整案例-基础篇 1.1 Scrapy 爬虫案例一 Scrapy 爬虫案例:爬取腾讯网招聘信息 案例步骤: 第一步:创建项目. 在 dos下切换到目录 D:爬虫_scriptsc ...

  2. 想要学习Python爬虫的你,真的了解爬虫最基础的知识储备吗?

    想要学习爬虫一定要知道爬虫最基础的相关知识储备,从爬虫是什么?爬虫能干什么?爬虫是怎么运行的?等等一起来学习,希望有给小白提供到学习上的帮助. 爬虫定义.分类和流程 http和https 爬虫定义 网 ...

  3. 2个月精通Python爬虫——3大爬虫框架+6场实战+分布式爬虫,包教包会

    2019独角兽企业重金招聘Python工程师标准>>> 阿里云大学在线工作坊上线,原理精讲+实操演练,让你真正掌握云计算.大数据技能. 在第一批上线的课程中,有一个Python爬虫的 ...

  4. Jsoup:用Java也可以爬虫,怎么使用Java进行爬虫,用Java爬取网页数据,使用Jsoup爬取数据,爬虫举例:京东搜索

    Jsoup:用Java也可以爬虫,怎么使用Java进行爬虫,用Java爬取网页数据,使用Jsoup爬取数据,爬虫举例:京东搜索 一.资源 为什么接下来的代码中要使用el.getElementsByTa ...

  5. python爬虫---从零开始(一)初识爬虫

    我们开始来谈谈python的爬虫. 1,什么是爬虫: 网络爬虫是一种按照一定的规则,自动地抓取万维网信息的程序或者脚本.另外一些不常使用的名字还有蚂蚁.自动索引.模拟程序或者蠕虫.互联网犹如一个大蜘蛛 ...

  6. python爬取大众点评评论_python爬虫抓取数据 小试Python——爬虫抓取大众点评上的数据 - 电脑常识 - 服务器之家...

    python爬虫抓取数据 小试Python--爬虫抓取大众点评上的数据 发布时间:2017-04-07

  7. python爬虫招聘-Python爬虫抓取智联招聘(基础版)

    原标题:Python爬虫抓取智联招聘(基础版) 作者:C与Python实战 「若你有原创文章想与大家分享,欢迎投稿.」 对于每个上班族来说,总要经历几次换工作,如何在网上挑到心仪的工作?如何提前为心仪 ...

  8. 从零开始学python网络爬虫-教你从零开始学会写爬虫(Python)

    写爬虫总是非常吸引IT学习者,毕竟光听起来就很酷炫极客,我也知道很多人学完基础知识之后,第一个项目开发就是自己写一个爬虫玩玩. 其实懂了之后,写个爬虫脚本是很简单的,但是对于新手来说却并不是那么容易. ...

  9. 爬虫python需要什么软件-Python爬虫需要学习那些东西?

    基础爬虫过程 基础的爬虫其实很简单的,主要过程就是:发送请求,并获取响应数据: 解析响应数据,获取想要的那部分数据: 存储解析出来的数据: 基础的爬虫事例 比如我们想写一个爬虫程序,自动为我们获取bi ...

  10. python网络爬虫的基本步骤-Python网络爬虫学习手记(1)——爬虫基础

    1.爬虫基本概念 网络爬虫(又被称为网页蜘蛛,网络机器人,在FOAF社区中间,更经常的称为网页追逐者),是一种按照一定的规则,自动地抓取万维网信息的程序或者脚本.--------百度百科 简单的说,爬 ...

最新文章

  1. ICLR 2020将采用远程会议,首次在非洲办会可能就这样泡汤了
  2. Windows 2008远程桌面多用户登陆的配置方法 - z
  3. CommonJS规范(转)
  4. MySql ORDER BY 索引优化
  5. MEF程序设计指南(转)
  6. 一款基于ijkplayer框架的音乐播放器(已开源)
  7. web渗透--rpcbind利用
  8. Ubuntu18.04安装TPlink WDN5200 usb无线网卡驱动
  9. ABBYY FineReader15最新免费下载安装地址激活2020注册机教程
  10. 用python写爬虫 (三)获取数据、requests库
  11. kindle如何设置不闪屏_kindle闪屏怎么解决
  12. 根据UI设计图得到android所需要的dp
  13. 854计算机专业基础,东华大学2019年考研854计算机及软件工程专业基础综合考试大纲...
  14. Java进阶04-动态代理、类加载
  15. 网络编程原理进阶___TCP/IP(javaee)
  16. 讯飞智能录音笔SR502:支持OCR识别功能的职场礼物
  17. Android 彩信发送
  18. GitHub官方介绍(中文翻译)
  19. 人工智能数学基础--概率与统计11:离散随机变量的超几何分布和负二项分布
  20. [华为OD]测试工程师(已过)

热门文章

  1. c++:内联函数详解和普通函数的区别
  2. 计算机操作技能训练心得,计算机基础技能训练报告心得3篇
  3. Windows Server 2012 R2 NAP服务器安装与配置02之 NAP的原理与基础安装 2014-02-25 20:45:53
  4. Python爬虫实战:网易云音乐爬取!
  5. 《免费的在线图片格式转换工具》
  6. TAS5411QPWPRQ1引脚图LP873220RHDRQ1汽车应用开关稳压器
  7. 用AT命令调试调制解调器
  8. AuthorityUtils
  9. 网通服务器网站电信打开卡顿,网络延迟 - 卡饭网
  10. [AHK]为Word增加求和热键,审计求和助手