php抓取网指定内容,php获取网页内容方法总结
抓取到的内容在通过正则表达式做一下过滤就得到了你想要的内容,至于如何用正则表达式过滤,在这里就不做介绍了,有兴趣的,以下就是几种常用的用php抓取网页中的内容的方法。
1.file_get_contents
PHP代码
复制代码代码如下:
$url="http://www.jb51.net";
$contents=file_get_contents($url);
//如果出现中文乱码使用下面代码
//$getcontent=iconv("gb2312","utf-8",$contents);
echo$contents;
?>
2.curl
PHP代码
复制代码代码如下:
$url="http://www.jb51.net";
$ch=curl_init();
$timeout=5;
curl_setopt($ch,CURLOPT_URL,$url);
curl_setopt($ch,CURLOPT_RETURNTRANSFER,1);
curl_setopt($ch,CURLOPT_CONNECTTIMEOUT,$timeout);
//在需要用户检测的网页里需要增加下面两行
//curl_setopt($ch,CURLOPT_HTTPAUTH,CURLAUTH_ANY);
//curl_setopt($ch,CURLOPT_USERPWD,US_NAME.":".US_PWD);
$contents=curl_exec($ch);
curl_close($ch);
echo$contents;
?>
3.fopen->fread->fclose
PHP代码
复制代码代码如下:
$handle=fopen("http://www.jb51.net","rb");
$contents="";
do{
$data=fread($handle,1024);
if(strlen($data)==0){
break;
}
$contents.=$data;
}while(true);
fclose($handle);
echo$contents;
?>
注:
1.使用file_get_contents和fopen必须空间开启allow_url_fopen。方法:编辑php.ini,设置allow_url_fopen=On,allow_url_fopen关闭时fopen和file_get_contents都不能打开远程文件。
2.使用curl必须空间开启curl。方法:windows下修改php.ini,将extension=php_curl.dll前面的分号去掉,而且需要拷贝ssleay32.dll和libeay32.dll到C:WINDOWSsystem32下;Linux下要安装curl扩展。
您可能感兴趣的文章:thinkphp3.x中变量的获取和过滤方法详解php完全过滤HTML,JS,CSS等标签php过滤HTML标签、属性等正则表达式汇总php安全过滤函数代码PHP对表单提交特殊字符的过滤和处理方法汇总过滤掉PHP数组中的重复值的实现代码PHP屏蔽过滤指定关键字的方法php获取数组长度的方法(有实例)php自动获取字符串编码函数mb_detect_encodingphp获取post中的json数据的实现方法php如何获取数组第一个值php通过两层过滤获取留言内容的方法
php抓取网指定内容,php获取网页内容方法总结相关推荐
- python爬虫搜特定内容的论文_python基于BeautifulSoup实现抓取网页指定内容的方法...
python基于BeautifulSoup实现抓取网页指定内容的方法 更新时间:2015年07月09日 10:12:50 作者:光索与诺 这篇文章主要介绍了python基于BeautifulSoup实 ...
- php 正则抓取页面内容_PHP_php获取网页内容方法总结,抓取到的内容在通过正则表达 - phpStudy...
php获取网页内容方法总结 抓取到的内容在通过正则表达式做一下过滤就得到了你想要的内容,至于如何用正则表达式过滤,在这里就不做介绍了,有兴趣的,以下就是几种常用的用php抓取网页中的内容的方法. 1. ...
- php正则抓取网页指定内容,php正则匹配获取指定url网页页面超级链接地址与抓取指定页面内容方法...
在数据采集与页面分析中,常需要抓取给定url页面的内容,或者第二.第三层次深度页面内容. 这里是一个测试例子的实现,仅供参考. /* 匹配给定页面链接 return:array match[link, ...
- PHP抓取网页指定内容(推荐用CURL效率更高)
PHP抓取某页面指定内容 初学php研究了好几个小时最后问了同事,得以解决:下面我就以我网站的一个详情页为例子,给大家分享一下: 直接贴代码,注释写的很清楚了 [方法一] <?php //添加编 ...
- PHP:抓取网页指定内容
效果图 代码 <?php $url = "http://要抓取的网页"; $contents = file_get_contents($url); //如果出现中文乱码使用下 ...
- 抓取html的内容,js获取网页选中内容(包含html代码)
例子,js获取网页选中的内容. 复制代码 代码示例: function getSelectedContents(){ if (window.getSelection) { //chrome,firef ...
- python爬虫网易云音乐最热评论并分析_Python3实现爬虫抓取网易云音乐的热门评论分析(图)...
这篇文章主要给大家介绍了关于Python3实战之爬虫抓取网易云音乐热评的相关资料,文中通过示例代码介绍的非常详细,对大家的学习或者工作具有一定的参考学习价值,需要的朋友们下面随着小编来一起学习学习吧. ...
- 使用爬虫抓取网易云音乐热门评论生成好玩的词云
互联网爬虫是一个很有意思的技术,借由爬虫,我们可以做到很多好玩的事情--这其中就包括爬取评论. 词云就是个更好玩的技术,通过技术方法分析词语出现频率,生成可视化的图形,将文字内容用图形呈现,想想就很意 ...
- Python3爬虫抓取网易云音乐热评实战
前一段时间刚刚入门python爬虫,有大概半个月时间没有写python了,都快遗忘了.于是准备写个简单的爬虫练练手,我觉得网易云音乐最优特色的就是其精准的歌曲推荐和独具特色的用户评论,于是写了这个抓取 ...
最新文章
- 常见的ORACLE锁模式汇总
- 探索 OpenStack 之(10):深入镜像服务Glance
- 选择 SAP Spartacus 作为 SAP Commerce Cloud Storefront 实现框架的五个理由
- BOMHEAD display issue
- 容器化分布式日志组件ExceptionLess的Angular前端UI
- 将英文的week 转换为中文的 简单的方法
- JavaScript执行bat文件清理浏览器缓存
- DNS无法解析IP_通过YouTube的封杀窥视DNS原理
- office 2007插入带圈字符
- 计算机桌面图标损坏,win7系统的电脑桌面图标受到损坏要如何修复
- 计算机修理工具包价格,电脑修复工具包#200多个联想工程师专用电脑修复小工具打包...
- 2021.09.17 word文档撤销按钮变灰,快捷键失效解决办法
- 基于PHP课程网站设计开题报告,在线课程网站设计开题报告
- 基于Java实现的定时给微信好友发送消息
- CVPR 2021 | 腾讯优图20篇论文入选,含人脸识别、时序动作定位、视频动作分割等领域...
- 获得淘宝商品详情高级版api接口
- cufflinks suit
- akoj-1291-决战21点(C#)
- 河南2021年高考成绩位次查询,河南高考成绩位次排名查询2020,河南高考一分一段表...
- 互联网晚报 | 爱奇艺回应因限制投屏被起诉事件;“鱼跃医疗”回应被罚270万元;2022年全国城市GDP十强全部出炉...