可以先用这个采集然后在用帝国处理

####################################################################################

#作者:9elong

#网站:个人小站不值一提

#时间:2007-01-01

#声明:仅用于学习php之用。

#功能:采集单页面图片。

#说明:3个示范表单已经写好正则用来示范。没有任何功能说明,一切都在源代码里。附加论坛图片采集正则示范

####################################################################################

//把图片从信息页抓取下来的函数

functiongetimg($url,$n,$key,$imgqian,$imgbiao,$titlekey)

{

//$key图片地址正则

//$titlekey图片标题正则

//$imgqian图片地址前缀

//$imgbiao图片地址特殊标识

global$n;

global$msg;

global$result;

global$imgadd;

global$title;

$msg=file_get_contents($url);

$key=str_replace("{图片地址}","(.+)",$key);

$key="|".$key."|isU";

preg_match_all($key,$msg,$result);

$c=count($result[0]);

for($i=0;$i

{

$img=$result[0][$i]."
";

if(ereg("^.*".$imgbiao.".*$",$img))

{

$img=str_replace($imgbiao,$imgqian.$imgbiao,$img);

preg_match("|http://(.+)jpg|isU",$img,$img);

$imgadd[$n]=$img[0];

//echo"
";

$n++;

}

elseif(ereg("^.*jpg.*$",$img))

{

preg_match("|http://(.+)jpg|isU",$img,$img);

$imgadd[$n]=$img[0];

if($img[0]!="")

$n++;

}

unset($img);

}

$titlekey=str_replace("{图片标题}","(.+)",$titlekey);

$titlekey="|".$titlekey."|isU";

preg_match($titlekey,$msg,$title);

//echo$title[0];

return$title;

return$msg;

return$result;

return$n;

return$imgadd;

}

####################################################################################

#不支持file_get_contents()函数可以使用下面的替换

#$i=0;

#$handle=@fopen($url,"rb");

#while(!@feof($handle))

#{

#$buffer[$i]=@fgets($handle,4096);

#$i++;

#}

#fclose($handle);

#$msg=join("",$buffer);

####################################################################################

if($_GET['act']=="getimgadd"&&$_POST['url']!="")

{

$url=$_POST['url'];

getimg($url,"0",$_POST['key'],$_POST['imgqian'],$_POST['imgbiao'],$_POST['titlekey']);

####################################################################################

//获取分页

if($_POST['getpage']=="是")

{

$_POST['page']=str_replace("{分页地址}","(.+)",$_POST['page']);

$page="|".$_POST['page']."|isU";

//echo$page;

preg_match_all($page,$msg,$presult);

if($_POST['pc']==""||$_POST['pc']=="全部")

$pc=count($presult[0]);

else

$pc=$_POST['pc'];

if($_POST['pc']>count($presult[0]))

$pc=count($presult[0]);

for($i=1;$i

{

$pageurl=$presult[0][$i];

//echo$pageurl."
";

if(ereg("^.*[1-9].*$",$pageurl))

{

$pageurl=str_replace("

$pagekey=str_replace("{关键地址}","(.+)",$_POST['pagekey']);

$pagekey="|".$pagekey."|isU";

preg_match($pagekey,$pageurl,$N3[$i]);

//echo($N3[$i][0])."
";

getimg($N3[$i][0],$n,$_POST['key'],$_POST['imgqian'],$_POST['imgbiao'],$_POST['titlekey']);

}

}

}

####################################################################################

echo"图片集〖".$title[1]."〗".$n."张图片被抓取返回首页
";

while(list($num,$var)=each($imgadd))

{

if($_POST['showtype']=="图片")

{

echo"
";

}

else

echo$var."
";

}

####################################################################################

//exit();

}

?>

实例1(信息页有分页,使用了简单的分页正则):

输入图片地址

图片地址正则'>

图片地址前缀

图片地址标识

图片标题正则{图片标题}

'>

初级php代码写注册,初级的用php写的采集程序相关推荐

  1. html5 密码加密,1、5 写注册的后台并写前台html密码加密id 随机

    1 public void save(Student student) { // TODO Auto-generated method stub student.setSid(UUID.randomU ...

  2. [PHP初级]手把手教你写注册程序 3

    [PHP初级]手把手教你写注册程序 3 数据的保存 如何选择操作数据库的API 流程总览 事务处理(Transaction) 数据库的准备 连接数据库 插入数据 例外 链接 输入界面以及取得输入信息请 ...

  3. php注册程序,[PHP初级]手把手教你写注册程序 1

    [PHP初级]手把手教你写注册程序 1 实例内容 在此教程,我们将通过写一个用户注册程序,学习以下内容: 数据的传输与获取 信息的验证 pdo方式操作数据库 事务处理 前台显示文件:index.php ...

  4. [PHP初级]手把手教你写注册程序 2

    [PHP初级]手把手教你写注册程序 2 信息的验证 为什么要验证输入信息? 验证 显示错误信息 链接 输入界面以及取得输入信息请看第一章 信息的验证 这一章说信息的验证. 为什么要验证输入信息? 验证 ...

  5. [PHP初级]手把手教你写注册程序 1

    [PHP初级]手把手教你写注册程序 1 实例内容 前台显示文件:index.php 后台控制文件:process.php 数据的传输及获取 链接 实例内容 在此教程,我们将通过写一个用户注册程序,学习 ...

  6. 软件测试代码很难?手把手教你写出阿里巴巴注册界面

    那么今天的话呢,带大家来学习的是三个内容 文章首发于公众号:程序员阿沐 本节大纲: 01.认识HTML 02.表单的运用 03.阿里巴巴注册界面的实现 我们要去实现阿里巴巴注册界面,一个前端界面. 我 ...

  7. 几行VB代码拿下注册表

    '****************************注册表操作函数********************** '声明:以下代码由轻风工作室REDICE编写,引用时请作一说明. '******* ...

  8. 计算机操作员初级理论知识试卷3,初级计算机操作员理论知识试卷.doc

    初级计算机操作员理论知识试卷.doc 初级计算机操作员理论知识试卷( 技校2012年第 批) 考生姓名 考试日期 得分 第一题 单项选择题(每题2分,共60分)1.在购买计算机时,"Pent ...

  9. [原创]VB注册机独辟蹊径-----注册机也可以这样写

    近段时间接了个项目,是关于一个称重传感器的上位机系统,需要一机一码针对不同的客户机分别注册,第一次注册完后,下次打开后不必注册. 刚开始想用正规的注册机办法去完成,搜罗了半天,发现现在大部分的硬盘注册 ...

最新文章

  1. angular父组件通过@ViewChild 主动获取子组 件的数据和方法
  2. 自动化监控--zabbix中的show value详解
  3. python化学题_中国大学mooc《化学教学论(朱汝葵 陈思静 汤希雁)》考试期末答案高校邦《Python程序设计基础【实境编程】》课后作业答案...
  4. C++实现斐波那契查找(附完整源码)
  5. C#找出数组中重复次数最多的数值
  6. 清华大学2008年硕士生招生参考书目录
  7. SpringBoot整合JWT实现前后端Token验证
  8. 应用时间序列分析——有季节效应的非平稳序列分析-ARIMA加法模型-R语言
  9. 504PHP,php504错误怎么解决_后端开发
  10. 5.庆功会-多重背包
  11. 【转】由滤波器系数绘制尺度函数和小波函数图像的Matlab程序
  12. 关于堡垒机的原理以及如何配置
  13. 浙大PAT 1003题 1003. Emergency
  14. android教程丿it教程网,[IT教程吧-www.itjc8.com]_Da类android视频
  15. 如何使用Mojave将APFS卷上的MacOS Catalina Beta安装到双引导
  16. Java如何创建项目
  17. VB.net 微信公众平台开发(一) Token验证
  18. 原创|批处理|批处理一键生成指定范围的MAC地址
  19. 淘宝网前端开发面试题
  20. linux天文软件下载,天文绘图软件(SkyChart)

热门文章

  1. MOOC 哈工大苏小红C语言 第四周在线编程
  2. 【微电网优化】基于matlab YALMIP求解微网(光伏+风电+蓄电池+微电网+柴油机)优化调度问题【含Matlab源码 2266期】
  3. 幻 X-ACRNM RMT02 二合一笔记本 评测 幻 X-ACRNM RMT02 参数配置
  4. 新书推荐《财务数据治理实战》
  5. python异常(虫师《selenium3自动化测试实战--基于Python语言笔记7》)
  6. Utils(一) 介绍
  7. socket.io介绍
  8. MVC中数据传递 ViewBag的使用
  9. border英文缩写_CSS 编码规范
  10. “FME 博客周年庆--IPAD欢乐送”活动结束通知