/**

* 爬虫逻辑

* 获取html内容

*/

public function crawler($centent_url)

{

//https://www.xiaohongshu.com/discovery/item/5a4ca319a7c9b8481ea24c7e?_at=36df0d880cae739ee71e7e94174a6d7c70351

//接收内容源地址

$request = $centent_url;

$html = $this->getUrlContent($request);

// print_r($html);exit;

$relwvantart = array();

//获取div随机码

preg_match_all("/class=\"content\" data-v-(.*)>/iUs",$html,$temp_variable,PREG_PATTERN_ORDER);

$variable = $temp_variable[1][0];

// $variableimg = $temp_variable[1][1];

// print_r($variableimg);exit;

//获取文章主要内容

preg_match_all("/class=\"content\" data-v-".$variable.">(.*)

// $temp_content = $content[1][0];

$temp_content = "

".$content[1][0]."

";

// print_r($temp_content);exit;

//获取文章内容里的图片编号

preg_match_all("/class=\"cell image-cell\" data-v-(.*) data-v-".$variable.">/iUs",$html,$temp_variable_img,PREG_PATTERN_ORDER);

$temp_contentimg = $temp_variable_img[1][0];

// print_r($temp_contentimg);exit;

//内容里的图片处理

preg_match_all("/img src=\"(.*)\" data-v-".$temp_contentimg.">/iUs",$temp_content,$temp_img,PREG_PATTERN_ORDER);

$temp_img = $temp_img[1];

// print_r($temp_img);exit;

if(!empty($temp_img)){

//处理图片路径

//图片下载到本地,获取返回的图片路径

$temp_content_img = array();

foreach ($temp_img as $k => $v){

$temp_v = str_replace('//','https://',$v);

$res = $this->crabcontentImg($temp_v);

$temp_content_img[$k] = $res['save_path'];

}

//将内容里的图片路径替换成oss上的图片路径

foreach ($temp_content_img as $key => $value){

$temp_content = str_replace($temp_img[$key],$value,$temp_content);

}

//获取缩略图板块内容

preg_match_all("/

/iUs",$html,$temp,PREG_PATTERN_ORDER);

$img_url = $temp[1][0];

$img_url = str_replace('//','https://',$img_url);

$res = $this->crabImage($img_url);

$imgurl = $res['save_path'];

// print_r($imgurl);exit;

$relwvantart['img'] = $imgurl;

}

// print_r($content);

// print_r(base64_encode($content));exit;

$relwvantart['content'] = base64_encode($temp_content);

//获取文章标题

preg_match_all("/

(.*)/iUs",$html,$title,PREG_PATTERN_ORDER);

$title = $title[1][0];

$relwvantart['title'] = $title;

if (empty($title)){

//获取meta里的description当标题

preg_match_all("//iUs",$html,$desc,PREG_PATTERN_ORDER);

$desc = $desc[1][0];

$relwvantart['title'] = $desc;

}

//获取缩略图板块内容

preg_match_all("//iUs",$html,$temp,PREG_PATTERN_ORDER);

$tempicon = $temp[1];

// print_r($tempicon);exit;

$img_url = array();

//图片路径处理

foreach ($tempicon as $k => $v){

$img_url[$k] = str_replace('(','https:',$v);

}

foreach($img_url as $key => $value){

$img_url[$key] = str_replace(')','',$value);

}

//将图片保存在本地并上传oss

foreach ($img_url as $i => $j){

$res = $this->crabImage($j);

// print_r($res);exit;

$imgurl[$i] = $res['save_path'];

}

// print_r($res);

$relwvantart['img'] = $imgurl;

return $relwvantart;

}

php小红书,【小红书逻辑PHP面试题】面试问题:PHP小红书文… - 看准网相关推荐

  1. 多线程可以使用计算机多核那,【多线程逻辑面试题】面试问题:异步操作的优缺… - 看准网...

    我曾经提到异步操作能提高系统的吞吐能力,正确使用异步操作来校正滥用异步的错误做法,那异步究竟有何优点值得我们使用?而又有什么缺点需要我们使用的时候小心呢?诚如老赵所说, 异步并不一定能提高系统性能,甚 ...

  2. java砍价算法逻辑,【拼多多算法数据库面试题】面试问题:拼多多砍价算法… - 看准网...

    拼多多的砍价,邀好友进行砍价,想必大家对这个不会陌生.作为一个程序员来说比较好奇它的每个人能砍的价格是如何实现的.根据经验来看,一般是前几个能砍的价格是比较高的.而后来的好友基本上能砍的价格是微乎其微 ...

  3. 3.2 搞懂小红书算法运营逻辑,只需要5分钟【玩赚小红书】

    在讲这个之前,我们先来看一下「小红书」平台都有哪个几个流量入口,对应的不同流量入口,平台所应用的推荐机制分别是什么样的? 如图,从目前小红书APP的设定来看, 流量主要集中在打开APP中的「发现页」和 ...

  4. 1022场小红书品牌带货直播数据复盘,双11小红书直播间投放策略

    今年4月才入驻小红书的个护国货品牌诗裴丝洗发水通过小红书直播获得快速爆发,直播带货销量占比持续稳定占总量约70%.直播商家的核心是人.货.场.诗裴丝在小红书直播间选择上究竟有何独到之处? ▌ 小红书直 ...

  5. 小红书爆款笔记推送周期是多久?做小红书是视频好还是图文好

    大家好!今天给大家分享的是小红书爆款笔记推送周期是多久.做小红书肯定是希望出爆款笔记,尤其是对于品牌方或商家来说,爆款笔记的引流效果那肯定是很好的.那这种爆款笔记推送周期是多久呢?一旦爆了热度能持续多 ...

  6. 【报告分享】小红书·新消费浪潮下的决策价值之地-小红书(附下载)

    摘要:现在的小红书和几年前大家所认识的--一个女性用户为主的美妆社区有了很大的不同,小红书的男性用户正在飞速增长.此外,小红书年轻用户的集中度较高,90后用户达到70%:一二线城市的用户的占比达到50 ...

  7. 2.15 这样的小红书图片内容,最容易“踩雷”!【玩赚小红书】

    1.笔记中所有图片只展示一件单品 这类内容有可能会被系统判定为广告,或被用户怀疑为软广而举报.据介绍,小红书平台上的用户对软广的接受度较低,这类内容时常因为被举报而限流. 小红书引入"生态官 ...

  8. 基于hadoop的小红书电商网站用户行为分析系统毕业论文+任务书+开题报告+答辩PPT+知网查重报告+项目源码及Mysql数据

    基于hadoop的小红书电商网站用户行为分析系统毕业论文+任务书+开题报告+答辩PPT+知网查重报告+项目源码及Mysql数据库-99源码网,程序代做,代写程序代码,代写编程,代写Java编程,代写p ...

  9. 云媒易:怎么做小红书推广?如何写出吸引人的优质小红书内容?

    在粉丝经济时代,小红书是很多年轻女性群体中非常热门的一个软件.很多企业在进行营销宣传时都会选择小红书进行推广,促进销量提升,但在小红书推广的过程中需要有合理的方案和流程,这样出来的营销效果才会更好.那 ...

最新文章

  1. [LeetCode] Longest Palindromic Substring
  2. 图(1)——图的定义和基本概念
  3. Matplotlib绘图库初探
  4. MyEclipse将Java项目打包成jar文件的三种方法
  5. MySQL按时间查找
  6. suse zypper 添加源
  7. nginx配置详解(转)
  8. imos 学习笔记四 录像 c#
  9. Visual Studio 2010 (ASP.Net 4.0)新功能一览(转载)
  10. QQ互联开发者信息认证
  11. JS实现双十一倒计时抢购效果
  12. python3爬虫实战姚良_Python3.X 爬虫实战(缓存与持久化)
  13. 去除word转pdf时的图片黑边
  14. 按文件名批量分类文件到文件夹
  15. 二维动态规划降维误差一般为多少_数学建模常用算法模型
  16. 关于企业能源管控平台在轧钢行业能源管理中的应用
  17. linux内核工程导论,Linux内核工程导论–网络:TCP:netlink与tcp_diag编程
  18. 地下管线探测仪的原理与性能——TFN T-6000地下管线探测仪
  19. 关于死锁你了解多少,通过“让APP随手机壳改变颜色,程序员和产品经理大家”这一事,了解下死锁可好?
  20. 《Docker技术入门与实战》——3.8 本章小结

热门文章

  1. SAP价值流程帮助请求流程-011
  2. 解决金山急救箱在安全模式下无法显示“立即处理”按钮的问题
  3. 应用统计学与R语言实现学习笔记(九)——线性回归
  4. 九九乘法表上面有横线c语言,25 循环实战,打印九九乘法表 - C 语言基础教程
  5. java crashhandler_App crash原因以及解决办法
  6. Tyvj P1048 田忌赛马 题解
  7. 【推荐】不是打广告,个人觉的不错哦
  8. JAVA蘑菇西餐,今天为大家推荐一道非常好吃的西餐,蘑菇鸡扒
  9. 教育心理学期末备考【更新】
  10. 程序员去国企面试,看到工作环境后:给多少工资也不去,评论炸锅