失眠网,内容丰富有趣,生活中的好帮手!
失眠网 > php 关于循环的有关问题!(采集网页内容)

php 关于循环的有关问题!(采集网页内容)

时间:2021-11-26 07:35:28

相关推荐

php 关于循环的有关问题!(采集网页内容)

后端开发|php教程

nbsp,GET,130000,amp,while

后端开发-php教程

php 关于循环的问题!(采集网页内容)

我在做论坛内容采集小程序,

本来是这样挑战网页采集的

if ($_GET[id]<=130000 && $_GET[id]){

$url=”/thread-“.$_GET[id].”-1-1.html”;

html5网站模板源码,vscode 终端 报错,三星s3安装ubuntu,tomcat运行编码,sqlite更新表数据,文字转换语音插件,web前端ui框架 知乎,爬虫饲养箱怎么制作,搭建php,金华网络seo,网站图片滚动,网页上的表格背景色,dedecms 默认文章模板lzw

但是为了方便 我用了while循环 这样

$p=0;

while($p<=130000){

$url=”/thread-“.$p.”-1-1.html”;

$p++;

防红源码php,vscode单击新tab,ubuntu 16 休眠,指定tomcat启动jdk,sqlite建多数据库,爬虫从初级到中级最快需要多久,php 扩展 源码,贵阳seo引擎优化方法,明日系统网站,织梦软件网站模板下载lzw

问题就出现了,每次遇到被删除的空页面 他也会内容采集到数据库内

用if ($_GET[id]<=130000 && $_GET[id])的时候遇到被删除的空页面是直接跳过去的,

用了while 或者 for循环遇到被删除的空页面就出现这样的问题

图:遇到空页面就直接把上一页内容复制进去,比如 第13个帖子有内容,不过第14到17个帖子是被删除的空页面,它就会把13个帖子的内容加到这些里面去,后面也差不多!

语音聊天室程序源码,应用商店下载ubuntu,tomcat7.0如何停止,防爬虫妙招,php会员用券源码,colorado seolzw

用if ($_GET[id]<=130000 && $_GET[id])的时候遇到被删除的空页面是直接跳过去的

13个帖子后面还几个都没有内容,所以直接跳过去,到第22个帖子 这样

我就想要这样的效果

用的是

if (strlen($txt) > 5)//内容大与5个字符采集到数据库

{

$db->insert(“INSERT INTO bbs_caiji (col_date,title,txt,url,type,source) VALUES (‘”.$col_date.”‘,”.$title1.”‘,”.$txt.”‘,”.$url.”‘,’BBS’,’misranim’)”);

}

为什么用while和for循环就出现这种问题呢?

——解决思路———————-

应该不会出现你说的现象

——解决思路———————-

代碼不完整,只看提供的代碼是沒有問題的。

每次循環後,都把$txt清為空試試。

如果觉得《php 关于循环的有关问题!(采集网页内容)》对你有帮助,请点赞、收藏,并留下你的观点哦!

本内容不代表本网观点和政治立场,如有侵犯你的权益请联系我们处理。
网友评论
网友评论仅供其表达个人看法,并不表明网站立场。