失眠网,内容丰富有趣,生活中的好帮手!
失眠网 > php 实现信息采集(网页内容抓取)程序代码

php 实现信息采集(网页内容抓取)程序代码

时间:2023-04-27 15:43:54

相关推荐

php 实现信息采集(网页内容抓取)程序代码

php 实现信息采集(网页内容抓取)程序代码

<?//采集首页地址$url="http://www.xz-/";//获取页面代码$rs=file_get_contents($url);//设置匹配正则//$fp=fopen("text.txt","a");//$fw=fwrite($fp,$rs);//fclose($fp);/*<I class=titles><Ahref="http://www.xz-/"target=_blank>留住你身边的好男人</A></I>*/$preg='/<i\s+class=\"titles\"><a\s+href=\"[^>]+\">(.*)<\/a><\/i>/i';//进行正则搜索preg_match_all($preg,$rs,$title);//计算标题数量$count=count($title[0]);echo $count."<br>";//通过标题数量进行内容采集for ($i=0;$i<$count;$i++){ //设置内容页地址$pr='/<a\s+href=\"[^>]+\">/isU';preg_match_all($pr,$title[0][$i],$jurl);$substr=substr($jurl[0][0],9);$curl=substr($substr,0,-18);//获取内容页代码$c=file_get_contents($curl);//设置内容页匹配正则$pc='/<a\s+href=\"[^>]+\">/i';//进行正则匹配搜索preg_match($pc,$c,$content);//输出标题echo $title[0][$i]."<br>";echo $title[1][$i]."<br>";$concount=count($content[0]);echo $concount."<br>";echo $content[0][0];for ($j=0;$j<$concount;$j++){ }}?>

如果觉得《php 实现信息采集(网页内容抓取)程序代码》对你有帮助,请点赞、收藏,并留下你的观点哦!

本内容不代表本网观点和政治立场,如有侵犯你的权益请联系我们处理。
网友评论
网友评论仅供其表达个人看法,并不表明网站立场。