PHP

MYSQL

阿旭个人博客

阿旭个人博客,是一款小巧强大的php mysql个人博客系统,本站提供个人博客模板下载。个人博客注册和建立个人博客网站,就用阿旭php个人博客系统吧!
您的位置:首页>狂人采集器,PHP,采集,>正文

狂人采集器-php采集易车网汽车油耗数据源码

  • Donny
  • 2018-03-07 18:48:00       被围观了
  • 狂人采集器,PHP,采集,
  • 本文将会详细介绍狂人采集器-如何用php采集易车网汽车油耗数据

    并附上程序源码下载

    采集网址为car.bitauto.com/yinglangsanxiang/koubei

    这是页面信息,理论上所有信息都可以采集分类,为我们所用


    好开始源代码分析:

    <meta http-equiv="Content-Type" content="text/html; charset=UTF-8" />
    <table style="width:500px;" cellpadding="2" cellspacing="0" border="1" bordercolor="#000000">
    <tbody>
    <tr>
    <td>裸车价</td>
    <td>当前油耗</td>
    <td>购买日期</td>
    <td>地方</td>
    </tr>
    <?php
    error_reporting(E_ERROR |  E_PARSE);//报告运行时错误
    $text=file_get_contents('http://car.bitauto.com/yinglangsanxiang/koubei/');
    #这行代码就是采集网址上信息,就是查看网页源代码的意思
    $text=str_replace('裸车价',"[分组]裸车价",$text);
    #在每个裸车价的前面加入字符[分组],便于后面操作
    $a=explode("[分组]",$text);
    #将内容分组,标识符为[分组]
    $ashu=count($a);
    #获取数量,也就是有几条口碑
    for($i=1;$i<$ashu;$i++){
    #循环语句开始
    echo'<tr>';
    $pattern="/裸车价:(.*?)万/i"; 
    preg_match_all($pattern,$a[$i],$match); 
    #匹配裸车价:(.*?)万,匹配到中间的(.*?)就是我们要的数据,下面同理不讲了
    echo("<td>".$match[1][0]."</td>"); 
    $pattern="/当前油耗:(.*?)L/100km/i"; 
    preg_match_all($pattern,$a[$i],$match); 
     echo("<td>".$match[1][0]."</td>"); 
    $pattern="/万(.*?)购于/i"; 
    preg_match_all($pattern,$a[$i],$match); 
    echo("<td>".$match[1][0]."</td>"); 
    $pattern="/购于(.*?)市/"; 
    preg_match_all($pattern,$a[$i],$match); 
    echo("<td>".$match[1][0]."</td>"); 
    echo'</tr>';
    }
    ?>
    </tbody>
    </table>

    怎么样很简单吧?狂人采集器-php采集程序就搞定了,此程序为Donny原创!!!转载请注明谢谢。

    下载:php采集易车网汽车油耗数据源码.rar


    文章 狂人采集器-php采集易车网汽车油耗数据源码阿旭个人博客 网上收集或原创,转载请注明

    来源:http://www.axublog.com/post/kuang_ren_cai_ji_qi_php_cai_5700/

    上一篇:狂人采集器-php采集易车网汽车油耗数据源码

    下一篇:暂无下一篇文章

    阿旭个人博客-创建于2017年5月- 沪ICP备16040435号

    About Sitemap Rss 文章归档 QQ群190498118