PHP

MYSQL

阿旭博客

阿旭博客,从心开始。HCIE,php,个人博客,模板,主题,程序,
您的位置:首页>php,采集,https,>正文

PHP每日学习1,php如何采集https

  • Donny
  • 2020-03-03 09:38:09       被围观了
  • php,采集,https,
  • PHP每日学习1,php如何采集https网站?

    我们可以用CURL模拟用户浏览器,模拟IP,模拟来路IP,采集到HTTPS网站的页面数据


    以下是一段简单的源代码:


    $url="https://www.baidu.com":

    function fcontents( $url, $timeout = 3, $referer = "" ){

        $ch = curl_init();
        $header = array (
            'User-Agent: Mozilla/5.0 (Windows NT 5.2) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/35.0.1916.153 Safari/537.36','X-FORWARDED-FOR:183.195.4.100', 'CLIENT-IP:183.195.4.100'
        );
        curl_setopt($ch, CURLOPT_URL, $url);
        curl_setopt($ch, CURLOPT_TIMEOUT, $timeout);
        curl_setopt($ch, CURLOPT_RETURNTRANSFER, 1);
        curl_setopt($ch, CURLOPT_HTTPHEADER, $header); //构造用户IP
        curl_setopt($ch, CURLOPT_REFERER, "183.195.4.100");//构造来路 
    curl_setopt($ch, CURLOPT_SSL_VERIFYPEER, false);
    curl_setopt($ch, CURLOPT_SSL_VERIFYHOST, false);
        $result = curl_exec($ch);
        curl_close($ch);
        return $result;
    }


    $html = fcontents($url);

    echo $html;



    让我们本地用APACHE调试下:


    看到没成功!

    文章 PHP每日学习1,php如何采集https阿旭博客 网上收集或原创,转载请注明

    来源:http://www.axublog.com/post/phpmeirixuexi1phpruhecaijihttps/

    上一篇:kali linux中文乱码,该如何解决?

    下一篇:67台ECMO发往湖北,ECMO是什么意思?

    阿旭博客-创建于2017年5月- 沪ICP备16040435号

    About 内容归档 QQ群190498118

    缓存页面执行时间:0.0267秒