php有哪些获取网页源内容的方法?
方法一:获取file_get_contents。
& ltspan style="white-space:pre " >?& lt/span>。$ URL = "/";
& ltspan style="white-space:pre " >?& lt/span>。$fh=文件获取内容
('/news/fzfj/');& ltspan style="white-space:pre " >?& lt/span>。echo $ fh
方法二:使用fopen获取网页源代码。
& ltspan style="white-space:pre " >?& lt/span>。$ URL = "/";
& ltspan style="white-space:pre " >?& lt/span>。$handle = fopen ($url," Rb ");
& ltspan style="white-space:pre " >?& lt/span>。$ contents =
& ltspan style="white-space:pre " >?& lt/span>。而(!feof($handle)) {
& ltspan style="white-space:pre " >& lt/span>。$内容。= fread($handle,8192);
& ltspan style="white-space:pre " >?& lt/span>。}
& ltspan style="white-space:pre " >?& lt/span>。fclose($ handle);
& ltspan style="white-space:pre " >?& lt/span>。echo $ contents//输出获取的内容。
方法3:使用CURL获取网页源代码
$ URL = "/";
$UserAgent = 'Mozilla/4.0(兼容;MSIE 7.0Windows NT 6.0slcc 1;。净CLR 2 . 0 . 50727;。净CLR 3 . 0 . 04506;。净CLR 3 . 5 . 21022;。净CLR 1 . 0 . 3705;。净CLR 1.1.4322)’;
$ curl = curl _ init();?//创建新的CURL资源。
curl_setopt($curl,CURLOPT_URL,$ URL);?//设置URL和相应的选项。
curl_setopt($curl,CURLOPT_HEADER,0);?//0表示不输出头,1表示输出。
curl_setopt($curl,CURLOPT_RETURNTRANSFER,1);?//设置是否显示表头信息,1显示,0不显示。//如果成功,只返回结果,不自动输出任何东西。如果失败,则返回FALSE。
curl_setopt($curl,CURLOPT_SSL_VERIFYPEER,false);
curl_setopt($curl,CURLOPT_SSL_VERIFYHOST,false);
curl_setopt($curl,CURLOPT_ENCODING,' ');?//设置编码格式。如果为空,则支持所有编码格式。
//对于//头中“Accept-Encoding:”部分的内容,支持的编码格式有:“identity”、“deflate”和“gzip”。?
curl_setopt($curl,CURLOPT_USERAGENT,$ user agent);
curl_setopt($curl,CURLOPT_FOLLOWLOCATION,1);
//将这个选项设置为一个非零值的头(比如“Location:"),服务器会将其作为HTTP头的一部分发送(注意这是递归的,PHP会发送一个“Location:")形状的头)。
$ data = curl _ exec($ curl);
echo $ data
//echo curl _ errno($ curl);//返回0时,程序执行成功。
curl _ close($ curl);?//关闭cURL资源,释放系统资源。
PHP (mbth: PHP:超文本预处理器,中文名:超文本预处理器)是一种通用的开源脚本语言。语法吸收了C语言、Java、Perl的特点,利于学习,应用广泛,主要适用于Web开发领域。PHP的独特语法是C、Java、Perl和PHP自身语法的混合。它可以比CGI或Perl更快地执行动态网页。
与其他编程语言相比,PHP制作的动态页面将程序嵌入到HTML(标准通用标记语言下的一种应用)文档中执行,执行效率远高于完全生成HTML标签的CGI。PHP还可以执行编译后的代码,可以实现加密和优化代码运行,使得代码运行速度更快。
参考资料:
PHP(超文本预处理器)-百度百科