May
5

php下使用file_get_contents函数轻松采集html数据

这本来是群里一位朋友提出的问题,然后他给出他的代码,我感觉很好玩,于是继续研究了下,成功把一个天气预报站:
http://qq.ip138.com/weather采集到我网站下了:http://www.oldjun.com/tq.php

PHP手册里是这么解释的:file_get_contents — 将整个文件读入一个字符串,于是可以很容易的获取其他站的信息,再用正则加以变换,再做一些判断和设定,就OK了,不多说了,放代码,我基本都做了解释的。

<?php
//全国,判断条件是$REQUEST_URI是否含有html
if (!strpos($_SERVER["REQUEST_URI"],".html"))
{
$page="http://qq.ip138.com/weather/";
$html file_get_contents($page,'r');
$pattern="/<B>全国主要城市、县当天和未来五天天气趋势预报在线查询<\/B>(.*?)</B>
2 Comments