色尼玛亚洲综合影院,亚洲3atv精品一区二区三区,麻豆freexxxx性91精品,欧美在线91

基于PHP的簡(jiǎn)單采集數(shù)據(jù)入庫(kù)程序

說(shuō)到采集,無(wú)非就是遠(yuǎn)程獲取信息->提取所需內(nèi)容->分類存儲(chǔ)->讀取->展示

也算是簡(jiǎn)單"小偷程序"的加強(qiáng)版吧

下面是對(duì)應(yīng)核心代碼(別拿去做壞事哦^_^)

所要采集的內(nèi)容是某游戲網(wǎng)站上的公告,如下圖:

可先利用file_get_contents和簡(jiǎn)單正則獲取基本頁(yè)面信息

整理下基本信息,采集入庫(kù):

<?php  include_once("conn.php");   if($_GET['id']<=8&&$_GET['id']){     $id=$_GET['id'];    $conn=file_get_contents("http://www.93moli.com/news_list_4_$id.html");//獲取頁(yè)面內(nèi)容    $pattern="/<li><a title=/"(.*)/" target=/"_blank/" href=/"(.*)/">/iUs";//正則  preg_match_all($pattern, $conn, $arr);//匹配內(nèi)容到arr數(shù)組  //print_r($arr);die;    foreach ($arr[1] as $key => $value) {//二維數(shù)組[2]對(duì)應(yīng)id和[1]剛好一樣,利用起key    $url="http://www.93moli.com/".$arr[2][$key];    $sql="insert into list(title,url) value ('$value', '$url')";    mysql_query($sql);    //echo "<a href='content.php?url=http://www.93moli.com/$url'>$value</a>"."<br/>";    }   $id++;   echo "正在采集URL數(shù)據(jù)列表$id...請(qǐng)稍后...";   echo "<script>window.location='list.php?id=$id'</script>"; }else{   echo "采集數(shù)據(jù)結(jié)束。"; }?>

conn.php是數(shù)據(jù)庫(kù)連接文件

list.php是本頁(yè)面

由于要采集的數(shù)據(jù)是分頁(yè)顯示的,且頁(yè)面地址是規(guī)律遞增,所以我用了js跳轉(zhuǎn)代碼,利用id傳值控制采集的頁(yè)數(shù),也避免了for循環(huán)數(shù)目過(guò)大。

輕輕松松數(shù)據(jù)入庫(kù),下篇文章寫(xiě)關(guān)于具體url采集信息的過(guò)程。

php技術(shù)基于PHP的簡(jiǎn)單采集數(shù)據(jù)入庫(kù)程序,轉(zhuǎn)載需保留來(lái)源!

鄭重聲明:本文版權(quán)歸原作者所有,轉(zhuǎn)載文章僅為傳播更多信息之目的,如作者信息標(biāo)記有誤,請(qǐng)第一時(shí)間聯(lián)系我們修改或刪除,多謝。

主站蜘蛛池模板: 惠来县| 平山县| 榆树市| 双柏县| 府谷县| 沿河| 射阳县| 潜山县| 略阳县| 道真| 广西| 翁牛特旗| 漾濞| 山阳县| 凌云县| 舞钢市| 邢台市| 唐海县| 茂名市| 讷河市| 天等县| 玉山县| 贵南县| 宿迁市| 新河县| 西华县| 广灵县| 云梦县| 东源县| 南雄市| 肇东市| 韶山市| 宣恩县| 海阳市| 浙江省| 靖远县| 民勤县| 克什克腾旗| 水城县| 松江区| 双柏县|