色尼玛亚洲综合影院,亚洲3atv精品一区二区三区,麻豆freexxxx性91精品,欧美在线91

PHP 采集心得技巧

1.獲取遠程文件源代碼(file_get_contents或用fopen).
2.分析代碼得到自己想要的內(nèi)容(這里用正規(guī)匹配,一般是得到分頁)。
3.跟根得到的內(nèi)容進行下載入庫等操作。

  在這里第二步有可能要重復(fù)的操作好幾次,比如說要先分析一下分頁地址,在分析一下內(nèi)頁的內(nèi)容才能取得我們想要的東西。
  代碼:
  記的以前發(fā)部過部分的代碼今天我在這里在簡單的發(fā)部一下
  復(fù)制php內(nèi)容到剪貼板
  php代碼:
@$nl=file_get_contents($rs['url']);//抓取遠程內(nèi)容
preg_match_all("/var url = "gameswf/(.*?).swf";/is",$nl,$connect);//進行正規(guī)匹配取得自己要的內(nèi)容
mysql_query("insert ......插入數(shù)據(jù)庫部分");
  上面的代碼就是所有采集要用到的代碼了,當然大家也可以用fope來作,我個人喜歡用file_get_contents。
  下面在共享一下我的下載圖片flash到本地的辦法,太簡單了兩行代碼
  php代碼:
復(fù)制代碼 代碼如下:
if(@copy($url,$newurl)){
echo 'ok';
}

  在論壇上以前還發(fā)過一個圖片下載函數(shù)這會也放上來給大家
  php代碼:
復(fù)制代碼 代碼如下:
/*本存圖片函數(shù)*/
function getimg($url,$filename){
    /*判斷圖片的url是否為空,如果為空停止函數(shù)*/
    if($url==""){
        return false;
    }
    /*取得圖片的擴展名,存入變量$ext中*/
    $ext=strrchr($url,".");
    /*判斷是否是合法的圖片文件*/
  if($ext!=".gif" && $ext!=".jpg"){
        return false;
    }
    /*讀取圖片*/
    $img=file_get_contents($url);
    /*打開指定的文件*/
    $fp=@fopen($filename.$ext,"a");
    /*寫入圖片到指點的文件*/
    fwrite($fp,$img);
    /*關(guān)閉文件*/
    fclose($fp);
    /*返回圖片的新文件名*/
    return $filename.$ext;
}

  共享一下個人的采集心德:
  1.不采那些作防盜鏈了的站,其實可以作假來路但是這樣的站采集成本太高
  2.采集盡量快的站,最好在本地進行采集
  3.采集時有很多時候可以先把一部分數(shù)據(jù)存入數(shù)據(jù)庫,等以后進行下一步的處理。
  4.采集的時候一定要作好出錯處理,我一般都是如果采集三次沒有成功就跳過。以前經(jīng)常就因為一條內(nèi)容不能采就卡在那里一直的采。
  5.入庫前一定要作好判斷,檢查內(nèi)容的合法,過濾不必要的字符串。

php技術(shù)PHP 采集心得技巧,轉(zhuǎn)載需保留來源!

鄭重聲明:本文版權(quán)歸原作者所有,轉(zhuǎn)載文章僅為傳播更多信息之目的,如作者信息標記有誤,請第一時間聯(lián)系我們修改或刪除,多謝。

主站蜘蛛池模板: 平乐县| 神农架林区| 渭南市| 乐昌市| 会昌县| 基隆市| 青田县| 布拖县| 凤冈县| 全椒县| 当涂县| 亚东县| 宜川县| 贡山| 绥中县| 安平县| 凉城县| 海门市| 屏东市| 武功县| 富顺县| 随州市| 逊克县| 镇巴县| 客服| 申扎县| 肥西县| 青川县| 安康市| 建宁县| 开江县| 和龙市| 贵港市| 桦南县| 黄山市| 曲阳县| 平顶山市| 龙里县| 文昌市| 射洪县| 云安县|