|
了解正則表達式之前,須要掌握一些常用的正則表達式的基礎(chǔ)知識,這些如果能記得最好記得,記不住須要用的時候能查到就行,就多個特殊字符,所以說正則表達式玩的就是特殊,具體大家可以查看更加細致的說明。
preg_match_all函數(shù)具體說明大家可以查看php手冊,本文運用 preg_match_all用于測試正則表達的效果。
實例代碼:
復(fù)制代碼 代碼如下:
$html = '<div id="biuuu">jb51.NET</div><div id="biuuu_2">jb51.NET2</div><div id="biuuu_3">jb51.NET3</div>';
實例要求:分別將每一個DIV元素的ID和內(nèi)容取出,如biuuu,biuuu_2,biuuu_3,jb51.NET,jb51.NET2和jb51.NET3(一些常用的抓站要領(lǐng)就是這樣匹配的)
分析:字符串是一個基本的HTML元素,每一個DIV元素對應(yīng)該一個ID和內(nèi)容,并且是獨立的,首先考慮如何 取出一個DIV內(nèi)的ID值和內(nèi)容,如:jb51.NET,然后匹配其它類似的元素。一個DIV中須要取出兩個值,也就是兩個匹配的表達式,第一個表達式用于匹配ID值(biuuu),第二個表達式用于匹配ID的內(nèi)容(jb51.NET),正則表達式常用的表達式運用小括號,那么前面的元素將會變成如下形式:
<div id="(biuuu)">(jb51.NET)</div>
<div id="(表達式1)">(表達式2)</div>
好,運用如上小括號把須要匹配的區(qū)域執(zhí)行 了劃分,接下來就是如何 匹配各個表達式內(nèi)的內(nèi)容,我們猜想一個ID可能是字母,數(shù)字或下劃線,那這就變得基本了,運用中括號就可以實現(xiàn),如下:
表達式1:[a-zA-Z0-9_]+ (表示匹配大小寫字母,數(shù)字和下劃線)
那如何 匹配表達式2,因為ID的內(nèi)容可以是任意的字符,但是要留心,不能匹配<或>字符,因為如果匹配這兩個字符將會把后面運用的DIV都匹配出來,因此須要排除這兩個字符開始的元素,也就是不匹配以<或>字符,如下:
表達式2:[^<>]+ (表示不匹配<和>字符)
這樣,須要匹配的子表達式就實現(xiàn)了,但是還要須要匹配一個 的表達式,要領(lǐng)如下:
表達式:/ '/"(表達式1)/"'>(表達式2)<//div>/
留心其中的雙引號"和/須要運用 /轉(zhuǎn)義字符轉(zhuǎn)義,然后把前面兩個表達式放進去,
如下: '/"([a-z0-9_]+)/"'>/<div id=/"([a-z0-9_]+)/">([^<>]+)<//div>/
這樣就實現(xiàn)一個匹配每一個DIV元素ID值和內(nèi)容的正則表達式,然后運用 preg_match_all函數(shù)測試如下:
復(fù)制代碼 代碼如下:
$html = '<div id="biuuu">jb51.NET</div><div id="biuuu_2">jb51.NET2</div><div id="biuuu_3">jb51.NET3</div>';
preg_match_all('/<div/sid=/"([a-z0-9_]+)/">([^<>]+)<//div>/',$html,$result);
var_dump($result);
結(jié)果:
復(fù)制代碼 代碼如下:
array(3) { [0]=> array(3)
{ [0]=> string(30) "<div id="biuuu">jb51.NET</div>" [1]=> string(33) "<div id="biuuu_2">jb51.NET2</div>" [2]=> string(33) "<div id="biuuu_3">jb51.NET3</div>" } [1]=> array(3) { [0]=> string(5) "biuuu" [1]=> string(7) "biuuu_2" [2]=> string(7) "biuuu_3" } [2]=> array(3) { [0]=> string(8) "jb51.NET" [1]=> string(9) "jb51.NET2" [2]=> string(9) "jb51.NET3" } }
共有三個表達式,分別顯示每一個表達式匹配的值,并以數(shù)組的形式存儲,這樣就把每一個DIV元素的ID和內(nèi)容取出。運用正則表達式最主要還是要知道須要什么,然后跟椐須要執(zhí)行 匹配,并且思路清晰,并適當?shù)慕柚鷓reg_match_all函數(shù)執(zhí)行 輸出調(diào)試,非常方便。
php技術(shù):PHP函數(shù)preg_match_all正則表達式的基本使用詳細解析,轉(zhuǎn)載需保留來源!
鄭重聲明:本文版權(quán)歸原作者所有,轉(zhuǎn)載文章僅為傳播更多信息之目的,如作者信息標記有誤,請第一時間聯(lián)系我們修改或刪除,多謝。