|
王丹丹 , IBM 中國系統(tǒng)與技術中心軟件工程師,自從 2006 年加入 IBM,一直從事 Web 系統(tǒng)設計和開發(fā)工作,有五年 php 應用程序設計開發(fā)經驗。
通常開發(fā)人員在寫程序的時候,往往是把已經設計好或者構思好的運算邏輯,直接用編程語言翻譯出來。程序能順利編譯通過,那是很令人高興的事情。如果此時程序的運行時間還能接受,就會沉浸在寫代碼的成就感當中,常常在這個過程中忽略代碼的優(yōu)化。只有當程序運行速度受到影響時,才回過頭去考慮優(yōu)化的事情。本文主要是介紹在 php的編程中,如何巧用數(shù)組來降低因多層循環(huán)而引起的時間復雜度的問題。特別是當程序需要多次與數(shù)據(jù)庫交互時,用此方法來優(yōu)化你的代碼,將會帶給意想不到的效果。
什么是算法的時間復雜度
時間復雜度是開發(fā)人員用來衡量應用程序算法優(yōu)劣的主要因素。客觀地說,算法的優(yōu)劣除了和時間復雜度有關,還與空間復雜度密切相關。而隨著設備硬件配置的不斷提升,對中小型應用程序來說,對算法的空間復雜度的要求也寬松了不少。不過,在當今 Web2.0 時代,對應用程序的時間復雜度卻有了更高的要求。
什么是算法的時間復雜度呢?概要來說,是指從算法中選取一個能代表算法的原操作,以原操作重復執(zhí)行的次數(shù)作為算法的時間量度。影響時間復雜度的因素有兩個:一是原操作的執(zhí)行時間,二是原操作因控制結構引起的執(zhí)行次數(shù)。要把算法的時間復雜度降下來,降低原操作的執(zhí)行次數(shù)是較為容易的方法,也是主要方法。本文所講述的方法,是通過巧用 php 的數(shù)組,降低原操作的執(zhí)行次數(shù),從而達到降低算法時間復雜度的需求,和大家分享。
算法的時間量度記作 T(n)=O(f(n)),它表示算法中基本操作重復執(zhí)行的次數(shù)是問題規(guī)模 n 的某個函數(shù) f(n),也就是說隨著問題規(guī)模 n的增大,算法執(zhí)行時間的增長率和 f(n)的增長率相同。多數(shù)情況下,我們把最深層循環(huán)內的語句作為原操作來討論算法的時間復雜度,因為它的執(zhí)行次數(shù)和包含它的語句的頻度相同。一般情況下,對一個問題只需選擇一種基本操作來討論算法的時間復雜度即可。有時也需要同時考慮多種基本操作。
在 Web開發(fā)中,通常一個功能的執(zhí)行時間或響應時間,不僅僅跟服務器的響應能力、處理能力有關,還涉及第三方工具的交互時間,如對數(shù)據(jù)庫的鏈接時間和對數(shù)據(jù)進行存取的時間。因而在選定原操作是,需要綜合考慮應用程序各方面的因素,以最大影響程序執(zhí)行時間的操作為原操作,來衡量算法的時間復雜度。也就是說,需要程序員在編寫代碼的時候,對重要操作的執(zhí)行時間能有基本的認識。
常見程序中的時間復雜度分析
我們先看一個例子,假設 Web 程序的開發(fā)語言是 php,后臺采用 DB2 數(shù)據(jù)庫,php 通過 PEAR::DB 數(shù)據(jù)抽象層來實現(xiàn)對數(shù)據(jù)庫的訪問。
實例
數(shù)據(jù)庫中有學生表 STUDENTS(見表 1),班級表 CLASSES(見表 2),學生成績表 SCORES(見表 3),需要在 Web 頁面中顯示出本次考試數(shù)學成績超過 90 分的同學姓名和所在班級。
表 1. STUDENTS Table
列名
描述
SID
學號
STUNAME
姓名
GENDER
性別
AGE
年齡
CLASSID
班級號
…
表 2. CLASSES Table
列名
描述
CLASSID
班級號
CLASSNAME
班級名
…
表 3. SCORES Table
列名
描述
SID
學生學號
COURSE
學科
SCORE
成績
…
根據(jù)個人編程習慣的不同,要解決這個問題,通常有兩種做法(訪問數(shù)據(jù)庫的操作用 PEAR::DB 的方式表示),參看方法 1、2。
[ 方法 1 ]對 STUDENTS, CLASSES, SCORES 三個表做聯(lián)合查詢,一次獲取滿足條件的學生信息和班級信息。php 算法描述如下:
清單 1. 方法 1
復制代碼 代碼如下:
$querystr = "select distinct S.STUNAME as STUNAME,C.CLASSNAME as CLASSNAME ".
"from STUDENTS as S,CLASSES as C,SCORES as R ".
"where S.SID=R.SID and S.CLASSID=C.CLASSID and R.COURSE='Math' ".
"and R.SCORE>=90";
$result = $db2handle->query( $querystr ); //從數(shù)據(jù)庫中獲取數(shù)據(jù)
while( $row=$result->fetchRow(DB_FETCHMODE_ASSOC) ){
//讀取并顯示數(shù)據(jù)
echo "StudentName=".$row['STUNAME']."/t ClassName=".$row['CLASSNAME']."/n";
}//Done
[ 方法 2 ]從 SCORES 表中找出滿足條件的學生學號,然后從 STUDENTS 表中查找學生的姓名和班級編碼,最后在 CLASSES 表中獲取班級的名稱。php 算法描述如下:
清單 2. 方法 2
復制代碼 代碼如下:
$scorestr = "select distinct SID from SCORES where COURSE='Math' and SCORE>=90";
$scoredata = $db2handle->query( $scorestr );
//從數(shù)據(jù)庫中獲取滿足條件的學生學號
while( $score=$scoredata->fetchRow(DB_FETCHMODE_ASSOC) ){
//讀取學生的學號,并在STUDENTS表中查找學生的姓名和班級編號
$studentstr = "select STUNAME,CLASSID from STUDENTS where SID='".$score['SID']."'";
$studata =$db2handle->query( $studentstr);
$stu=$studata->fetchRow(DB_FETCHMODE_ASSOC);
//顯示學生的姓名
echo "StudentName=".$stu['STUNAME']."/t ";
//讀去學生的班級編號,并在CLASSES表中查找該學生所在班級名稱
$classstr = "select CLASSNAME from CLASSES where CLASSID='".$stu['CLASSID']."'";
$classdata = $db2handle->query( $classstr);
$class=$classdata ->fetchRow(DB_FETCHMODE_ASSOC);
//顯示學生的班級
echo "CLASSNAME=".$class['CLASSNAME']."/n";
}//end while for getting each student's ID. Done
對于這樣的算法描述,相信大家會有似曾相識的感覺。這也是大多程序員廣泛使用的算法。因為已經習慣了將思維中的算法邏輯直接譯成代碼,而往往沒有時間和心思來斟酌算法的優(yōu)劣。這里來分析一下這兩種算法的時間復雜度。
因Web 服務器讀取并顯示數(shù)據(jù)的時間相對較小,一般在 10ms 的數(shù)量級,而從 DB2 數(shù)據(jù)庫里查詢并獲取數(shù)據(jù)的時間數(shù)量級會是 100ms的數(shù)量級,并且隨查詢數(shù)據(jù)量的增加而增加。所以查詢數(shù)據(jù)庫的操作可作為量度時間復雜度的原操作,以 STUDENTS 表和 SCORES表中的數(shù)據(jù)量作為問題規(guī)模 n( 通常情況下,CLASSES 表的數(shù)據(jù)量較小且相對穩(wěn)定 )。
對于方法 1,隨著問題規(guī)模n 的增大,訪問數(shù)據(jù)庫的次數(shù)為常量 1。因而,時間復雜度為 T(n)=O(1)。對于方法 2,假設 SCORES 表中滿足條件的記錄有 m個,則原操作的執(zhí)行次數(shù)為 m+1。也就是說隨著數(shù)據(jù)規(guī)模 n 的增大,原操作的執(zhí)行次數(shù)成線性增長。可見時間復雜度為T(n)=O(n)。可見,方法 1 的時間復雜度低。
那么方法 1 的問題在哪里?主要因為方法 1會增大數(shù)據(jù)庫負載,也就是原操作的執(zhí)行時間受問題規(guī)模 n 的影響比較大。假設 STUDENTS,CLASSES,SCORES 的記錄數(shù)分別為X, Y, Z。那么在執(zhí)行聯(lián)合查詢操作時,在數(shù)據(jù)庫中會形成一個記錄數(shù)為 X*Y*Z的矩陣,然后在這個矩陣中查找滿足條件的記錄數(shù),最后獲取記錄的 STUNAME 信息和CLASSNAME。這樣,任何一個表中的數(shù)據(jù)增加,都會造成矩陣表中記錄的成倍增加。
用數(shù)組來優(yōu)化算法
主要思路 :在所需數(shù)據(jù)中存在相對簡單且數(shù)據(jù)量穩(wěn)定的情況下,利用 php 數(shù)組 (Array) 的下標 (Index) 可以為字符串 (String)的特點,巧妙的將數(shù)據(jù)臨時存放到數(shù)組中。這樣可以通過下標 (Index) 快速獲取所需值,從而降低對數(shù)據(jù)庫的查詢次數(shù),進而降低算法的時間復雜度。
[ 方法 3 ]從CLASSES 表中獲取 CLASSID 和 CLASSNAME 的對應關系存放到 ClassArray 一維數(shù)組中,從 STUDENTS表中獲取 SID 和 STUNAME 以及 CLASSID 的對應關系存放到 StuArray 二維數(shù)組中。之后從 SCORES表中找出滿足條件的學生學號,從 StuArray 數(shù)組中讀取學生的姓名和班級編號,從 ClassArray 中讀取班級的名稱。php算法描述如下:
清單 3. 方法 3
復制代碼 代碼如下:
$ClassArray = Array();
$StuArray = Array();
$classstr = "select CLASSID,CLASSNAME from CLASSES";
$classdata = $db2handle->query( $classstr);
while( $class=$classdata ->fetchRow(DB_FETCHMODE_ASSOC) ){
//生成ClassArray數(shù)組,下標Index以CLASSID命名,對應的值為CLASSNAME
$ClassArray[$class['CLASSID']] = $class['CLASSNAME'];
}//end while $ClassArray
$stustr="select SID,STUNAME,CLASSID from STUDENTS";
$studata = $db2handle->query( $stustr);
while( $stu=$studata ->fetchRow(DB_FETCHMODE_ASSOC) ){
//生成StuArray數(shù)組,下標Index以SID命名,對應的值為STUNAME和CLASSID
$StuArray[$stu ['SID']]['STUNAME'] = $stu['STUNAME'];
$StuArray[$stu ['SID']]['CLASSID'] = $stu['CLASSID'];
}//end while $StuArray
$scorestr = "select distinct SID from SCORES where COURSE='Math' and SCORE>=90";
$scoredata = $db2handle->query( $scorestr );
//從數(shù)據(jù)庫中獲取滿足條件的學生學號
while( $score=$scoredata->fetchRow(DB_FETCHMODE_ASSOC) ){
//讀取學生的學號,并從StuArray中讀取學生的姓名,從ClassArray中讀取班級名稱
echo "StudentName=".$StuArray[ $score['SID'] ]['STUNAME']."/t ";
echo "CLASSNAME=".$ClassArray[ $StuArray[ $score['SID'] ]['CLASSID'] ]."/n";
}//end while for getting each student's ID. Done
改進后方法的時間復雜度仍為 T(n)=O(1)。和方法 1 相比,方法 3 不必擔心因某一個表中的記錄增加而引起的數(shù)據(jù)庫查詢代價的成倍增加。和方法 2 相比,時間復雜度降低的同時,也沒有影響算法空間復雜度。可謂一舉兩得。
雖然此優(yōu)化方法簡單易用,但并不是說它是萬能的。使用時需要考慮“度”的問題。假設 STUDENTS 表的數(shù)據(jù)量很大,那么生成 StuArray的時候對系統(tǒng)內存的消耗就增加,這樣算法的空間復雜度就會受到影響。另外,當數(shù)據(jù)量足夠大時,影響算法執(zhí)行時間的主要因素就發(fā)生了變化,需要重新選擇原操作。針對 STUDENTS 表記錄數(shù)大,CLASSES表記錄少且穩(wěn)定的情景,可以考慮用嵌套查詢和數(shù)組相結合的方式,對算法進行優(yōu)化。這里給出方法 4,以供參考。
[ 方法 4 ]從CLASSES 表中獲取 CLASSID 和 CLASSNAME 的對應關系存放到 ClassArray 一維數(shù)組中。從 SCORES表中查詢滿足條件的學生學號,作為查詢 STUDENTS 表的查詢條件,獲取學生的 STUNAME 和 CLASSID。之后從ClassArray 中讀取班級的名稱。php 算法描述如下:
清單 4. 方法 4
復制代碼 代碼如下:
$ClassArray = Array();
$classstr = "select CLASSID,CLASSNAME from CLASSES";
$classdata = $db2handle->query( $classstr);
while( $class=$classdata ->fetchRow(DB_FETCHMODE_ASSOC) ){
//生成ClassArray數(shù)組,下標Index以CLASSID命名,對應的值為CLASSNAME
$ClassArray[$class['CLASSID']] = $class['CLASSNAME'];
}//end while $ClassArray
$stustr = "select STUNAME,CLASSID from STUDENTS where SID in ".
"(select distinct SID from SCORES where COURSE='M' and SCORE>=90)";
$studata = $db2handle->query( $stustr);
//從數(shù)據(jù)庫中獲取滿足條件的學生姓名和班級編號
while( $stu=$studata ->fetchRow(DB_FETCHMODE_ASSOC) ){
//讀取學生的姓名,并從ClassArray中讀取班級名稱
echo "StudentName=".$stu ['STUNAME']."/t ";
echo "CLASSNAME=".$ClassArray[ $stu ['CLASSID'] ]."/n";
}//end while for getting each student's Info. Done
總結
方法 3 和方法 4中引用了數(shù)組這個小技巧,巧妙地降低了算法的時間復雜度。在實際應用程序中,算法邏輯要復雜得多,對算法的優(yōu)化需要綜合考慮多方面的因素。需要提出的是,本文所述的方法不僅適用于 php應用程序。如果編程語言的數(shù)組支持以字符串作為下標,就可以考慮采用本文提出的方法:巧用數(shù)組的下標來降低算法的時間復雜度。對于不支持字符串做數(shù)組下標的編程語言,可以考慮使用建立哈希表來達到同樣的效果。
php技術:PHP 巧用數(shù)組降低程序的時間復雜度,轉載需保留來源!
鄭重聲明:本文版權歸原作者所有,轉載文章僅為傳播更多信息之目的,如作者信息標記有誤,請第一時間聯(lián)系我們修改或刪除,多謝。