形式化描述: input Array(size=N) output Array1=Array的無重復(fù)保序的子集, 無重復(fù)是 " /> 日韩精品欧美一区二区三区,欧美日韩免费网站,精品国产乱码久久久久久虫虫漫画

色尼玛亚洲综合影院,亚洲3atv精品一区二区三区,麻豆freexxxx性91精品,欧美在线91

JavaScript 數(shù)組的 uniq 方法

給Array本地對象增加一個原型方法,它的用途是刪除數(shù)組條目中重復(fù)的條目(可能有多個),返回值是一個包含被刪除的重復(fù)條目的新數(shù)組。

形式化描述:
input
Array(size=N)
output
Array1=Array的無重復(fù)保序的子集,
無重復(fù)是指,對任意a,b屬于Array1,a!=b
保序是指,若a在Array的下標(biāo)小于b在Array的下標(biāo),則a在Array1中的下標(biāo)也小于b在Array的下標(biāo)
Array2=Array-Array1,保序
realazy給出了一個新解,思路非常清晰:順序遍歷訪問每個元素,如果這個元素的值已經(jīng)訪問過了,則加入Array2,否則加入Array1。判斷當(dāng)前元素的值是否已經(jīng)訪問過所采用的方法是順序遍歷已經(jīng)訪問過的所有元素。 
易見該算法復(fù)雜度約O(N^2)。

我在他的算法框架下稍微做了一些改進(jìn),關(guān)鍵在于遍歷過程中如何判斷當(dāng)前元素的值是否已經(jīng)訪問過。在原數(shù)組值域為正整數(shù)且極差(range=max value-min value)不太大的條件下,可以采用簡單的"桶"算法。
準(zhǔn)備一個長度為range的boolean數(shù)組b,初始化全為false。對于原數(shù)組中每個值value,如果b[value]=true,則表明這個值訪問過,放入Array2,否則放入Array1同時令b[value]=true。 
這顯然是O(N)的算法,代價是額外的空間復(fù)雜度range,而且要求原數(shù)組值域為正整數(shù)。
不難推廣到值域為整數(shù)的情形,事實上只需考察桶號value-min(Array)即可轉(zhuǎn)化為正整數(shù)的情形。

為了避免range太大造成的空間的浪費(fèi),在"桶"算法基礎(chǔ)上改進(jìn)為散列算法,具體說來是線性同余開散列法。目的是將值域壓縮映射到一個可控的小的連續(xù)正整數(shù)子集中,同時保證不同的原象對應(yīng)的相同的象的概率要盡可能小,也就是說桶與桶之間要盡量負(fù)載均衡。 
例如這是一個值域為實數(shù)的散列函數(shù):
key=hashFun(value)=Math.floor(value)*37%91
這仍然是O(N)的算法,(顯然O(N)是所有uniq算法的復(fù)雜度下界),好處是可以控制空間的開銷,而且可以適應(yīng)非整數(shù)值域,只需要設(shè)計相應(yīng)的散列函數(shù)即可。



下面是桶(bucket)算法的實現(xiàn):
   var resultArr = [],
       returnArr = [], 
       origLen = this.length,
       resultLen;
   var maxv=this[0],minv=this[0];
   for (var i=1; i<origLen; ++i){
       if(this[i]>maxv)maxv=this[i];
       else if(this[i]<minv)minv=this[i]; 
   }
   var blen=maxv-minv+1;
   var b=new Array(blen);
   for(var i=0;i<blen;++i)b[i]=false;
   for (var i=0; i<origLen; ++i){
       if (b[this[i]-minv]){
           returnArr.push(this[i]); 
       } else {
           resultArr.push(this[i]);
           b[this[i]-minv]=true;
       }
   }
   resultLen = resultArr.length;
   this.length = resultLen;
   for (var i=0; i<resultLen; ++i){ 
       this[i] = resultArr[i];
   }
   return returnArr;
下面是散列(hash)算法的實現(xiàn)
var shuffler = 37
var beta=0.007;
var origLen=this.length
var bucketSize=Math.ceil(origLen*beta);
var hashSet=new Array(bucketSize); 
var hashFun = function(value){
var key = (Math.floor(value)*shuffler)%bucketSize;
return key;
}
//init hashSet
for(var i=0;i<bucketSize;i++)hashSet[i]=new Array();
//
var ret=[],self=[];
var key,value; 
var bucket,openLen;
var everConflict;
for(var i=0;i<origLen;i++){
value=this[i];
key=hashFun(value);
bucket = hashSet[key];
openLen=bucket.length;//if(openLen>1)return;
everConflict=false; 
for(var j=0;j<openLen;j++){
 if(bucket[j]==value){
  ret.push(value);
  everConflict=true;
  break;
 }
}
if(!everConflict){
 bucket.push(value);
 self.push(value);
}
}
   selfLen = self.length;
   this.length = selfLen;
   for (i=0; i<selfLen; ++i){
       this[i] = self[i];
   }
//compute average bucket size
var lens=[],sum=0;
for(var i=0;i<hashSet.length ;++i){lens.push(hashSet[i].length);sum+=hashSet[i].length};
average=sum/hashSet.length;//watch lens,average
   return ret;


用k*10000個0~k*100的隨機(jī)整數(shù)測試計算時間(ms)
k 1 2 3 4 5
realazy 240 693 1399 2301 3807 
bucket 55 101 141 219 293
hash 214 411 654 844 1083
測試框架借鑒了http://realazy.org/lab/uniq.html
測試環(huán)境Firefox2.0.0.6/Ubuntu7.10/2.66GHzP4/1024MBDDR 

JavaScript技術(shù)JavaScript 數(shù)組的 uniq 方法,轉(zhuǎn)載需保留來源!

鄭重聲明:本文版權(quán)歸原作者所有,轉(zhuǎn)載文章僅為傳播更多信息之目的,如作者信息標(biāo)記有誤,請第一時間聯(lián)系我們修改或刪除,多謝。

主站蜘蛛池模板: 怀化市| 株洲市| 山阴县| 兰西县| 陇南市| 景东| 保德县| 攀枝花市| 仪陇县| 绥芬河市| 卓资县| 石首市| 沽源县| 汶川县| 句容市| 神池县| 长宁区| 德化县| 静安区| 昌图县| 右玉县| 罗定市| 江陵县| 常熟市| 女性| 渝中区| 澄江县| 宝丰县| 东宁县| 定陶县| 黔南| 长海县| 方城县| 黄陵县| 黄大仙区| 仙居县| 通海县| 墨江| 双桥区| 平果县| 襄垣县|