ff提供了overrid " /> 九色一区二区,18成人免费观看网站下载,天堂俺去俺来也www久久婷婷

色尼玛亚洲综合影院,亚洲3atv精品一区二区三区,麻豆freexxxx性91精品,欧美在线91

解決遠程頁面抓取中的亂碼問題?

由于平時使用的網頁文件基本上都是gb2312編碼方式,如果通過xmlhttp控件讀取的話,肯定會出現亂碼問題,但是要把所有文件都改成utf-8編碼,操作上比較麻煩。經過反復比較,我找到了相對實用的解決方法。

  ff提供了overrideMimeType方法,可以指定返回值的編碼,所以解決起來比較簡單,只要把這個方法指向gb2312就可以了。對于IE,可以用vbs配合來作編碼轉換,用gb2utf8來轉換接收到的二進制數據,其中利用到execScript方法來調用vbs的函數。

[Ctrl+A 全選 注:如需引入外部Js需刷新才能執行]
ie下的轉碼可以改進,通過正則的回調過程能提高不少效率  

復制代碼 代碼如下:
this.bs2str = function(bs){  
    if(!window.jsMidB) main.vbInit("MidB", 2);  
    if(!window.jsChr) main.vbInit("Chr", 1);  
    if(!bs2str.ss) bs2str.ss = [];  
    return unescape(escape(jsMidB(bs,1)).replace(/(.{2})(.{2})(.{2})/g, "%$3%$2").replace(/%([^0-7].)(.)(.{2})/g, function(a,a1,a2,a3){var s=a1+a3;if(!bs2str.ss[s]) bs2str.ss[s]=jsChr(eval("0x"+s));return bs2str.ss[s];}));  
    } 

不過我還是認為載入數據用xmldom要好一些 
replace(/(.{2})(.{2})(.{2})/g, "%$3%$2") 改成 replace(/.{2}(.{2})(.{2})/g, "%$2%$1") 少一個存儲.比原來的快3倍以上. 
把eval去掉,效率還能提高一些 
復制代碼 代碼如下:
    // byte() encoding 
    this.bs2str = function(bs){ 
        if(!window.jsMidB) main.vbInit("MidB", 2); 
        if(!window.jsChr) main.vbInit("Chr", 1); 
        if(!this.bs2str.ss) this.bs2str.ss = []; 
        return unescape(escape(jsMidB(bs,1)).replace(/.{2}(.{2})(.{2})/g, "%$2%$1").replace(/%([^0-7].)(.)(.{2})/g, function(a,a1,a2,a3){var s=a1+a3;if(!This.bs2str.ss[s]) This.bs2str.ss[s]=jsChr("&H"+s);return This.bs2str.ss[s];})); 
    }  

JavaScript技術解決遠程頁面抓取中的亂碼問題?,轉載需保留來源!

鄭重聲明:本文版權歸原作者所有,轉載文章僅為傳播更多信息之目的,如作者信息標記有誤,請第一時間聯系我們修改或刪除,多謝。

主站蜘蛛池模板: 四会市| 分宜县| 治县。| 佛学| 博白县| 广昌县| 芷江| 淳安县| 新河县| 安义县| 舞钢市| 苏尼特左旗| 白水县| 宁津县| 城市| 颍上县| 闸北区| 绵阳市| 曲阳县| 株洲县| 自贡市| 黔西| 肃北| 望奎县| 扎鲁特旗| 汕尾市| 永平县| 青川县| 邵阳县| 衡南县| 濉溪县| 樟树市| 阿拉善盟| 南宫市| 天祝| 招远市| 昌吉市| 安化县| 长武县| 方山县| 永定县|