ff提供了overrid " /> 亚洲综合婷婷,91亚洲人电影,久久三级福利

色尼玛亚洲综合影院,亚洲3atv精品一区二区三区,麻豆freexxxx性91精品,欧美在线91

解決遠程頁面抓取中的亂碼問題?

由于平時使用的網頁文件基本上都是gb2312編碼方式,如果通過xmlhttp控件讀取的話,肯定會出現亂碼問題,但是要把所有文件都改成utf-8編碼,操作上比較麻煩。經過反復比較,我找到了相對實用的解決方法。

  ff提供了overrideMimeType方法,可以指定返回值的編碼,所以解決起來比較簡單,只要把這個方法指向gb2312就可以了。對于IE,可以用vbs配合來作編碼轉換,用gb2utf8來轉換接收到的二進制數據,其中利用到execScript方法來調用vbs的函數。

[Ctrl+A 全選 注:如需引入外部Js需刷新才能執行]
ie下的轉碼可以改進,通過正則的回調過程能提高不少效率  

復制代碼 代碼如下:
this.bs2str = function(bs){  
    if(!window.jsMidB) main.vbInit("MidB", 2);  
    if(!window.jsChr) main.vbInit("Chr", 1);  
    if(!bs2str.ss) bs2str.ss = [];  
    return unescape(escape(jsMidB(bs,1)).replace(/(.{2})(.{2})(.{2})/g, "%$3%$2").replace(/%([^0-7].)(.)(.{2})/g, function(a,a1,a2,a3){var s=a1+a3;if(!bs2str.ss[s]) bs2str.ss[s]=jsChr(eval("0x"+s));return bs2str.ss[s];}));  
    } 

不過我還是認為載入數據用xmldom要好一些 
replace(/(.{2})(.{2})(.{2})/g, "%$3%$2") 改成 replace(/.{2}(.{2})(.{2})/g, "%$2%$1") 少一個存儲.比原來的快3倍以上. 
把eval去掉,效率還能提高一些 
復制代碼 代碼如下:
    // byte() encoding 
    this.bs2str = function(bs){ 
        if(!window.jsMidB) main.vbInit("MidB", 2); 
        if(!window.jsChr) main.vbInit("Chr", 1); 
        if(!this.bs2str.ss) this.bs2str.ss = []; 
        return unescape(escape(jsMidB(bs,1)).replace(/.{2}(.{2})(.{2})/g, "%$2%$1").replace(/%([^0-7].)(.)(.{2})/g, function(a,a1,a2,a3){var s=a1+a3;if(!This.bs2str.ss[s]) This.bs2str.ss[s]=jsChr("&H"+s);return This.bs2str.ss[s];})); 
    }  

JavaScript技術解決遠程頁面抓取中的亂碼問題?,轉載需保留來源!

鄭重聲明:本文版權歸原作者所有,轉載文章僅為傳播更多信息之目的,如作者信息標記有誤,請第一時間聯系我們修改或刪除,多謝。

主站蜘蛛池模板: 临朐县| 兴安盟| 日照市| 仙桃市| 安溪县| 雷山县| 巴青县| 宜川县| 垦利县| 柳林县| 琼结县| 巍山| 炎陵县| 民权县| 博客| 禹城市| 青神县| 湖口县| 九龙县| 成安县| 榕江县| 手游| 射阳县| 扬中市| 东乌珠穆沁旗| 石景山区| 南宫市| 恭城| 武城县| 裕民县| 凭祥市| 搜索| 乌兰察布市| 武宁县| 胶州市| 琼海市| 定边县| 毕节市| 广水市| 开江县| 东源县|