色尼玛亚洲综合影院,亚洲3atv精品一区二区三区,麻豆freexxxx性91精品,欧美在线91

基于PHP讀取TXT文件向數(shù)據(jù)庫導(dǎo)入海量數(shù)據(jù)的方法

有一個TXT文件,包含了10萬條記錄,格式如下:

列1       列2       列3   列4   列5
a    00003131    0    0    adductive#1 adducting#1 adducent#1
a    00003356    0    0    nascent#1
a    00003553    0    0    emerging#2 emergent#2
a    00003700    0.25    0    dissilient#1

……………………后面有10萬條………………

需求是要導(dǎo)入數(shù)據(jù)庫中,數(shù)據(jù)表的結(jié)構(gòu)為

word_id   自動增量
word     【adductive#1 adducting#1 adducent#1】這一個TXT記錄要轉(zhuǎn)換為3個SQL記錄
value     =第三列-第四列;如果=0,則此條記錄略過不插入數(shù)據(jù)表
復(fù)制代碼 代碼如下:
<?php
    $file = 'words.txt';//10W條記錄的TXT源文件
    $lines = file_get_contents($file);
    ini_set('memory_limit', '-1');//不要限制Mem大小,否則會報錯
    $line=explode("/n",$lines);
    $i=0;
    $sql="INSERT INTO words_sentiment (word,senti_type,senti_value,word_type) VALUES ";

    foreach($line as $key =>$li)
    {
        $arr=explode(" ",$li);
        $senti_value=$arr[2]-$arr[3];
        if($senti_value!=0)
        {
            if($i>=20000&&$i<25000)//分批次導(dǎo)入,避免失敗
            {
             $mm=explode(" ",$arr[4]);               
                 foreach($mm as $m)   //【adductive#1 adducting#1 adducent#1】這一個TXT記錄要轉(zhuǎn)換為3個SQL記錄                 {
                     $nn=explode("#",$m);
                     $word=$nn[0];
                     $sql.="(/"$word/",1,$senti_value,2),";//這個地方要注意到是 word有可能包含單引號(如jack's),因此我們要用雙引號來包含word(注意轉(zhuǎn)義)                      
                 }
            }
   $i++;
        }        
    }
    //echo $i;
    $sql=substr($sql,0,-1);//去掉最后一個逗號
    //echo $sql;
    file_put_contents('20000-25000.txt', $sql);  //批量導(dǎo)入數(shù)據(jù)庫,5000條一次,大概需要40秒的樣子;一次導(dǎo)入太多max_execution_time會不夠,導(dǎo)致失敗    
?>

1,海量數(shù)據(jù)導(dǎo)入到時候,要注意php的一些限制,可以臨時調(diào)整一下,否則會報錯

Allowed memory size of 33554432 bytes exhausted (tried to allocate 16 bytes)

2,php操作TXT文件

file_get_contents()

file_put_contents()

3,海量導(dǎo)入的時候,最好分批次導(dǎo)入,失敗的幾率小一些

4,海量導(dǎo)入之前,腳本一定要多次測試無誤再使用,比如用100條數(shù)據(jù)來測試

5,導(dǎo)入之后,如果php的mem_limit還是不夠的話,程序仍然跑不起來

(建議用修改php.ini的方式來提高mem_limit,而不是用臨時的語句)

php技術(shù)基于PHP讀取TXT文件向數(shù)據(jù)庫導(dǎo)入海量數(shù)據(jù)的方法,轉(zhuǎn)載需保留來源!

鄭重聲明:本文版權(quán)歸原作者所有,轉(zhuǎn)載文章僅為傳播更多信息之目的,如作者信息標(biāo)記有誤,請第一時間聯(lián)系我們修改或刪除,多謝。

主站蜘蛛池模板: 平江县| 阳朔县| 都江堰市| 五指山市| 永顺县| 个旧市| 承德市| 资溪县| 崇义县| 杭锦旗| 金溪县| 遵义县| 凤山市| 铅山县| 资源县| 墨脱县| 阿瓦提县| 黄山市| 茂名市| 云龙县| 五家渠市| 永清县| 仙游县| 贵定县| 久治县| 新兴县| 泗洪县| 江津市| 措美县| 娄底市| 浦东新区| 五河县| 留坝县| 合肥市| 赤壁市| 九龙县| 牙克石市| 靖西县| 武宣县| 尉氏县| 沁阳市|