色尼玛亚洲综合影院,亚洲3atv精品一区二区三区,麻豆freexxxx性91精品,欧美在线91

基于PHP讀取TXT文件向數(shù)據(jù)庫(kù)導(dǎo)入海量數(shù)據(jù)的方法

有一個(gè)TXT文件,包含了10萬(wàn)條記錄,格式如下:

列1       列2       列3   列4   列5
a    00003131    0    0    adductive#1 adducting#1 adducent#1
a    00003356    0    0    nascent#1
a    00003553    0    0    emerging#2 emergent#2
a    00003700    0.25    0    dissilient#1

……………………后面有10萬(wàn)條………………

需求是要導(dǎo)入數(shù)據(jù)庫(kù)中,數(shù)據(jù)表的結(jié)構(gòu)為

word_id   自動(dòng)增量
word     【adductive#1 adducting#1 adducent#1】這一個(gè)TXT記錄要轉(zhuǎn)換為3個(gè)SQL記錄
value     =第三列-第四列;如果=0,則此條記錄略過不插入數(shù)據(jù)表
復(fù)制代碼 代碼如下:
<?php
    $file = 'words.txt';//10W條記錄的TXT源文件
    $lines = file_get_contents($file);
    ini_set('memory_limit', '-1');//不要限制Mem大小,否則會(huì)報(bào)錯(cuò)
    $line=explode("/n",$lines);
    $i=0;
    $sql="INSERT INTO words_sentiment (word,senti_type,senti_value,word_type) VALUES ";

    foreach($line as $key =>$li)
    {
        $arr=explode(" ",$li);
        $senti_value=$arr[2]-$arr[3];
        if($senti_value!=0)
        {
            if($i>=20000&&$i<25000)//分批次導(dǎo)入,避免失敗
            {
             $mm=explode(" ",$arr[4]);               
                 foreach($mm as $m)   //【adductive#1 adducting#1 adducent#1】這一個(gè)TXT記錄要轉(zhuǎn)換為3個(gè)SQL記錄                 {
                     $nn=explode("#",$m);
                     $word=$nn[0];
                     $sql.="(/"$word/",1,$senti_value,2),";//這個(gè)地方要注意到是 word有可能包含單引號(hào)(如jack's),因此我們要用雙引號(hào)來(lái)包含word(注意轉(zhuǎn)義)                      
                 }
            }
   $i++;
        }        
    }
    //echo $i;
    $sql=substr($sql,0,-1);//去掉最后一個(gè)逗號(hào)
    //echo $sql;
    file_put_contents('20000-25000.txt', $sql);  //批量導(dǎo)入數(shù)據(jù)庫(kù),5000條一次,大概需要40秒的樣子;一次導(dǎo)入太多max_execution_time會(huì)不夠,導(dǎo)致失敗    
?>

1,海量數(shù)據(jù)導(dǎo)入到時(shí)候,要注意php的一些限制,可以臨時(shí)調(diào)整一下,否則會(huì)報(bào)錯(cuò)

Allowed memory size of 33554432 bytes exhausted (tried to allocate 16 bytes)

2,php操作TXT文件

file_get_contents()

file_put_contents()

3,海量導(dǎo)入的時(shí)候,最好分批次導(dǎo)入,失敗的幾率小一些

4,海量導(dǎo)入之前,腳本一定要多次測(cè)試無(wú)誤再使用,比如用100條數(shù)據(jù)來(lái)測(cè)試

5,導(dǎo)入之后,如果php的mem_limit還是不夠的話,程序仍然跑不起來(lái)

(建議用修改php.ini的方式來(lái)提高mem_limit,而不是用臨時(shí)的語(yǔ)句)

php技術(shù)基于PHP讀取TXT文件向數(shù)據(jù)庫(kù)導(dǎo)入海量數(shù)據(jù)的方法,轉(zhuǎn)載需保留來(lái)源!

鄭重聲明:本文版權(quán)歸原作者所有,轉(zhuǎn)載文章僅為傳播更多信息之目的,如作者信息標(biāo)記有誤,請(qǐng)第一時(shí)間聯(lián)系我們修改或刪除,多謝。

主站蜘蛛池模板: 静安区| 呈贡县| 皮山县| 虹口区| 闽清县| 宜兰市| 琼中| 襄垣县| 无棣县| 固阳县| 红河县| 松滋市| 呼图壁县| 长春市| 阿拉善左旗| 于田县| 垦利县| 三原县| 霸州市| 扶风县| 花莲市| 乌拉特前旗| 建昌县| 安远县| 信丰县| 余干县| 信丰县| 肇东市| 四子王旗| 青浦区| 改则县| 颍上县| 神木县| 屯留县| 平阴县| 佛山市| 那坡县| 高邑县| 阿巴嘎旗| 东台市| 利辛县|