|
php中英文混合字符截?cái)嗖粊y碼函數(shù)(utf8)
復(fù)制代碼 代碼如下:
//utf8格式下的中文字符截?cái)?BR>//$sourcestr 是要處理的字符串
//$cutlength 為截取的長度(即字?jǐn)?shù))
//$addstr 超過長度時(shí)在尾處加上的字符
function cut_str($sourcestr, $cutlength, $addstr='...'){
$returnstr='';
$i=0;
$n=0;
$str_length=strlen($sourcestr);//字符串的字節(jié)數(shù)
while (($n<$cutlength) and ($i<=$str_length)){
$temp_str=substr($sourcestr,$i,1);
$ascnum=Ord($temp_str);//得到字符串中第$i位字符的ascii碼
if ($ascnum>=224){ //如果ASCII位高與224,
$returnstr=$returnstr.substr($sourcestr,$i,3); //根據(jù)UTF-8編碼規(guī)范,將3個(gè)連續(xù)的字符計(jì)為單個(gè)字符
$i=$i+3; //實(shí)際Byte計(jì)為3
$n++; //字串長度計(jì)1
}elseif ($ascnum>=192){ //如果ASCII位高與192,
$returnstr=$returnstr.substr($sourcestr,$i,2); //根據(jù)UTF-8編碼規(guī)范,將2個(gè)連續(xù)的字符計(jì)為單個(gè)字符
$i=$i+2; //實(shí)際Byte計(jì)為2
$n++; //字串長度計(jì)1
}elseif ($ascnum>=65 && $ascnum<=90){ //如果是大寫字母,
$returnstr=$returnstr.substr($sourcestr,$i,1);
$i=$i+1; //實(shí)際的Byte數(shù)仍計(jì)1個(gè)
$n++; //但考慮整體美觀,大寫字母計(jì)成一個(gè)高位字符
}else{ //其他情況下,包括小寫字母和半角標(biāo)點(diǎn)符號(hào),
$returnstr=$returnstr.substr($sourcestr,$i,1);
$i=$i+1; //實(shí)際的Byte數(shù)計(jì)1個(gè)
$n=$n+0.5; //小寫字母和半角標(biāo)點(diǎn)等與半個(gè)高位字符寬...
}
}
if ($str_length>$cutlength){
$returnstr = $returnstr . $addstr;//超過長度時(shí)在尾處加上的字符
}
return $returnstr;
}
復(fù)制代碼 代碼如下:
<?php
/* UTF-8中文字符截?cái)喑绦?*/
$str = "123這是測試字符串";
$str1 = "()()";
echo subUTF8str($str,0,3)."<br>";
echo subUTF8str($str,0,4)."<br>";
echo subUTF8str($str1,0,4)."<br>";
echo subUTF8str($str1,0,10)."<br>";
function subUTF8str($str,$start=0,$length=80){
$cur_len = 0; //人理解的字符串長度
$all_len = strlen($str); //機(jī)器理解字符串長度
if($length > $all_len)
{
return $str;
}
for($i = 0;$i < $all_len;)
{
if($cur_len == $start)
{
break;
}
if (ord($str[$i]) > 127)
{
$i += 3;
}else{
$i += 1;
}
$cur_len ++;
}
$start_pos = $i;
$temp_pos = $cur_len;
for(;$cur_len - $temp_pos < $length;)
{
if($i >= $all_len)
break;
if (ord($str[$i]) > 127)
{
$i += 3;
}else{
$i += 1;
}
$cur_len ++;
}
$end_pos = $i;
return substr($str,$start_pos,$end_pos);
}
?>
其實(shí),php原生就有多charset下字符截取方案,額,所以就是這個(gè)樣子... 主站蜘蛛池模板: 武川县| 永顺县| 锡林浩特市| 调兵山市| 乌兰察布市| 页游| 广东省| 巴中市| 平安县| 喀喇沁旗| 铜山县| 宁都县| 林西县| 商丘市| 上高县| 连州市| 晋中市| 嘉祥县| 沾化县| 郸城县| 广宁县| 大化| 高碑店市| 巴东县| 吉水县| 阳信县| 那坡县| 嫩江县| 丰顺县| 铁岭市| 若羌县| 武功县| 马山县| 承德县| 田林县| 乳源| 固始县| 兴山县| 浙江省| 鄄城县| 达孜县|