网站建设资讯

NEWS

网站建设资讯

php中文字符串截取乱码

       PHP截取字符串如果是英文直接用substr就可以了,但对于中文字符,用substring可能会导致乱码,那么将如何解决呢?

为庆云等地区用户提供了全套网页设计制作服务,及庆云网站建设行业解决方案。主营业务为成都网站设计、成都网站制作、庆云网站设计,以传统方式定制建设网站,并提供域名空间备案等一条龙服务,秉承以专业、用心的态度为用户提供真诚的服务。我们深信只要达到每一位用户的要求,就会得到认可,从而选择与我们长期合作。这样,我们也可以走得更远!

1、通过函数mb_substr实现

       说明:mb_substr($str, $start, $length, $encoding);通过该函数即可,但需要加载php_mbstring.dll扩展。

案例:

2、通过函数mb_strcut实现

说明:mb_strcut() 和 mb_substr() 类似,都是从一个字符串中提取子字符串,但是按字节数来执行,而不是字符个数。 如果截断位置位于多字节字符两个字节的中间,将于该字符的第一个字节开始执行。 这也是和 substr() 函数的不同之处,后者简单地将字符串在字节之间截断,这将导致一个畸形的字节序列。

3、通过编写的函数(支持UTF-8和GB2312)

案例:

'), array('&', '"', '<', '>'), $string);
     if($code == 'UTF-8') 
     { 
         $pa = "/[\x01-\x7f]|[\xc2-\xdf][\x80-\xbf]|\xe0[\xa0-\xbf][\x80-\xbf]|[\xe1-\xef][\x80-\xbf][\x80-\xbf]|\xf0[\x90-\xbf][\x80-\xbf][\x80-\xbf]|[\xf1-\xf7][\x80-\xbf][\x80-\xbf][\x80-\xbf]/"; 
         preg_match_all($pa, $string, $t_string); 

         if(count($t_string[0]) - $start > $sublen) return join('', array_slice($t_string[0], $start, $sublen))."..."; 
         return join('', array_slice($t_string[0], $start, $sublen)); 
      } 
      else 
      { 
         $start = $start*2; 
         $sublen = $sublen*2; 
         $strlen = strlen($string); 
         $tmpstr = ''; 

         for($i=0; $i< $strlen; $i++) 
         { 
            if($i>=$start && $i< ($start+$sublen)) 
            { 
                if(ord(substr($string, $i, 1))>0xa0) 
                { 
                    $tmpstr.= substr($string, $i, 2); 
                } 
                else 
                { 
                    $tmpstr.= substr($string, $i, 1); 
                } 
             } 
             if(ord(substr($string, $i, 1))>0xa0) $i++; 
          } 
          if(strlen($tmpstr)< $strlen ) $tmpstr.= "..."; 
          return $tmpstr; 
        } 
} 

$str = "这是一个字符串切割函数"; 
echo cut_str($str, 8, 0, 'gb2312'); 
?>

分享文章:php中文字符串截取乱码
分享地址:http://njwzjz.com/article/gjeiho.html