国内最全IT社区平台 联系我们 | 收藏本站
华晨云阿里云优惠2
您当前位置:首页 > php开源 > php教程 > php中正则匹配中文汉字

php中正则匹配中文汉字

来源:程序员人生   发布时间:2013-12-09 11:59:30 阅读次数:3422次

在php中如果你想正则来获取字符串中汉字我们先需要知道页面编码,正则匹配中文汉字根据页面编码不同而略有区别:GBK/GB2312编码:[x80-xff>]+ 或 [xa1-xff]+ 而UTF-8编码:[x{4e00}-x{9fa5}]+/u .

实例代码如下:

  1. echo (mb_eregi("[x80-xff].","中d文") ? "有" : "无") ."汉字"
  2. echo (mb_eregi("^([x80-xff].)+$","中文") ? "全是汉字" : ""); 看一判断全中文字符串函数 

以下以PHP为例进行匹配:

实例代码如下:

  1. <?php 
  2.    $str = "学习php是一件快乐的事."
  3.    preg_match_all("/[x80-xff]+/"$str$match); 
  4.    //UTF-8 使用: 
  5.    //preg_match_all("/[x{4e00}-x{9fa5}]+/u", $str, $match); 
  6.    print_r($match); 
  7. ?> 

输出:

  1. Array 
  2.     [0] => Array 
  3.         ( 
  4.             [0] => 学习 
  5.             [1] => 是一件快乐的事. 
  6.         ) 

正则汉字实例代码如下:

  1. $str = "请问php中的eregi如何匹配汉字"
  2. if (preg_match("/^[".chr(0x80)."-".chr(0xff)."]+$/",$str)) { 
  3.    echo "这是一个纯中文字符串"
  4. else
  5.    echo "这不是一个纯中文字串"
  6. preg_match_all($pat,……)与preg_replace($pat,……)…… 
  7. preg_match_all("/(汉字)+/ism","我是汉字,看你把我怎么着!",$m_a); 

各个编码的高位与低位的开始与结束,那么自然就可以写出正则,而且直接是十六位的,有啥困难?呵呵.不过要注意,在php里面,表示十六位是用的x,我们还可以用该正则表达式来判断是否是gb2312的汉字

实例代码如下:

  1. <?php 
  2. $str = "小小子"
  3. if(preg_match("/^[xb0-xf7][xa0-xfe]+$/",$str)){ 
  4. print($str."确实全是汉字"); 
  5. else { 
  6. print($str."这个真tc不全是汉字"); 
  7. ?> 
生活不易,码农辛苦
如果您觉得本网站对您的学习有所帮助,可以手机扫描二维码进行捐赠
程序员人生
------分隔线----------------------------
分享到:
------分隔线----------------------------
关闭
程序员人生