java匹配中文汉字的正则表达式-java-IT落伍者

代码如下

[uEuFA]汉字?[uFEuFFA]全角字符

匹配中文字符的正则表达式 [ueufa]

匹配双字节字符(包括汉字在内)[^xxff]

应用计算字符串的长度(一个双字节字符长度计ASCII字符计)

代码如下 Stringprototypelen=function(){return thisreplace([^xxff]/g"aa")length;}

匹配空行的正则表达式n[s| ]*r

匹配HTML标记的正则表达式/<(*)>*|<(*) />/

匹配首尾空格的正则表达式(^s*)|(s*$)

知道它了我们就好解决了

代码如下复制代码

public  static void regxChinese(){
         // 要匹配的字符串
         String source  = "<span title= 星级酒店 class=dx dx>";
         // 将上面要匹配的字符串转换成小写
         // source =  sourcetoLowerCase();
         //  匹配的字符串的正则表达式
         String  reg_charset =  "<span[^>]*?title=([]*[\s|\S]*[uEuFA]*)[\s|\S]

*class=[az]*[\s|\S]*[az]*[]*";

         Pattern p =  Patterncompile(reg_charset);
         Matcher m =  pmatcher(source);
         while  (mfind()) {
         Systemoutprintln(mgroup());
         }
         }
         public static void  regxChinese(){
         // 要匹配的字符串
         String source = "<span  title= 星级酒店 class=dx dx>";
         // 将上面要匹配的字符串转换成小写
         // source =  sourcetoLowerCase();
         //  匹配的字符串的正则表达式
         String  reg_charset =  "<span[^>]*?title=([]*[\s|\S]*[uEuFA]*)[\s|\S]

*class=[az]*[\s|\S]*[az]*[]*";

         Pattern p =  Patterncompile(reg_charset);
         Matcher m =  pmatcher(source);
         while  (mfind()) {
         Systemoutprintln(mgroup());
         }
         }

Java的正则表达式是可以匹配中文字符的同时用中文字符来写表达式也是可以的

代码如下复制代码

String reg_charset = "<span[^>]*?title=([]*[\s|\S]*星级酒店)[\s|\S]*class=[az]*[\s|\S]

*[az]*[]*";

String reg_charset = "<span[^>]*?title=([]*[\s|\S]*星级酒店)[\s|\S]*class=[az]*

[\s|\S]*[az]*[]*";

一些常用的正则匹配规则

匹配中文字符的正则表达式 [ueufa]

评注匹配中文还真是个头疼的事有了这个表达式就好办了

匹配双字节字符(包括汉字在内)[^xxff]

评注可以用来计算字符串的长度(一个双字节字符长度计ASCII字符计)

匹配空白行的正则表达式ns*r

评注可以用来删除空白行

匹配HTML标记的正则表达式<(S*?)[^>]*>*?|<*? />

评注网上流传的版本太糟糕上面这个也仅仅能匹配部分对于复杂的嵌套标记依旧无能为力

匹配首尾空白字符的正则表达式^s*|s*$

评注可以用来删除行首行尾的空白字符(包括空格制表符换页符等等)非常有用的表达式

匹配Email地址的正则表达式w+([+]w+)*@w+([]w+)*w+([]w+)*

评注表单验证时很实用

匹配网址URL的正则表达式[azAz]+://[^s]*

评注网上流传的版本功能很有限上面这个基本可以满足需求

匹配帐号是否合法(字母开头允许字节允许字母数字下划线)^[azAZ][azAZ_]{}$

评注表单验证时很实用

匹配国内电话号码d{}d{}|d{}d{}

评注匹配形式如或

匹配腾讯QQ号[][]{}

评注腾讯QQ号从开始

匹配中国邮政编码[]d{}(?!d)

评注中国邮政编码为位数字

匹配身份证d{}|d{}

评注中国的身份证为位或位

匹配ip地址d+d+d+d+

评注提取ip地址时有用