今天加班,一个同事让我给他讲解一下正规表达式的用法。
猛然想起两年写了一个java的正规表达式的java工具类,分享一下,有用到的欢迎下载使用。
如果你有常用的定义好的,且测试通过的正规表达式,欢迎跟贴,也让我享用一下 .
类中用到了 jakarta-oro-2.0.jar 包,请大家自己在 apache网站下下载
在这是junit测试单元类我就不提交了,在main()方法中有几个小测试,有兴趣自己玩吧.
这个工具类目前主要有25种正规表达式(有些不常用,但那时才仔细深入的研究了一下正规,写上瘾了,就当时能想到的都写了):
1.匹配图象; 2
匹配email地址; 3
匹配匹配并提取url ; 4 匹配并提取http ;
5.匹配日期 6
匹配电话; 7
匹配身份证
8 匹配邮编代码
9. 不包括特殊字符的匹配 (字符串中不包括符号 数学次方号^ 单引号' 双引号" 分号; 逗号, 帽号: 数学减号- 右尖括号> 左尖括号< 反斜杠\ 即空格,制表符,回车符等
10 匹配非负整数(正整数 +
0)
11 匹配不包括零的非负整数(正整数 > 0)
12
匹配正整数
13 匹配非正整数(负整数 +
0)
14
匹配负整数;
15. 匹配整数 ;
16 匹配非负浮点数(正浮点数 +
0) 17.
匹配正浮点数
18 匹配非正浮点数(负浮点数 +
0) 19
匹配负浮点数;
20
.匹配浮点数;
21. 匹配由26个英文字母组成的字符串;
22. 匹配由26个英文字母的大写组成的字符串 23 匹配由26个英文字母的小写组成的字符串
24 匹配由数字和26个英文字母组成的字符串; 25 匹配由数字、26个英文字母或者下划线组成的字符串;
java 代码
1package com.ygj.util; 2 3import java.util.*; 4 5import org.apache.oro.text.regex.*; 6 7 8/**//** 9 * 类简介: 使用正则表达式验证数据或提取数据,类中的方法全为静态的 10 * 主要方法:1. isHardRegexpValidate(String source, String
regexp) 11 区分大小写敏感的正规表达式批配 * 2. isSoftRegexpValidate(String source, String regexp) 12 * 不区分大小写的正规表达式批配 13 * 3. getHardRegexpMatchResult(String source, String regexp) 14 *
返回许要的批配结果集(大小写敏感的正规表达式批配) 15 * 4. getSoftRegexpMatchResult(String source, String regexp) 16 * 返回许要的批配结果集(不区分大小写的正规表达式批配) 17 * 5 getHardRegexpArray(String source, String regexp) 18 *
返回许要的批配结果集(大小写敏感的正规表达式批配) 19 * 6. getSoftRegexpMatchResult(String source, String regexp) 20 * 返回许要的批配结果集(不区分大小写的正规表达式批配) 21 * 7. getBetweenSeparatorStr(final String originStr,final char
leftSeparator,final char rightSeparator) 22 * 得到指定分隔符中间的字符串的集合 23 * 24 * @mail wuzhi2000@hotmail.com 25 * @author ygj 26 * 27 */ 28public final class Regexp 29...{ 30 31 /**//** 保放有四组对应分隔符 */
32 static final Set SEPARATOR_SET=new TreeSet(); 33 ...{ 34 SEPARATOR_SET.add("("); 35 SEPARATOR_SET.add(")"); 36 SEPARATOR_SET.add("["); 37 SEPARATOR_SET.add("]"); 38 SEPARATOR_SET.add("{");
39 SEPARATOR_SET.add("}"); 40 SEPARATOR_SET.add("<"</span><span>); </span> </li> <li class=""><span> SEPARATOR_SET.add(</span><span
class="string">">"); 41 } 42 43 44 /**//** 存放各种正规表达式(以key->value的形式) */ 45 public static HashMap regexpHash = new HashMap(); 46 47 /**//** 存放各种正规表达式(以key->value的形式) */ 48 public
static List matchingResultList = new ArrayList(); 49 50 private Regexp() 51 ...{ 52 53 } 54 /**//** 55 * 返回 Regexp 实例 56 * @return 57 */ 58 public static Regexp getInstance() 59 ...{ 60
return new Regexp(); 61 } 62 63 /**//** 64 * 匹配图象 65 66 * 67 * 格式: /相对路径/文件名.后缀 (后缀为gif,dmp,png) 68 * 69 * 匹配 : /forum/head_icon/admini2005111_ff.gif 或 admini2005111.dmp 70 71 * 72 * 不匹配:
c:/admins4512.gif 73 * 74 */ 75 public static final String icon_regexp = "^(/{0,1}\\w){1,}\\.(gif|dmp|png|jpg)$|^\\w{1,}\\.(gif|dmp|png|jpg)$"; 76 77 /**//** 78 * 匹配email地址 79 80 * 81 * 格式:
XXX@XXX.XXX.XX 82 * 83 * 匹配 : foo@bar.com 或 foobar@foobar.com.au 84 85 * 86 * 不匹配: foo@bar 或 $$$@bar.com 87 * 88 */ 89 public static final String email_regexp =
"(?:\\w[-._\\w]*\\w@\\w[-._\\w]*\\w\\.\\w{2,3}$)"; 90 91 /**//** 92 * 匹配匹配并提取url 93 94 * 95 * 格式: XXXX://XXX.XXX.XXX.XX/XXX.XXX?XXX=XXX 96 * 97 * 匹配 : http://www.suncer.com 或news://www 98 99
* 100 * 提取(MatchResult matchResult=matcher.getMatch()): 101 * matchResult.group(0)= http://www.suncer.com:8080/index.html?login=true 102 * matchResult.group(1) = http 103 *
matchResult.group(2) = www.suncer.com 104 * matchResult.group(3) = :8080 105 * matchResult.group(4) = /index.html?login=true 106 * 107 * 不匹配: c:\window 108 * 109 */ 110 public static final
String url_regexp = "(\\w+)://([^/:]+)(:\\d*)?([^#\\s]*)"; 111 112 /**//** 113 * 匹配并提取http 114 115 * 116 * 格式: http://XXX.XXX.XXX.XX/XXX.XXX?XXX=XXX 或 ftp://XXX.XXX.XXX 或 https://XXX 117 *
118 * 匹配 : http://www.suncer.com:8080/index.html?login=true 119 120 * 121 * 提取(MatchResult matchResult=matcher.getMatch()): 122 * matchResult.group(0)=
http://www.suncer.com:8080/index.html?login=true 123 * matchResult.group(1) = http 124 * matchResult.group(2) = www.suncer.com 125 * matchResult.group(3) = :8080 126 * matchResult.group(4) =
/index.html?login=true 127 * 128 * 不匹配: news://www 129 * 130 */ 131 public static final String http_regexp = "(http|https|ftp)://([^/:]+)(:\\d*)?([^#\\s]*)"; 132 133 /**//** 134 * 匹配日期 135
136 * 137 * 格式(首位不为0): XXXX-XX-XX 或 XXXX XX XX 或 XXXX-X-X 138 139 * 140 * 范围:1900--2099 141 142 * 143 * 匹配 : 2005-04-04 144 145 * 146 * 不匹配: 01-01-01 147 * 148 */ 149 public static final
String date_regexp = "^((((19){1}|(20){1})d{2})|d{2})[-\\s]{1}[01]{1}d{1}[-\\s]{1}[0-3]{1}d{1}$";// 匹配日期 150 151 /**//** 152 * 匹配电话 153 154 * 155 * 格式为: 0XXX-XXXXXX(10-13位首位必须为0) 或0XXX
XXXXXXX(10-13位首位必须为0) 或 156 157 * (0XXX)XXXXXXXX(11-14位首位必须为0) 或 XXXXXXXX(6-8位首位不为0) 或 158 * XXXXXXXXXXX(11位首位不为0) 159 160 * 161 * 匹配 : 0371-123456 或 (0371)1234567 或 (0371)12345678 或
010-123456 或 162 * 010-12345678 或 12345678912 163 164 * 165 * 不匹配: 1111-134355 或 0123456789 166 * 167 */ 168 public static final String phone_regexp =
"^(?:0[0-9]{2,3}[-\\s]{1}|\\(0[0-9]{2,4}\\))[0-9]{6,8}$|^[1-9]{1}[0-9]{5,7}$|^[1-9]{1}[0-9]{10}$"; 169 170 /**//** 171 * 匹配身份证 172 173 * 174 * 格式为: XXXXXXXXXX(10位) 或 XXXXXXXXXXXXX(13位) 或
XXXXXXXXXXXXXXX(15位) 或 175 * XXXXXXXXXXXXXXXXXX(18位) 176 177 * 178 * 匹配 : 0123456789123 179 180 * 181 * 不匹配: 0123456 182 * 183 */ 184 public static final String ID_card_regexp =
"^\\d{10}|\\d{13}|\\d{15}|\\d{18}$"; 185 186 /**//** 187 * 匹配邮编代码 188 189 * 190 * 格式为: XXXXXX(6位) 191 192 * 193 * 匹配 : 012345 194 195 * 196 * 不匹配: 0123456 197 * 198 */ 199 public static final
String ZIP_regexp = "^[0-9]{6}$";// 匹配邮编代码 200 201 202 /**//** 203 * 不包括特殊字符的匹配 (字符串中不包括符号 数学次方号^ 单引号' 双引号" 分号; 逗号, 帽号: 数学减号- 右尖括号> 左尖括号< 反斜杠\ 即空格,制表符,回车符等 ) 204 205 * 206 * 格式为: x 或
一个一上的字符 207 208 * 209 * 匹配 : 012345 210 211 * 212 * 不匹配: 0123456 213 * 214 */ 215 public static final String non_special_char_regexp = "^[^'\"\\;,:-<>\\s].+$";// 匹配邮编代码 216 217 218
/**//** 219 * 匹配非负整数(正整数 + 0) 220 */ 221 public static final String non_negative_integers_regexp = "^\\d+$"; 222 223 /**//** 224 * 匹配不包括零的非负整数(正整数 > 0) 225 */ 226 public static final
String non_zero_negative_integers_regexp = "^[1-9]+\\d*$"; 227 228 /**//** 229 * 230 * 匹配正整数 231 * 232 */ 233 public static final String positive_integer_regexp = "^[0-9]*[1-9][0-9]*$"; 234
235 /**//** 236 * 237 * 匹配非正整数(负整数 + 0) 238 * 239 */ 240 public static final String non_positive_integers_regexp = "^((-\\d+)|(0+))$"; 241 242 /**//** 243 * 244 * 匹配负整数 245 * 246 */ 247
public static final String negative_integers_regexp = "^-[0-9]*[1-9][0-9]*$"; 248 249 /**//** 250 * 251 * 匹配整数 252 * 253 */ 254 public static final String integer_regexp = "^-?\\d+$"; 255 256
/**//** 257 * 258 * 匹配非负浮点数(正浮点数 + 0) 259 * 260 */ 261 public static final String non_negative_rational_numbers_regexp = "^\\d+(\\.\\d+)?$"; 262 263 /**//** 264 * 265 * 匹配正浮点数 266 * 267 */
268 public static final String positive_rational_numbers_regexp = "^(([0-9]+\\.[0-9]*[1-9][0-9]*)|([0-9]*[1-9][0-9]*\\.[0-9]+)|([0-9]*[1-9][0-9]*))$"; 269 270 /**//** 271 * 272 * 匹配非正浮点数(负浮点数
+ 0) 273 * 274 */ 275 public static final String non_positive_rational_numbers_regexp = "^((-\\d+(\\.\\d+)?)|(0+(\\.0+)?))$"; 276 277 /**//** 278 * 279 * 匹配负浮点数 280 * 281 */ 282 public static
final String negative_rational_numbers_regexp = "^(-(([0-9]+\\.[0-9]*[1-9][0-9]*)|([0-9]*[1-9][0-9]*\\.[0-9]+)|([0-9]*[1-9][0-9]*)))$"; 283 284 /**//** 285 * 286 * 匹配浮点数 287 * 288 */ 289
public static final String rational_numbers_regexp = "^(-?\\d+)(\\.\\d+)?$"; 290 291 /**//** 292 * 293 * 匹配由26个英文字母组成的字符串 294 * 295 */ 296 public static final String letter_regexp =
"^[A-Za-z]+$"; 297 298 /**//** 299 * 300 * 匹配由26个英文字母的大写组成的字符串 301 * 302 */ 303 public static final String upward_letter_regexp = "^[A-Z]+$"; 304 305 /**//** 306 * 307 * 匹配由26个英文字母的小写组成的字符串
308 * 309 */ 310 public static final String lower_letter_regexp = "^[a-z]+$"; 311 312 /**//** 313 * 314 * 匹配由数字和26个英文字母组成的字符串 315 * 316 */ 317 public static final String letter_number_regexp
= "^[A-Za-z0-9]+$"; 318 319 /**//** 320 * 321 * 匹配由数字、26个英文字母或者下划线组成的字符串 322 * 323 */ 324 public static final String letter_number_underline_regexp = "^\\w+$"; 325 326 /**//** 327 * 添加正规表达式
(以key->value的形式存储) 328 * 329 * @param regexpName 330 * 该正规表达式名称 ` 331 * @param regexp 332 * 该正规表达式内容 333 */ 334 public void putRegexpHash(String regexpName, String regexp) 335 ...{ 336
regexpHash.put(regexpName, regexp); 337 } 338 339 /**//** 340 * 得到正规表达式内容 (通过key名提取出value[正规表达式内容]) 341 * 342 * @param regexpName 343 * 正规表达式名称 344 * 345 * @return 正规表达式内容 346 */ 347 public
String getRegexpHash(String regexpName) 348 ...{ 349 if (regexpHash.get(regexpName) != null) 350 ...{ 351 return ((String) regexpHash.get(regexpName)); 352 } 353 else 354 ...{ 355
System.out.println("在regexpHash中没有此正规表达式"); 356 return ""; 357 } 358 } 359 360 /**//** 361 * 清除正规表达式存放单元 362 */ 363 public void clearRegexpHash() 364 ...{ 365 regexpHash.clear(); 366 return;
367 } 368 369 /**//** 370 * 大小写敏感的正规表达式批配 371 * 372 * @param source 373 * 批配的源字符串 374 * 375 * @param regexp 376 * 批配的正规表达式 377 * 378 * @return 如果源字符串符合要求返回真,否则返回假 如:
Regexp.isHardRegexpValidate("ygj@suncer.com.cn",email_regexp) 返回真 379 */ 380 public static boolean isHardRegexpValidate(String source, String regexp) 381 ...{ 382 383 try 384 ...{ 385 //
用于定义正规表达式对象模板类型 386 PatternCompiler compiler = new Perl5Compiler(); 387 388 // 正规表达式比较批配对象 389 PatternMatcher matcher = new Perl5Matcher(); 390 391 // 实例大小大小写敏感的正规表达式模板 392 Pattern
hardPattern = compiler.compile(regexp); 393 394 // 返回批配结果 395 return matcher.contains(source, hardPattern); 396 397 } 398 catch (MalformedPatternException e) 399 ...{ 400 e.printStackTrace();
401 402 } 403 return false; 404 } 405 406
|
Regexp.zip
|
|
描述:
|
java源码
|

下载
|
|
文件名:
|
Regexp.zip
|
|
文件大小:
|
9 KB
|