JAVA_正则表达式简介概要1.doc
文本预览下载声明
Java的正则表达式讲解:(为了能看清,本文正则表达式用中文的句号代替英文句点)
英文句点符号:匹配单个任意字符。
eg:
表达式”t。o 可以匹配:tno,t#o,teo等等。不可以匹配:tnno,to,Tno,t正o等。
方括号:只有方括号里面指定的字符才参与匹配,也只能匹配单个字符。
eg:
表达式:t[abcd]n 只可以匹配:tan,tbn,tcn,tdn。不可以匹配:thn,tabn,tn等。
3 | 符号。相当与“或”,可以匹配指定的字符,但是也只能选择其中一项进行匹配。
eg:
表达式:t(a|b|c|dd)n 只可以匹配:tan,tbn,tcn,tddn。不可以匹配taan,tn,tabcn
表示匹配次数的符号
{n, }表示至少N次。
eg:
表达式:[0—9]{ 3 } \— [0-9]{ 2 } \— [0-9]{ 3 } 的匹配格式为:999—99—999
因为“—”符号在正则表达式中有特殊的含义,它表示一个范围,所以在前面加转义字符“\”。
^符号:表示否
^符号被称为“否”符号,如果用在方括号内,“^“表示不想匹配的字符。
eg:
表达式:[^x] 第一个字符不能是x
6:圆括号,和空白符号
“\s”是空白符号,只可以匹配一个空格、制表符、回车符、换页符,不可以匹配自己输入的多个空格。
()是分组号,可以用ORO API提取处出值,后面将详细讨论。
7:正则表达式的一些快捷符号:
\d表示[0—9], \D表示[^0—9], \w表示[0—9A—Z_a—z],
\W表示[^0—9A—Z_a—z], \s表示[\t\n\r\f], \S表示[^\t\n\r\f]
8 一些常用的正则表达式:
Java:(([a-z]|_)(\\w*)){6,20}匹配以字母或下划线开头,字母数字下划线结尾的字符串
JavaScript:/^(\-?)(\d+)$/匹配数字。/^\w+$/匹配字母数字下划线。
.+ 一个或多个字符
/0 第一次匹配的字符串
java类中使用正则表达式:
eg1:
Pattern p = Ppile(t.n);
Matcher m = p.matcher(“ton”);
if(m.matches()){
return true;
}
eg2:boolean bool=Pattern.matches (“t.n”,”ton”);
如果一个正则表达式要重复利用,用第一种,如果只匹配一次,第二种是最佳选择。
反斜线字符(‘\’)用于转义字符,同时还可以引用非转义字符(不包括非转义字母)
因此‘\\’表示‘\’,‘\{’表示{。 但是‘\y’就是错的,因为在不表示根据 Java Language Specification 的要求,Java 源代 Unicode 转义或其他字符。因此必 Java 字 \b 与 \\b 与 \(hello\) 是非法的,将 (hello) 匹配,必 \\(hello\\)。 注意:‘\b’是一个字符而‘\\b’是两个字符
Pattern类
8种模式:比如启用多行模式,启用unix模式等,eg int CASE_INSENSITIVE表示启用不区分大小写的模式。
4个静态方法
两个单例模式构造器:
Pattern compile(String regex);
Pattern compile(String regex,int flags)flags为八种模式的一种
eg2:
Pattern p=Ppile([a-z]\\s[a-z]);
Matcher m=p.matcher(b c);
if(m.matches()) Sysout(1111);
else Sysout(2222); 输出结果为1111;
一个匹配方法,一个返回String的字面值模式方法:
boolean matches(String regex,CharSequence input);//input与regex匹
配返回true。
String quote(String s);//返回指定String的字面值。
eg3:boolean bool=Pattern.matches([a-z] [a-z],”b c”); //结果为true
Sysout(Pattern.quote(“a_#/tb”)); //输出结果为 “\Qa_# b”\E
6个普通方法
返回此模式的匹配器: Matcher matcher(CharSequence input);
返回此模式的标志: int flags();
返回此模式的regex: String pattern();
两个字符串切割方法: String[] split(Cha
显示全部