计算机教程

POSIX 风格和兼容 Perl 风格两种正则表达式主要函数的类比(preg_match, preg_replace, ereg, ereg_replace)

17 8月 , 2019  

必赢娱乐棋牌,1. preg_match — 执行一个正则表达式匹配 int preg_match ( string $pattern , string $subject [, array
&$matches [, int $flags = 0 [, int $offset = 0 ]]] )
搜索subject与pattern给定的正则表达式的一个匹配.
pattern:
要搜索的模式,字符串类型。
subject :
输入字符串。
matches:
如果提供了参数matches,它将被填充为搜索结果。
$matches[0]将包含完整模式匹配到的文本,
$matches[1]将包含第一个捕获子组匹配到的文本,以此类推。
flags:
flags可以被设置为以下标记值:PREG_OFFSET_CAPTURE
如果传递了这个标记,对于每一个出现的匹配返回时会附加字符串偏移量(相对于目标字符串的)。
注意:这会改变填充到matches参数的数组,使其每个元素成为一个由
第0个元素是匹配到的字符串,第1个元素是该匹配字符串
在目标字符串subject中的偏移量。
offset:
通常,搜索从目标字符串的开始位置开始。可选参数 offset 用于
指定从目标字符串的某个未知开始搜索(单位是字节)。
返回值:
preg_match()返回 pattern 的匹配次数。
它的值将是0次(不匹配)或1次,因为 preg_match()在第一次匹配后
将会停止搜索。
preg_match_all()不同于此,它会一直搜索subject直到到达结尾。
如果发生错误 preg_match()返回 FALSE。
示例:

首先来看看 POSIX 风格正则表达式的两个主要函数:

复制代码 代码如下:

ereg 函数:(正则表达式匹配)

<?php
/*
 *模式分隔符后的”i”标记这是一个大小写不敏感的搜索
 *将会输出:1
 */
echo preg_match(“/,\s*(php)/i”, “In my point, PHP is the web
scripting language of choice.”);
echo “<br/>”.”\n”;
/*
 *将会输出:Array([0]=>, PHP [1]=>PHP) 
 */
$matches = array();
preg_match(“/,\s*(php)/i”, “In my point, PHP is the web scripting
language of choice. I love php”, $matches);
print_r($matches);
echo “<br/>”.”\n”;
/*
 *将会输出:Array([0]=>Array([0]=>, PHP [1]=>11)
[1]=>Array([0]=>PHP [1]=>13)) 
 */
preg_match(“/,\s*(php)/i”, “In my point, PHP is the web scripting
language of choice. I love php”, $matches, PREG_OFFSET_CAPTURE);
print_r($matches);
echo “<br/>”.”\n”;
/*
 *将会输出:Array([0]=>Array([0]=>e php [1]=63)
[1]=>Array([0]=>php [1]=>65)) 
 */
preg_match(“/[,a-z]?\s*(php)/i”, “In my point, PHP is the web
scripting language of choice. I love php”, $matches,
PREG_OFFSET_CAPTURE, 28);
print_r($matches);
echo “<br/>”.”\n”;
?> 

格式:int ereg ( string pattern, string string [, array &regs] )
注意:使用 Perl 兼容正则表达式语法的 preg_match() 函数通常是比 ereg()
更快的替代方案。(一般的话还是使用 preg_match() ,比较好勒~~)

2.preg_match_all — 执行一个全局正则表达式匹配 int preg_match_all ( string $pattern , string $subject [, array
&$matches [, int $flags = PREG_PATTERN_ORDER [, int $offset = 0
]]] )
搜索subject中所有匹配pattern给定正则表达式
的匹配结果并且将它们以flag指定顺序输出到matches中. 在第一个匹配找到后,
子序列继续从最后一次匹配位置搜索.
pattern:
要搜索的模式,字符串形式。
subject :
输入字符串。
matches:
多维数组,作为输出参数输出所有匹配结果, 数组排序通过flags指定。
flags:
可以结合下面标记使用(注意不能同时使用PREG_PATTERN_ORDER和PREG_SET_ORDER),如果没有给定排序标记,假定设置为PREG_PATTERN_ORDER:
PREG_PATTERN_ORDER:
结果排序为$matches[0]保存完整模式的所有匹配,
$matches[1]保存第一个子组的所有匹配,以此类推。
PREG_SET_ORDER:
结果排序为$matches[0]包含第一次匹配得到的所有匹配(包含子组),
$matches[1]是包含第二次匹配到的所有匹配(包含子组)的数组,以此类推。
PREG_OFFSET_CAPTURE:
如果这个标记被传递,每个发现的匹配返回时会增加它相对目标字符串的偏移量。
注意这会改变matches中的每一个匹配结果字符串元素,使其
成为一个第0个元素为 匹配结果字符串,第1个元素为
匹配结果字符串在subject中的偏移量。
返回值:
返回完整匹配次数(可能是0),或者如果发生错误返回FALSE。
示例:

以区分大小写的方式在 string 中寻找与给定的正则表达式 pattern
所匹配的子串。如果找到与 pattern
中圆括号内的子模式相匹配的子串并且函数调用给出了第三个参数
regs,则匹配项将被存入 regs 数组中。$regs[1]
包含第一个左圆括号开始的子串,$regs[2]
包含第二个子串,以此类推。$regs[0] 包含整个匹配的字符串。

复制代码 代码如下:

返回值:如果在 string 中找到 pattern 模式的匹配则返回
所匹配字符串的长度,如果没有找到匹配或出错则返回
FALSE。如果没有传递入可选参数 regs 或者所匹配的字符串长度为
0,则本函数返回 1。

<?php
/*
 *将会输出:2
 */
echo preg_match_all(“/php/i”, “In my point, PHP is the web scripting
language of choice. I love php”, $matches);
echo “<br/>”.”\n”;
/*
 *将会输出:Array([0]=>, PHP [1]=>PHP) 
 */
$matches = array();
preg_match(“/[,a-z]?\s*(php)/i”, “In my point, PHP is the web
scripting language of choice. I love php”, $matches);
print_r($matches);
echo “<br/>”.”\n”;
/*
 *将会输出:Array([0]=>Array([0]=>, PHP [1]=>e php)
[1]=>Array([0]=>PHP [1]=>php)) 
 */
$matches = array();
preg_match_all(“/[,a-z]?\s*(php)/i”, “In my point, PHP is the web
scripting language of choice. I love php”, $matches,
PREG_PATTERN_ORDER);
print_r($matches);
echo “<br/>”.”\n”;
/*
 *将会输出:Array([0]=>Array([0]=>Array([0]=>, PHP
[1]=>11) [1]=>Array([0]=>PHP [1]=>13))
[1]=>Array([0]=>Array([0]=>e php [1]=>63)
[1]=>Array([0]=>php [1]=>65)))
 */
$matches = array();
preg_match_all(“/[,a-z]?\s*(php)/i”, “In my point, PHP is the web
scripting language of choice. I love php”, $matches,
PREG_SET_ORDER|PREG_OFFSET_CAPTURE);
print_r($matches);
echo “<br/>”.”\n”;
/*
 *Array([0]=>Array([0]=>e php [1]=>63)
[1]=>Array([0]=>php [1]=>65))
 */
$matches = array();
preg_match_all(“/[,a-z]?\s*(php)/i”, “In my point, PHP is the web
scripting language of choice. I love php”, $matches,
PREG_SET_ORDER|PREG_OFFSET_CAPTURE, 28);
print_r($matches);
echo “<br/>”.”\n”;
?>

来看看 ereg() 函数的例子:

3.preg_split — 通过一个正则表达式分隔字符串 array preg_split ( string $pattern , string $subject [, int $limit =
-1 [, int $flags = 0 ]] )
通过一个正则表达式分隔给定字符串.
pattern:
用于搜索的模式,字符串形式。
subject:
输入字符串
limit:
如果指定,将限制分隔得到的子串最多只有limit个,返回的最后一个
子串将包含所有剩余部分。limit值为-1, 0或null时都代表”不限制”,
作为php的标准,你可以使用null跳过对flags的设置。
flags:
flags 可以是任何下面标记的组合(以位或运算 | 组合):
PREG_SPLIT_NO_EMPTY:
如果这个标记被设置, preg_split() 将进返回分隔后的非空部分。
PREG_SPLIT_DELIM_CAPTURE:
如果这个标记设置了,用于分隔的模式中的括号表达式将被捕获并返回。
PREG_SPLIT_OFFSET_CAPTURE:
如果这个标记被设置, 对于每一个出现的匹配返回时将会附加字符串偏移量.
注意:这将会改变返回数组中的每一个元素,
使其每个元素成为一个由第0个元素为分隔后的子串,第1个元素为该子串在subject中的偏移量组成的数组。
返回值:
返回一个使用 pattern 边界分隔 subject 后得到 的子串组成的数组。
示例:

以下代码片断接受 ISO 格式的日期(YYYY-MM-DD)然后以 DD.MM.YYYY
格式显示:

复制代码 代码如下:

复制代码 代码如下:

<?php
/*
 *将会输出:
 *Array ( [0] => In my point, [1] => is the web scripting
language of choice. I love [2] => )
 */
$matches = array();
print_r(preg_split(“/php/i”, “In my point, PHP is the web scripting
language of choice. I love php”));
echo “<br/>”.”\n”;
/*
 *将会输出:
 *Array ( [0] => In my point, [1] => is the web scripting
language of choice. I love php )
 */
$matches = array();
print_r(preg_split(“/php/i”, “In my point, PHP is the web scripting
language of choice. I love php”, 2));
echo “<br/>”.”\n”;
/*
 *将会输出:
 *Array ( [0] => In my point, [1] => is the web scripting
language of choice. I love )
 */
$matches = array();
print_r(preg_split(“/php/i”, “In my point, PHP is the web scripting
language of choice. I love php”, -1, PREG_SPLIT_NO_EMPTY));
echo “<br/>”.”\n”;
?>

<?php
if (ereg (“([0-9]{4})-([0-9]{1,2})-([0-9]{1,2})”, $date, $regs))
{
echo “$regs[3].$regs[2].$regs[1]”;
} else {
echo “Invalid date format: $date”;
}
?>

4.preg_quote — 转义正则表达式字符 string preg_quote ( string $str [, string $delimiter = NULL ] )
preg_quote()需要参数 str 并向其中
每个正则表达式语法中的字符前增加一个反斜线。
这通常用于你有一些运行时字符串 需要作为正则表达式进行匹配的时候。


正则表达式特殊字符有: . \ + * ? [ ^ ] $ ( ) { } = ! < > | :

str:
输入字符串
delimiter:
如果指定了可选参数 delimiter,它也会被转义。这通常用于
转义PCRE函数使用的分隔符。 /是最通用的分隔符。
返回值:
返回转义后的字符串。
示例:

复制代码 代码如下:

<?php
//在这个例子中,preg_quote($word)
用于保持星号原文涵义,使其不使用正则表达式中的特殊语义。
$textbody = “This book is *very* difficult to find.”;
$word = “*very*”;
$textbody = preg_replace (“/” . preg_quote($word) . “/”, “<i>” .
$word . “</i>”, $textbody);
//将会输出This book is <i>*very*</i> difficult to find.
echo htmlspecialchars($textbody);
?>

5.preg_grep — 返回匹配模式的数组条目 array preg_grep ( string $pattern , array $input [, int $flags = 0
] )
返回给定数组input中与模式pattern匹配的元素组成的数组.
pattern:
要搜索的模式, 字符串形式.
input:
输入数组.
flags:
如果设置为PREG_GREP_INVERT, 这个函数返回输入数组中与
给定模式pattern不匹配的元素组成的数组.
返回值:
返回使用input中key做索引的数组.
示例:

复制代码 代码如下:

<?php
$array = array(“abc”, “dd”, “123”, “123.22”, “word123”, “33.2”,
“0.22”);
//返回所有包含浮点数的元素
//输出:Array ( [3] => 123.22 [5] => 33.2 [6] => 0.22 )
$fl_array = preg_grep(“/^(\d+)?\.\d+$/”, $array);
print_r($fl_array);
//返回所有包含浮点数的元素
//输出:Array ( [0] => abc [1] => dd [2] => 123 [4]
=> word123 )
$fl_array = preg_grep(“/^(\d+)?\.\d+$/”, $array,
PREG_GREP_INVERT);
print_r($fl_array);
?>

6.preg_replace — 执行一个正则表达式的搜索和替换 mixed preg_replace ( mixed $pattern , mixed $replacement , mixed
$subject [, int $limit = -1 [, int &$count ]] )
搜索subject中匹配pattern的部分, 以replacement进行替换。
pattern:
要搜索的模式。可以是一个字符串或字符串数组。 可以使用一些PCRE修饰符,
包括’e'(PREG_REPLACE_EVAL),可以为这个函数指定。
replacement:
用于替换的字符串或字符串数组。如果这个参数是一个字符串,并且pattern是一个数组,那么所有的模式都使用这个字符串进行替换。如果pattern和replacement都是数组,每个pattern使用replacement中对应的
元素进行替换。如果replacement中的元素比pattern中的少,
多出来的pattern使用空字符串进行替换。replacement中可以包含后向引用\\n或(php
4.0.4以上可用)$n,语法上首选后者。 每个
这样的引用将被匹配到的第n个捕获子组捕获到的文本替换。
n可以是0-99,\\0和$0代表完整的模式匹配文本。
捕获子组的序号计数方式为:代表捕获子组的左括号从左到右,
从1开始数。如果要在replacement中使用反斜线,必须使用4个(“\\\\”,译注:因为这首先是php的字符串,经过转义后,是两个,再经过
正则表达式引擎后才被认为是一个原文反斜线)。
当在替换模式下工作并且后向引用后面紧跟着需要是另外一个数字(比如:在一个匹配模式后紧接着增加一个原文数字),
不能使用\\1这样的语法来描述后向引用。比如, \\11将会使
preg_replace()不能理解你希望的是一个\\1后向引用紧跟一个原文1,还是
一个\\11后向引用后面不跟任何东西。 这种情况下解决方案是使用${1}1。
这创建了一个独立的$1后向引用, 一个独立的原文1。 当使用e修饰符时,
这个函数会转义一些字符(即:’、”、 \ 和 NULL)
然后进行后向引用替换。当这些完成后请确保后向引用解析完后没有单引号或
双引号引起的语法错误(比如:
‘strlen(\’$1\’)+strlen(“$2”)’)。确保符合PHP的
字符串语法,并且符合eval语法。因为在完成替换后,
引擎会将结果字符串作为php代码使用eval方式进行评估并将返回值作为最终参与替换的字符串。
subject:
要进行搜索和替换的字符串或字符串数组。
如果subject是一个数组,搜索和替换回在subject的每一个元素上进行,
并且返回值也会是一个数组。
limit:
每个模式在每个subject上进行替换的最大次数。默认是 -1(无限)。
count:
如果指定,将会被填充为完成的替换次数。
返回值:
如果subject是一个数组, preg_replace()返回一个数组,
其他情况下返回一个字符串。
如果匹配被查找到,替换后的subject被返回,其他情况下 返回没有改变的
subject。如果发生错误,返回 NULL 。
示例:
使用后向引用紧跟数值原文:

复制代码 代码如下:

<?php
$string = ‘April 15, 2003’;
/*
 *\w+字符重复一次或者多次
 *\d+数字重复一次或者多次
 *i忽略大小写
 */
$pattern = ‘/(\w+) (\d+), (\d+)/i’;
/*
 *$0 完整的模式匹配文本
 *${1}1 第一个小括号中的模式匹配文本并且在后面加1
 *\\3 第三个小括号中的模式匹配文本
 */
$replacement = ‘$0:<br/> ${1}1,\\3’;
echo preg_replace($pattern, $replacement, $string);
?>

preg_replace()中使用基于索引的数组:

复制代码 代码如下:

$string = ‘The quick brown fox jumped over the lazy dog.’;
$patterns = array();
$patterns[0] = ‘/quick/’;
$patterns[1] = ‘/brown/’;
$patterns[2] = ‘/fox/’;
$replacements = array();
$replacements[2] = ‘bear’;
$replacements[1] = ‘black’;
$replacements[0] = ‘slow’;
//会输出:The bear black slow jumped over the lazy dog.
echo preg_replace($patterns, $replacements, $string);
//对模式和替换内容按key进行排序我们可以得到期望的结果.
ksort($patterns);
ksort($replacements);
//会输出:The slow black bear jumped over the lazy dog.
echo preg_replace($patterns, $replacements, $string);

替换一些值:

复制代码 代码如下:

<?php
$patterns = array (‘/(19|20)(\d{2})-(\d{1,2})-(\d{1,2})/’,
                   ‘/^\s*{(\w+)}\s*=/’);
$replace = array (‘\3/\4/\1\2’, ‘$\1 =’);
echo preg_replace($patterns, $replace, ‘{startDate} = 1999-5-27’);
?>

使用修饰符’e’:

复制代码 代码如下:

<?php
$html_body = “<p><span>hello</span></p>”;
//会输出:<P><SPAN>hello</SPAN></P>
echo
htmlspecialchars(preg_replace(“/(<\/?)(\w+)([^>]*>)/e”,
             “‘\\1’.strtoupper(‘\\2’).’\\3′”,
             $html_body));
?>

剥离空白字符:

复制代码 代码如下:

<?php
$str = ‘foo   o’;
$str = preg_replace(‘/\s\s+/’, ‘ ‘, $str);
// 将会改变为’foo o’
echo $str;
?>

使用参数count:

复制代码 代码如下:

<?php
$count = 0;
echo preg_replace(array(‘/\d/’, ‘/\s/’), ‘*’, ‘xp 4 to’, -1 ,
$count);
//等价于echo preg_replace(‘/\d|\s/’, ”, ‘xp 4 to’, -1 , $count);
echo $count; //3
?>

7.preg_replace_callback —
执行一个正则表达式搜索并且使用一个回调进行替换
mixed preg_replace_callback ( mixed $pattern , callable $callback ,
mixed $subject [, int $limit = -1 [, int &$count ]] )
这个函数的行为除了 可以指定一个 callback 替代 replacement 进行替换
字符串的计算,其他方面等同于 preg_replace()。
pattern:
要搜索的模式,可以使字符串或一个字符串数组。
callback:
一个回调函数,在每次需要替换时调用,调用时函数得到的参数是从subject中匹配到的结果。回调函数返回真正参与替换的字符串。
你可能经常会需要callback函数而 仅用于
preg_replace_callback()一个地方的调用。在这种情况下,你可以使用匿名函数来定义一个匿名函数作为preg_replace_callback()调用时的回调。
这样做你可以保留所有
调用信息在同一个位置并且不会因为一个不在任何其他地方使用的回调函数名称而污染函数名称空间。
subject:
要搜索替换的目标字符串或字符串数组。
limit:
对于每个模式用于每个 subject 字符串的最大可替换次数。
默认是-1(无限制)。
count:
如果指定,这个变量将被填充为替换执行的次数。
示例:
preg_replace_callback() 和 create_function():

复制代码 代码如下:

<?php
// 将文本中的年份增加一年.
$text = “April fools day is 04/01/2002\n”;
$text.= “Last christmas was 12/24/2001\n”;
// 回调函数
function next_year($matches)
{
  // 通常: $matches[0]是完成的匹配
  // $matches[1]是第一个捕获子组的匹配
  // 以此类推
  return $matches[1].($matches[2]+1);
}
/**
 *将会输出:
 *April fools day is 04/01/2003
 *Last christmas was 12/24/2002
 */
echo preg_replace_callback(
            “|(\d{2}/\d{2}/)(\d{4})|”,
            “next_year”,
            $text);
//使用create_function
echo preg_replace_callback(
            “|(\d{2}/\d{2}/)(\d{4})|”,
            create_function(
            ‘$matches’,
            ‘return $matches[1].($matches[2]+1);’
            ),
            $text);
?>

ereg_replace 函数:(正则表达式替换)

您可能感兴趣的文章:

格式:string ereg_replace ( string pattern, string replacement, string
string )
函数说明:
本函数在 string 中扫描与 pattern 匹配的部分,并将其替换为
replacement。
返回替换后的字符串。(如果没有可供替换的匹配项则会返回原字符串。)
如果 pattern 包含有括号内的子串,则 replacement 可以包含形如 \\digit
的子串,这些子串将被替换为数字表示的第几个括号内的子串;\\0
则包含了字符串的整个内容。最多可以用九个子串。括号可以嵌套,此情形下以左圆括号来计算顺序。
如果未在 string 中找到匹配项,则 string 将原样返回。
来看看这个函数例子吧:
1,下面的代码片断输出 “This was a test” 三次:

复制代码 代码如下:

<?php
$string = “This is a test”;
echo str_replace(” is”, ” was”, $string);
echo ereg_replace(“( )is”, “\\1was”, $string);
echo ereg_replace(“(( )is)”, “\\2was”, $string);
?>

要注意的一点是如果在 replacement
参数中使用了整数值,则可能得不到所期望的结果。这是因为ereg_replace()
将把数字作为字符的序列值来解释并应用之。例如:
2,replacement 参数为整数时的例子:

复制代码 代码如下:

<?php
/* 不能产生出期望的结果 */
$num = 4;
$string = “This string has four words.”;
$string = ereg_replace(‘four’, $num, $string);
echo $string; /* Output: ‘This string has words.’ */
/* 本例工作正常 */
$num = ‘4’;
$string = “This string has four words.”;
$string = ereg_replace(‘four’, $num, $string);
echo $string; /* Output: ‘This string has 4 words.’ */
?>

3,将 URL 替换为超链接:


相关文章

发表评论

电子邮件地址不会被公开。 必填项已用*标注

网站地图xml地图