MySQL REGEXP_REPLACE() 函数将 string 中与 pattern 指定的正则表达式匹配的匹配项替换为替换字符串replace,并返回结果字符串。如果字符串或模式为NULL,则返回值为NULL。
默认情况下,REGEXP_REPLACE() 函数执行不区分大小写的匹配,除非与二进制字符串一起使用。
语法
REGEXP_REPLACE(string, pattern, replace,
position, occurrence, match_type)
参数
string | 必填。 指定要搜索的字符串。 |
pattern | 必填。 指定正则表达式匹配信息。请参阅下表了解模式语法。 |
replace | 必需。 指定替换子字符串。 |
position | 可选。 指定字符串中开始搜索的位置。默认值为 1。 |
occurrence | 可选。 指定要替换的匹配项。默认值为 0(表示"替换所有出现的位置")。 |
match_type | 可选。 指定如何执行匹配。它可以采用以下值:
有关此参数的其他信息,请参阅 REGEXP_LIKE() 函数。 |
正则表达式模式
符号 | 描述 |
---|---|
^ | 匹配字符串的开头。 |
$ | 匹配字符串的结尾字符串。 |
* | 匹配零次或多次出现。 |
+ | 匹配一次或多次出现。 |
? | 匹配零次或一次出现。 |
. | 匹配除 NULL 之外的任何字符。 |
| | 像"OR"一样使用来指定多个替代字符。 |
[ ] | 匹配 [] 内指定的任何单个字符。 |
[^ ] | 匹配 [] 内未指定的任何单个字符。 |
- | 表示字符范围。 |
( ) | 用于将表达式分组为子表达式。 |
{m} | 匹配 m |
{m,} | 匹配至少 m 次。 |
{m,n} | 匹配至少 m 次,但不超过 n 次。 |
\n | n 是 1 到 9 之间的数字。匹配找到的第 n 个子表达式在 ( ) 内遇到 \n 之前。 |
\d | 匹配数字字符。 |
\D | 匹配非数字字符。 |
\w | 匹配单词字符。 |
\W | 匹配非单词字符。 |
\s | 匹配空白字符。 |
\s | 匹配空白字符。 |
\S | 匹配非空白字符。 |
*? | 匹配前面的模式出现零次或多次。 |
+? | 匹配前面的模式出现一次或多次。 |
?? | 匹配前面的模式零次或一次出现。 |
? | 匹配前面的模式n 次。 |
? | 与前面的模式匹配至少 n 次。 |
? | 匹配前面的模式至少 n 次,但不超过 m 次。 |
[..] | 匹配一种排序规则可以是多个字符的元素。 |
[=character_class=] | 表示一个等价类。它匹配具有相同排序值的所有字符,包括其自身。 |
[:character_class:] | 表示匹配属于该字符的所有字符的字符类 |
标准类名列表
字符类名称 | 含义 |
---|---|
alnum | 字母数字字符 |
alpha | 字母字符 |
blank | 空白字符 |
cntrl | 控制字符 |
digit | 数字字符 |
graph | 图形字符 |
lower | 小写字母字符 |
图形或空格字符 | |
punct | 标点符号 |
space | 空格、制表符、换行符和回车符 |
upper | 大写字母字符 |
xdigit | 十六进制数字字符 |
示例:REGEXP_REPLACE() 示例
下面的示例显示了REGEXP_REPLACE() 函数的用法。
mysql> SELECT REGEXP_REPLACE('a b c', 'b', 'X');
Result: 'a X c'
mysql> SELECT REGEXP_REPLACE('abc def ghi', '[a-z]+', 'X', 1, 3);
Result: 'abc def X'
mysql> SELECT REGEXP_REPLACE('abc123ghi', '[0-9]+', '');
Result: 'abcghi'
mysql> SELECT REGEXP_REPLACE('<html><head><title>title</title><body>body</body></htm>', '','');
Result: 'titlebody'
示例:匹配多个替代项
考虑一个名为 Employee 的数据库表,其中包含以下记录:
EmpID | Name | City | Age |
---|---|---|---|
1 | John Smith | London | 25 |
2 | Marry Knight | New York | 24 |
3 | Jo Williams | Paris | 27 |
4 | Smith Fischer | Amsterdam | 30 |
5 | Aman Gupta | New Delhi | 28 |
以下查询是用于将City列记录中的所有元音替换为"@"。要在模式中指定多个替代方案,请使用 |。
SELECT *,
REGEXP_REPLACE(City, 'a|e|i|o|u', '@') AS Replaced_City
FROM Employee
这将产生类似于以下内容的结果:
EmpID | Name | City | Age | Replaced_City |
---|---|---|---|---|
1 | John Smith | London | 25 | L@nd@n |
2 | Marry Knight | New York | 24 | N@w Y@rk |
3 | Jo Williams | Paris | 27 | P@r@s |
4 | Smith Fischer | Amsterdam | 30 | @mst@rd@m |
5 | Aman Gupta | New Delhi | 28 | N@w D@lh@ |
示例:单词匹配
考虑上面讨论的表格。以下查询用于将 Name 列中的第一个单词(名字)替换为"Mr."。要指定字符范围,请使用 [ ]
SELECT *,
REGEXP_REPLACE(Name, '[a-z]+', 'Mr.', 1, 1) AS ReplacedName
FROM Employee
这将产生类似于以下内容的结果:
EmpID | Name | City | Age | ReplacedName |
---|---|---|---|---|
1 | John Smith | London | 25 | Mr. Smith |
2 | Marry Knight | New York | 24 | Mr. Knight |
3 | Jo Williams | Paris | 27 | Mr. Williams |
4 | Smith Fischer | Amsterdam | 30 | Mr. Fischer |
5 | Aman Gupta | New Delhi | 28 | Mr. Gupta |