es-regexp

用的太少了, 工作了两年几乎没用过, 而且很难理解, 考前突袭不要花太多时间在这上面了

正则表达式

正则表达式是独立于 JS 的一种通用模式，许多的字符都和 JS 相同，不可以混记

正则表达式是匹配模式，要么匹配字符，要么匹配位置。请记住这句话。

复数含义的字符

修饰符

字符匹配

如果正则只有精确匹配是没多大意义的，比如 /hello/，也只能匹配字符串中的 "hello" 这个子串。

横向模糊匹配

横向模糊指的是，一个正则可匹配的字符串的长度不是固定的，可以是多种情况的。

其实现的方式是使用量词。譬如 {m,n}，表示连续出现最少 m 次，最多 n 次。

纵向模糊匹配

纵向模糊指的是，一个正则匹配的字符串，具体到某一位字符时，它可以不是某个确定的字符，可以有多种可能。

其实现的方式是使用字符组。譬如 [abc]，表示该字符是可以字符“a”、“b”、“c”中的任何一个。

字符组

需要强调的是，虽叫字符组（字符类），但只是其中一个字符。例如 [abc]，表示匹配一个字符，它可以是“a”、“b”、“c”之一。

范围表示法

如果字符组里的字符特别多的话，怎么办？可以使用范围表示法。

比如 [123456abcdefGHIJKLM]，可以写成 [1-6a-fG-M]。用连字符 - 来省略和简写。

排除字符组

纵向模糊匹配，还有一种情形就是，某位字符可以是任何东西，但就不能是 "a"、"b"、"c"。

此时就是排除字符组（反义字符组）的概念。例如 [^abc]，表示是一个除 "a"、"b"、"c" 之外的任意一个字符。字符组的第一位放 ^（脱字符），表示求反的概念。

常见的简写形式

有了字符组的概念后，一些常见的符号我们也就理解了。因为它们都是系统自带的简写形式。

\s：[ \t\v\n\r\f]。表示空白符，包括空格、水平制表符、垂直制表符、换行符、回车符、换页符。

. 就是 [^\n\r\u2028\u2029]。通配符，表示几乎任意字符。换行符、回车符、行分隔符和段分隔符除外。

所有字符：[\s\S]，比起 . 更加准确，可以获取全部的字符

量词

量词也称重复。掌握 {m,n} 的准确含义后，只需要记住一些简写形式。

简写形式

贪婪匹配和惰性匹配

其中正则 /\d{2,5}/，表示数字连续出现 2 到 5 次。会匹配 2 位、3 位、4 位、5 位连续数字。

但是其是贪婪的，它会尽可能多的匹配。你能给我 6 个，我就要 5 个。你能给我 3 个，我就 3 个都要。反正只要在能力范围内，越多越好。

我们知道有时贪婪不是一件好事（请看文章最后一个例子）。而惰性匹配，就是尽可能少的匹配：

其中 /\d{2,5}?/ 表示，虽然 2 到 5 次都行，当 2 个就够的时候，就不在往下尝试了

通过在量词后面加个问号就能实现惰性匹配，因此所有惰性匹配情形如下：

对惰性匹配的记忆方式是：量词后面加个问号，问一问你知足了吗，你很贪婪吗？

多选分支

一个模式可以实现横向和纵向模糊匹配。而多选分支可以支持多个子模式任选其一。

具体形式如下：(p1|p2|p3)，其中 p1、p2 和 p3 是子模式，用 |（管道符）分隔，表示其中任何之一。

但有个事实我们应该注意，比如我用 /good|goodbye/，去匹配 "goodbye" 字符串时，结果是 "good"：

也就是说，分支结构也是惰性的，即当前面的匹配上了，后面的就不再尝试了。

匹配字符的案例

匹配字符，无非就是字符组、量词和分支结构的组合使用罢了。

下面找几个例子演练一下（其中，每个正则并不是只有唯一写法）

匹配 16 进制颜色值

匹配时间

匹配日期

Window 操作系统文件路径

匹配 Id

因为 . 是通配符，本身就匹配双引号的，而量词 * 又是贪婪的，当遇到 container 后面双引号时，不会停下来，会继续匹配，直到遇到最后一个双引号为止。

当然，这样也会有个问题。效率比较低，因为其匹配原理会涉及到“回溯”这个概念（这里也只是顺便提一下，第四章会详细说明）。可以优化如下：

queryString 转化为参数对象

读取 queryString 中某个属性的值

位置匹配

正则表达式是匹配模式，要么匹配字符，要么匹配位置。请记住这句话。

然而大部分人学习正则时，对于匹配位置的重视程度没有那么高。

位置的定义

位置是相邻字符之间的位置。比如，下图中箭头所指的地方：

锚字符

^和 $

^（脱字符）匹配开头，在多行匹配中匹配行开头，每一行只能有一个开头

$（美元符号）匹配结尾，在多行匹配中匹配行结尾，每一行只能一个结尾

比如我们把字符串的开头和结尾用 "#" 替换（位置可以替换成字符的！）：

\b 和\B

\b 是单词边界，具体就是 \w 和 \W 之间的位置，也包括 \w 和 ^ 之间的位置，以及 \w 和 $ 之间的位置。

首先，我们知道，\w 是字符组 [0-9a-zA-Z_] 的简写形式，即 \w 是字母数字或者下划线的中任何一个字符。而 \W 是排除字符组 [^0-9a-zA-Z_] 的简写形式，即 \W 是 \w 以外的任何一个字符。

此时我们可以看看 [#JS#] #Lesson_01#.#mp4# 中的每一个 #，是怎么来的。

\B 就是 \b 的反面的意思，非单词边界。例如在字符串中所有位置中，扣掉 \b，剩下的都是 \B 的。

具体说来就是 \w 与 \w、\W 与 \W、^ 与 \W，\W 与 $ 之间的位置。

先行断言 (?=p) 和 (?!p)

二者的学名分别是 positive lookahead 和 negative lookahead。中文翻译分别是正向先行断言和负向先行断言。

后行断言 (?<=p) 和 (?<!p)

也有书上把这四个东西，翻译成环视，即看看右边或看看左边。

但一般书上，没有很好强调这四者是个位置。比如 (?=p)，一般都理解成：要求接下来的字符与 p 匹配，但不能包括 p 的那些字符。

而在本人看来 (?=p) 就与 ^ 一样好理解，就是 p 前面的那个位置。

位置的特性

注意

把位置理解成空字符，但是能获取到位置只有匹配位置的方法

\s 是获取空格的，首先就和空字符不是同一个概念，而且 \s 是匹配字符的，不是匹配到位置 @@@

匹配位置的案例

不匹配任何字符的正则

数字的千位分隔符表示法

最后一个逗号

弄出所有的逗号

因为逗号出现的位置，要求后面 3 个数字一组，也就是 \d{3} 至少出现一次。

测试

因为上面的正则，仅仅表示把从结尾向前数，一但是 3 的倍数，就把其前面的位置替换成逗号。因此才会出现这个问题。

我们知道匹配开头可以使用 ^，但要求这个位置不是开头怎么办？

支持其他形式

此时我们需要修改正则，把里面的开头 ^ 和结尾 $，替换成 \b：

要求当前是一个位置，但不是 \b 前面的位置，其实 (?!\b) 说的就是 \B。

支持小数

验证密码问题

密码长度 6-12 位，由数字、小写字符和大写字母组成，但必须至少包括2 种字符。

此题，如果写成多个正则来判断，比较容易。但要写成一个正则就比较困难。

那么，我们就来挑战一下。看看我们对位置的理解是否深刻。

简化

不考虑“但必须至少包括 2 种字符”这一条件。我们可以容易写出：

判断是否包含有某一种字符

假设，要求的必须包含数字，怎么办？此时我们可以使用 (?=.*[0-9]) 来做。

.*[0-9]：表示匹配任意数量的字符，直到匹配到一个字符是数字。

(?=.*[0-9]) 代表：任意个任意字符后得跟着一个数字，在这样一段字符串的前面, 这意味着，在这个位置后面的字符串必须包含一个数子

(?=.*[0-9])^：意味着这个位置必须在开头，因为空字符是可以有多个的, 这意味着：从头开始匹配, 直到有一个字符后面跟着一个数字, 这匹配到的子串自然是在开头的位置的.

同时包含具体两种字符

比如同时包含数字和小写字母，可以用 (?=.*[0-9])(?=.*[a-z]) 来做。

括号的作用

不管哪门语言中都有括号。正则表达式也是一门语言，而括号的存在使这门语言更为强大。

对括号的使用是否得心应手，是衡量对正则的掌握水平的一个侧面标准。

括号的作用，其实三言两语就能说明白，括号提供了分组，便于我们引用它。

分组和分支结构

分组

我们知道 /a+/ 匹配连续出现的“a”，而要匹配连续出现的“ab”时，需要使用 /(ab)+/。

其中括号是提供分组功能，使量词 + 作用于“ab”这个整体，测试如下：

分支结构

而在多选分支结构 (p1|p2) 中，此处括号的作用也是不言而喻的，提供了子表达式的所有可能。

如果去掉正则中的括号，即 /^I love JavaScript|Regular Expression$/，匹配字符串是 "I love JavaScript" 和 "Regular Expression"，当然这不是我们想要的。

引用分组

这是括号一个重要的作用，有了它，我们就可以进行数据提取，以及更强大的替换操作。

以日期为例。假设格式是 yyyy-mm-dd 的，我们可以先写一个简单的正则：

提取数据

**注意：**如果正则是否有修饰符 g，match 返回的数组格式是不一样的，不会有后面三个附加属性

替换

其中 replace 中的，第二个参数里用 $1、$2、$3 指代相应的分组。等价于如下的形式：

反向引用

除了使用相应 API 来引用分组，也可以在正则本身里引用分组。但只能引用之前出现的分组，即反向引用。

其中 / 和 . 需要转义。虽然匹配了要求的情况，但也匹配 "2016-06/12" 这样的数据。

假设我们想要求分割符前后一致怎么办？此时需要使用反向引用：

注意里面的 \1，表示的引用之前的那个分组 (-|\/|\.)。不管它匹配到什么（比如 -），\1 都匹配那个同样的具体某个字符。

我们知道了 \1 的含义后，那么 \2 和 \3 的概念也就理解了，即分别指代第二个和第三个分组。

括号嵌套怎么办？

\10 表示什么呢？

另外一个疑问可能是，即 \10 是表示第 10 个分组，还是 \1 和 0 呢？

答案是前者，虽然一个正则里出现 \10 比较罕见。测试如下：

引用不存在的分组会怎样？

因为反向引用，是引用前面的分组，但我们在正则里引用了不存在的分组时，此时正则不会报错，只是匹配反向引用的字符本身。例如 \2，就匹配 "\2"。注意 "\2" 表示对 "2" 进行了转意。

非捕获分组

之前文中出现的分组，都会捕获它们匹配到的数据，以便后续引用，因此也称他们是捕获型分组。

如果只想要括号最原始的功能，但不会引用它，即，既不在 API 里引用，也不在正则里反向引用。此时可以使用非捕获分组 (?:p)，例如本文第一个例子可以修改为：

案例

字符串 Trim 方法模拟

trim 方法是去掉字符串的开头和结尾的空白符。有两种思路去做。

第一种，匹配到开头和结尾的空白符，然后替换成空字符。如：

第二种，匹配整个字符串，然后用引用来提取出相应的数据：

这里使用了惰性匹配 *?，不然也会匹配最后一个空格之前的所有空格的，匹配到\s 可以匹配为止

将每个单词的首字母转换为大写

找到每个空格后的第一个字母，但是\s 无法匹配开头配置，使用非捕获组保证函数参数正确

驼峰化

其中分组 (.) 表示首字母。单词的界定是，前面的字符可以是多个连字符、下划线以及空白符。正则后面的 ? 的目的，是为了应对 str 尾部的字符可能不是单词字符，比如 str 是 '-moz-transform '。

中划线化

Html 转义和反转义

其中使用了用构造函数生成的正则，然后替换相应的格式就行了，这个跟本章没多大关系。

倒是它的逆过程，使用了括号，以便提供引用，也很简单，如下：

匹配成对标签

其中开标签 <[^>]+> 改成 <([^>]+)>，使用括号的目的是为了后面使用反向引用，而提供分组。闭标签使用了反向引用，<\/\1>。

另外 [\d\D] 的意思是，这个字符是数字或者不是数字，因此，也就是匹配任意字符的意思。

回溯法原理

没有回溯的匹配

而当目标字符串是 "abbbc" 时，就没有所谓的“回溯”。其匹配过程是：

有回溯的匹配

图中第 5 步有红颜色，表示匹配不成功。此时 b{1,3} 已经匹配到了 2 个字符“b”，准备尝试第三个时，结果发现接下来的字符是“c”。那么就认为 b{1,3} 就已经匹配完毕。

最后再用子表达式 c，去匹配字符“c”。当然，此时整个表达式匹配成功了。

其中第 7 步和第 10 步是回溯。第 7 步与第 4 步一样，此时 b{1,3} 匹配了两个 "b"，而第 10 步与第 3 步一样，此时 b{1,3} 只匹配了一个 "b"，这也是 b{1,3} 的最终匹配结果。

图中省略了尝试匹配双引号失败的过程。可以看出 .* 是非常影响效率的。

常见的回溯形式

回溯法也称试探法，它的基本思想是：从问题的某一种状态（初始状态）出发，搜索从这种状态出发所能达到的所有“状态”，当一条路走到“尽头”的时候（不能再前进），再后退一步或若干步，从另一种可能“状态”出发，继续搜索，直到所有的“路径”（状态）都试探过。这种不断“前进”、不断“回溯”寻找解的方法，就称作“回溯法”。（copy 于百度百科）。

本质上就是深度优先搜索算法。**其中退到之前的某一步这一过程，我们称为“回溯”。**从上面的描述过程中，可以看出，路走不通时，就会发生“回溯”。即，尝试匹配失败时，接下来的一步通常就是回溯。

道理，我们是懂了。那么 JS 中正则表达式会产生回溯的地方都有哪些呢？

贪婪量词

之前的例子都是贪婪量词相关的。比如 b{1,3}，因为其是贪婪的，尝试可能的顺序是从多往少的方向去尝试。首先会尝试 "bbb"，然后再看整个正则是否能匹配。不能匹配时，吐出一个 "b"，即在 "bb" 的基础上，再继续尝试。如果还不行，再吐出一个，再试。如果还不行呢？只能说明匹配失败了。

虽然局部匹配是贪婪的，但也要满足整体能正确匹配。否则，皮之不存，毛将焉附？

此时我们不禁会问，如果当多个贪婪量词挨着存在，并相互有冲突时，此时会是怎样？

其中，前面的 \d{1,3} 匹配的是 "123"，后面的 \d{1,3} 匹配的是 "45"。

惰性量词

惰性量词就是在贪婪量词后面加个问号。表示尽可能少的匹配，比如：

其中 \d{1,3}? 只匹配到一个字符 "1"，而后面的 \d{1,3} 匹配了 "234"。

知道你不贪、很知足，但是为了整体匹配成，没办法，也只能给你多塞点了。因此最后 \d{1,3}? 匹配的字符是 "12"，是两个数字，而不是一个。

分支结构

我们知道分支也是惰性的，比如 /can|candy/，去匹配字符串 "candy"，得到的结果是 "can"，因为分支会一个一个尝试，如果前面的满足了，后面就不会再试验了。

分支结构，可能前面的子模式会形成了局部匹配，如果接下来表达式整体不匹配时，仍会继续尝试剩下的分支。这种尝试也可以看成一种回溯。

上面第 5 步，虽然没有回到之前的状态，但仍然回到了分支结构，尝试下一种可能。所以，可以认为它是一种回溯的。

总结

简单总结就是，正因为有多种可能，所以要一个一个试。直到，要么到某一步时，整体匹配成功了；要么最后都试完后，发现整体匹配不成功。

既然有回溯的过程，那么匹配效率肯定低一些。相对谁呢？相对那些 DFA 引擎。

而 JS 的正则引擎是 NFA，NFA 是“非确定型有限自动机”的简写。

正则表达式的拆分

结构和操作符

编程语言一般都有操作符。只要有操作符，就会出现一个问题。当一大堆操作在一起时，先操作谁，又后操作谁呢？为了不产生歧义，就需要语言本身定义好操作顺序，即所谓的优先级。

而在正则表达式中，操作符都体现在结构中，即由特殊字符和普通字符所代表的一个个特殊整体。

JS 正则中的结构

字面量，匹配一个具体字符，包括不用转义的和需要转义的。比如 a 匹配字符 "a"，又比如 \n 匹配换行符，又比如 \. 匹配小数点。

字符组，匹配一个字符，可以是多种可能之一，比如 [0-9]，表示匹配一个数字。也有 \d 的简写形式。另外还有反义字符组，表示可以是除了特定字符之外任何一个字符，比如 [^0-9]，表示一个非数字字符，也有 \D 的简写形式。

量词，表示一个字符连续出现，比如 a{1,3} 表示“a”字符连续出现 3 次。另外还有常见的简写形式，比如 a+ 表示“a”字符连续出现至少一次。

锚点，匹配一个位置，而不是字符。比如^匹配字符串的开头，又比如 \b 匹配单词边界，又比如 (?=\d) 表示数字前面的位置。

分组，用括号表示一个整体，比如 (ab)+，表示 "ab" 两个字符连续出现多次，也可以使用非捕获分组 (?:ab)+。

分支，多个子表达式多选一，比如 abc|bcd，表达式匹配 "abc" 或者 "bcd" 字符子串。

JS 正则中的操作符

示例

在 (c|de*) 中，注意其中的量词 *，因此 e* 是一个整体结构。

又因为分支结构“|”优先级最低，因此 c 是一个整体、而 de* 是另一个整体。

同理，整个正则分成了 a、b?、(...)+、f、g。而由于分支的原因，又可以分成 ab?(c|de*)+ 和 fg 这两部分。

希望你没被我绕晕，上面的分析可用其可视化形式描述如下：

因为管道符的优先级是最低的，所以管道符两边都可以看作一个整体，相当于有一个小括号

注意要点

匹配字符串整体问题

因为是要匹配整个字符串，我们经常会在正则前后中加上锚字符 ^ 和 $。

比如要匹配目标字符串 "abc" 或者 "bcd" 时，如果一不小心，就会写成 /^abc|bcd$/。

而位置字符和字符序列优先级要比竖杠高，故其匹配的结构是：

量词连缀问题

此时正则不能想当然地写成 /^[abc]{3}+$/，这样会报错，说 + 前面没什么可重复的：

元字符转义问题

所有结构里，用到的元字符总结如下：^ $ . * + ? | \ / ( ) [ ] { } = ! : - ,

另外，在 string 中，也可以把每个字符转义，当然，转义后的结果仍是本身：

简单的全转义正则，把除了单词字符以外的前面加上一个转义字符

现在的问题是，是不是每个字符都需要转义呢？否，看情况。

案例分析

身份证

因为竖杠“|”,的优先级最低，所以正则分成了两部分 \d{15} 和 \d{17}[\dxX]。

IPV4 地址

这个正则，看起来非常吓人。但是熟悉优先级后，会立马得出如下的结构：

上面的两个 (...) 是一样的结构。表示匹配的是 3 位数字。因此整个结构是：3 位数.3 位数.3 位数.3 位数

正则表达式的构建

平衡法则

构建正则前提

是否能使用正则

正则太强大了，以至于我们随便遇到一个操作字符串问题时，都会下意识地去想，用正则该怎么做。但我们始终要提醒自己，正则虽然强大，但不是万能的，很多看似很简单的事情，还是做不到的。

是否有必要使用正则

要认识到正则的局限，不要去研究根本无法完成的任务。同时，也不能走入另一个极端：无所不用正则。能用字符串 API 解决的简单问题，就不该正则出马。

其实，可以直接使用字符串的 substring 或 substr 方法来做：

是否有必要构建一个复杂的正则

比如密码匹配问题，要求密码长度 6-12 位，由数字、小写字符和大写字母组成，但必须至少包括 2 种字符。

准确性

所谓准确性，就是能匹配预期的目标，并且不匹配非预期的目标。

这里提到了“预期”二字，那么我们就需要知道目标的组成规则。

不然没法界定什么样的目标字符串是符合预期的，什么样的又不是符合预期的。

下面将举例说明，当目标字符串构成比较复杂时，该如何构建正则，并考虑到哪些平衡。

匹配固定电话

上面的正则构建过程略显罗嗦，但是这样做，能保证正则是准确的。

上述三种情形是或的关系，这一点很重要，不然很容易按字符是否出现的情形把正则写成：

虽然也能匹配上述目标字符串，但也会匹配 (0551-88888888 这样的字符串。当然，这不是我们想要的。

其实这个正则也不是完美的，因为现实中，并不是每个 3 位数和 4 位数都是一个真实的区号。

匹配浮点数

上述三个部分，并不是全部都出现。如果此时很容易写出如下的正则：

当然，/^[+-]?(\d+\.\d+|\d+|\.\d+)$/ 也不是完美的，我们也是做了些取舍，比如：

效率

保证了准确性后，才需要考虑是否要优化。大多数情形是不需要优化的，除非运行的非常慢。什么情形正则表达式运行才慢呢？我们需要考察正则表达式的运行过程（原理）。

当生成一个正则时，引擎会对其进行编译。报错与否出现这这个阶段。

当尝试匹配时，需要确定从哪一位置开始匹配。一般情形都是字符串的开头，即第 0 位。

但当使用 test 和 exec 方法，且正则有 g 时，起始位置是从正则对象的 lastIndex 属性开始。

因此第一次 exec 是从第 0 位开始，而第二次是从 3 开始的。

比如第一次 exec，从 0 开始，去尝试匹配，并且成功地匹配到 3 个数字。此时结束时的下标是 2，因此下一次的起始位置是 3。

而第二次，起始下标是 3，但第 3 个字符是“a”，并不是数字。但此时并不会直接报匹配失败，而是移动到下一位置，即从第 4 位开始继续尝试匹配，但该字符是 b，也不是数字。再移动到下一位，是 c 仍不行，再移动一位是数字 3，此时匹配到了两位数字 34。此时，下一次匹配的位置是 d 的位置，即第 8 位。

第三次，是从第 8 位开始匹配，直到试到最后一位，也没发现匹配的，因此匹配失败，返回 null。同时设置 lastIndex 为 0，即，如要再尝试匹配的话，需从头开始。

从上面可以看出，匹配会出现效率问题，主要出现在上面的第 3 阶段和第 4 阶段。

使用具体型字符组来代替通配符，来消除回溯

例如，匹配双引用号之间的字符。如，匹配字符串 123"abc"456 中的 "abc"。

如果正则用的是：/".*"/，，会在第 3 阶段产生 4 次回溯（粉色表示 .* 匹配的内容）：

如果正则用的是：/".*?"/，会产生 2 次回溯（粉色表示 .*? 匹配的内容）：

因为回溯的存在，需要引擎保存多种可能中未尝试过的状态，以便后续回溯时使用。注定要占用一定的内存。

此时要使用具体化的字符组，来代替通配符 .，以便消除不必要的字符，此时使用正则 /"[^"]*"/，即可。

使用非捕获型分组

因为括号的作用之一是，可以捕获分组和分支里的数据。那么就需要内存来保存它们。

当我们不需要使用分组引用和反向引用时，此时可以使用非捕获分组。例如：

独立出确定字符

因为后者能比前者多确定了字符 a。这样会在第四步中，加快判断是否匹配失败，进而加快移位的速度。

提取分支公共部分

减少分支的数量，缩小它们的范围

/red|read/，可以修改成 /rea?d/。此时分支和量词产生的回溯的成本是不一样的。但这样优化后，可读性会降低的。

正则相关 API

正则表达式的方法

test()

exec()

当设置全局标志的正则使用 test() 和 exex()

如果正则表达式设置了全局标志，test() 的执行会改变正则表达式 lastIndex 属性。连续的执行 test() 方法，后续的执行将会从 lastIndex 处开始匹配字符串，(exec() 同样改变正则本身的 lastIndex属性值)

注意：上面代码中的第三次调用 test，因为这一次尝试匹配，开始从下标 lastIndex 即 3 位置处开始查找，自然就找不到了。

注意：不要把正则表达式字面量（或者 RegExp 构造器）放在 while 条件表达式里。由于每次迭代时 lastIndex 的属性都被重置，如果匹配，将会造成一个死循环。并且要确保使用了 'g' 标记来进行全局的匹配，否则同样会造成死循环。

如果没有 g，自然都是从字符串第 0 个字符处开始尝试匹配：

总结

这两个方法的 g，都不是真正意义上的 g，没有找出所有的匹配结果，都是找到一个就直接返回了，类似于 indexOf

字符串的正则方法

ES6 API 模块化

ES6 将这 4 个方法，在语言内部全部调用 RegExp 的实例方法，从而做到所有与正则相关的方法，全都定义在 RegExp 对象上。

search()

match()

matchAll()

split()

split() 方法使用指定的分隔符字符串将一个 String 对象分割成字符串数组，以将字符串分隔为子字符串，以确定每个拆分的位置。

replace()

replace() 方法返回一个由替换值（replacement）替换一些或所有匹配的模式（pattern）后的新字符串。

使用字符串作为参数

如果没有匹配呢？没有匹配的话函数不会执行，replace 返回原字符串

正则表达式的四种操作

验证

切分

所谓“切分”，就是把目标字符串，切成一段一段的。在 JS 中使用的是 split。

提取

此时正则通常要使用分组引用（分组捕获）功能，还需要配合使用相关 API。

这里，还是以日期为例，提取出年月日。注意下面正则中的括号：

替换

找，往往不是目的，通常下一步是为了替换。在 JS 中，使用 replace 进行替换。

这里只是简单地应用了一下 replace。但，replace 方法是强大的，是需要重点掌握的。