——分组、断言、回溯与性能优化)
上一篇我们学习了正则的基础语法,包括元字符、量词、锚点、分组、标志位等。本篇是正则的高阶篇,我们要深入:分组:捕获、非捕获、命名、反向引用;断言:先行断言、后行断言、单词边界;回溯原理:正则引擎是怎么工作的;性能优化:写出又快又稳的正则;实战项目:3 个真实爬虫场景的正则应用。学完本篇,你将从"会用正则"升级到"精通正则"。一、分组的 6 种形式上一篇提到了用()进行分组,实际上分组有 6 种不同的形式:写法名称是否捕获作用(pattern)捕获分组✅普通分组,可通过\1或.group(1)引用(?:pattern)非捕获分组❌只分组,不占用