正则在爬虫领域使用很广泛,用来把网页中有价值的文本提取出来。这个提取技术就是用正则匹配。
我感觉正则匹配就是类型匹配,当你能认识清楚字符里面所有包含的类型和结构,那么你写出正则也就不难了。如何认识清楚文本中会有什么类型,看如下链接
https://www.zhihu.com/question/48219401/answer/742444326
在这篇文章中,我建议你认识好 这些基本的:
- 1.元字符
- 2.限定符
- 3.分组
- 4.条件或
认识完这些基础类型之后,写正则还是有点难,
建议跟着如下链接,把里面的练习都做一下,我包你会有新的感悟
https://juejin.im/post/6844903648309297166
把练习都做完后,一些正常难度的(初、中级)的正则你都能写了。
高级或进阶,自行学习吧。
https://deerchao.cn/tutorials/regex/regex.htm#regexoptions
工具
拥有一个好的调试工具,会让你能方便快捷的调试你的正则语句,这种及时的反馈感很重要,特别是新手的你。
bbedit下载地址
https://apps.apple.com/cn/story/跟-bbedit-学正则表达式/id1485320067
使用截图:
No comments:
Post a Comment