标签归档:爬虫

Python 爬虫正则表达式和re库,及re库的基本使用,提取单个页面信息

一、正则表达式 正则表达式是处理字符串的强大工具,它有自己特定的语法结构,有了它,实现字符串的检索、替换、匹配验证都不在话下,正则表达式在所有编程里通用,所以不仅仅是python使用。 以下是常用的正则表达式,用的时候参考即可,不需要死记硬背,用得多了自然就熟悉了。 字符 描述 d 匹配任意数字,等价于 [0-9] D 匹配任意非数字的字符,d的取反 w 代表字母,数字,下划线。也就是 a-z、A [……]

继续阅读»»»