首页 > 编程语言 > 详细

python爬虫:正则表达式

时间:2016-04-29 01:36:41      阅读:284      评论:0      收藏:0      [点我收藏+]

符号:

. : 匹配任意字符(类似占位符,多少个.就表示多少个字符),换行符除外(与re.S相反)

*:匹配前面一个字符0次或无限次

?:匹配前面一个字符0次或1次

 

组合:

.* : 贪心算法 一次匹配尽多

.*? :非贪心算法 匹配少量多次

() :括号内的数据作为返回结果

(.*?) :需要查找的内容   最常用

方法:

findall : 匹配所有符合规律的内容,返回包含结果的列表;

Search: 匹配并提取第一个符合规律的内容,返回一个正则表达式的对象(object)

Sub:替换复合规律的内容返回替换后的值

import re

text=‘‘‘adsAlandadf

1123sdsdaasds‘‘‘

d = re.findall(‘ads(.*?)dadf‘,text,re.S)    #re.S代表匹配换行符后的下一行

python爬虫:正则表达式

原文:http://www.cnblogs.com/alan-babyblog/p/5444912.html

(0)
(0)
   
举报
评论 一句话评论(0
关于我们 - 联系我们 - 留言反馈 - 联系我们:wmxa8@hotmail.com
© 2014 bubuko.com 版权所有
打开技术之扣,分享程序人生!