首页 > 其他 > 详细

常用模块

时间:2018-01-09 19:41:14      阅读:232      评论:0      收藏:0      [点我收藏+]

re模块常用方法:

  import re

  ret = re.findall(‘a‘,‘qas fds asfwa‘)   #返回所有满足条件的结果,放在列表里
  print(ret)  #结果:[‘a‘,‘a‘,‘a‘]

  ret = re.search(‘a‘,‘qas fds asfwa‘).group()  #只找到第一个符合匹配的然后返回,一定要加group返回匹配的字符串,如果没有则返回None  结果:a

  ret = re.match(‘a‘,‘abc‘).group()  #跟search差不多,不过只在字符串开始处进行匹配,开头不是会报错  结果:a

  ret = re.split(‘[ab]‘,‘abcd‘)    #先按‘a‘分割得到‘‘和‘bcd‘,在对‘‘和‘bcd’分别按‘b‘分割   结果:[‘‘,‘‘,‘cd‘]

  ret = re.sub(‘\d‘,‘H‘,‘fdsf32cs3fds1‘ ,2)  #将数字替换成 ’H‘,只替换前2个值,不写则全部替换

  ret = re.subn(‘\d‘,‘H‘,‘fdsf32cs3fds1‘ )  #返回的是元组,不写值替换所有

  obj = re.compile(‘\d{3}‘)    #编译成一个正则表达式对象,匹配连续3个数字,可以多次调用这个对象
  ret = obj.search(‘a324e‘)    #正则表达式对象调用search,参数为待匹配的字符串
  print(ret.group())      #需要用group(),结果:324

  ret = re.finditer(‘\d‘,‘afd2312a‘)  #返回一个迭代器,里面存放匹配结果
  print(ret)            #内存地址
  print(next(ret).group())      #查看第一个结果
  print(next(ret).group())      #查看第二个结果
  print([i.group() for i in ret])      #查看剩余的左右结果

 

findall的优先级查询:

  ret = re.findall(‘www.(badi|sohu).com‘,‘www.sohu.com‘) 
  print(ret)      #结果:[‘sohu‘]   因为findall会优先把匹配结果组里内容返回,如果想要匹配结果,取消权限即可
  ret = re.findall(‘www.(?:badi|sohu).com‘,‘www.sohu.com‘)
  print(ret)     #结果:[‘www.sohu.com‘]

split的优先级查询:

  ret = re.split(‘\d+‘,‘asdf2fa43fd‘)  
  print(ret)  #结果:[‘asdf‘, ‘fa‘, ‘fd‘]

  ret = re.split(‘(\d+)‘,‘asdf2fa43fd‘)
  print(ret)  #结果:[‘asdf‘, ‘2‘, ‘fa‘, ‘43‘, ‘fd‘]

  在匹配部分加上()之后所切出的结果是不同的,

  没有()的没有保留所匹配的项,但是有()的却能够保留了匹配的项,

  这个在某些需要保留匹配部分的使用过程是非常重要的。

 

常用模块

原文:https://www.cnblogs.com/tsboy/p/8253023.html

(0)
(0)
   
举报
评论 一句话评论(0
关于我们 - 联系我们 - 留言反馈 - 联系我们:wmxa8@hotmail.com
© 2014 bubuko.com 版权所有
打开技术之扣,分享程序人生!