python 利用正则表达式提取特殊信息_正则表达式

来源:脚本之家  责任编辑:小易  

Python正则表达式 \\d{1,3}(,\\d{3})*完整的Python程序如下usr/bin/pythonimport restr='6,368,745'regex=r'\\d{1,3}(,\\d{3})*'match_obj=re.match(regex,str)if match_obj:print('true')else:print('false')运行结果truewww.zgxue.com防采集请勿采集本网。

1、删除字符串中的 Python注释

xx(.*?中的.*?是懒惰匹配,问号表示匹配尽可能少的字符。而由于你用的是.* 所以尽可能少的字符就是不匹配了,于是输出为空。如果你想要截取两个xx之间的文本。你可以试试split。或者把正则改成

案例:

def spellcheck(text): import re text=re.sub(\"+\",\"\",text) text=re.sub(\"([,.?(\\w+)\",r\"\\1 \\2\",text) return text text=\"This is very funny and cool.Indded!text=spellcheck(text) print

import re time = "2020-01-01 # 这是一个日期"num = re.sub(r'#.*$', "", time)#以#为分隔,去掉后面的信息print("这个时间是:", num)

LV.92014-09-28 如果要求不严格的话re.findall('\\w(.*?n',str) 如果要求严格的话re.findall('[a-zA-Z](.*?n',str)

结果:

str=\"1234 p=re.compile(r\"\\d{1}\") list=p.findall(str) if list._len_()!4: print(\"输入错误!数字不是4个!用findall函数直接获得匹配列表

这个时间是: 2020-01-01

只要你真的掌握了正则,其实没那么难的: import re text=\"\" span style='color:rgb(112,48,160);'>?表白4:我喜欢你,徐丽,这里有详细完整的正则介绍:刘江的Python教程之正则表达式

2、截取某符号前后的内容

案例1:

txt = '我的电话是:131-246-XXX19'a = txt.split(':')[0]#0表示符号前b = txt.split(':')[1]#[-1]和[1]结果一样,表示符号后面print ("a的结果是:",a)print ("b的结果是:",b)

结果:

str=\"1234 p=re.compile(r\"\\d{1}\") list=p.findall(str) if list._len_()!4: print(\"输入错误!数字不是4个!用findall函数直接获得匹配列表

a的结果是: 我的电话是 b的结果是: 131-246-XXX19

案例2:

txt = "I love python . 我热爱python"text = re.sub(r'\..*$', "", txt)#以.为分隔,\为转义字符,与后面的.区分开print("这个截取结果是:", text)

结果:

str=\"1234 p=re.compile(r\"\\d{1}\") list=p.findall(str) if list._len_()!4: print(\"输入错误!数字不是4个!用findall函数直接获得匹配列表

这个截取结果是: I love python

3、删除非数字的字符串

案例:

def spellcheck(text): import re text=re.sub(\"+\",\"\",text) text=re.sub(\"([,.?(\\w+)\",r\"\\1 \\2\",text) return text text=\"This is very funny and cool.Indded!text=spellcheck(text) print

import re time = "2020-01-01 # 这是一个日期"num = re.sub(r'\D', "", time)print("这个时间是:", num)

结果:

str=\"1234 p=re.compile(r\"\\d{1}\") list=p.findall(str) if list._len_()!4: print(\"输入错误!数字不是4个!用findall函数直接获得匹配列表

这个时间是: 20200101

4、只保留中文

案例:

def spellcheck(text): import re text=re.sub(\"+\",\"\",text) text=re.sub(\"([,.?(\\w+)\",r\"\\1 \\2\",text) return text text=\"This is very funny and cool.Indded!text=spellcheck(text) print

reg = "[^\u4e00-\u9fa5]"text = "好吧!E我aa们$$开始34学习--python吧!"print(re.sub(reg, '', text))

结果:

str=\"1234 p=re.compile(r\"\\d{1}\") list=p.findall(str) if list._len_()!4: print(\"输入错误!数字不是4个!用findall函数直接获得匹配列表

好吧我们开始学习吧

5、只保留中文、大小写字母和阿拉伯数字

案例:

def spellcheck(text): import re text=re.sub(\"+\",\"\",text) text=re.sub(\"([,.?(\\w+)\",r\"\\1 \\2\",text) return text text=\"This is very funny and cool.Indded!text=spellcheck(text) print

reg = "[^0-9A-Za-z\u4e00-\u9fa5]"text = "好吧!E我aa们$$开始34学习--python吧!"print(re.sub(reg, '', text))

结果:

str=\"1234 p=re.compile(r\"\\d{1}\") list=p.findall(str) if list._len_()!4: print(\"输入错误!数字不是4个!用findall函数直接获得匹配列表

好吧E我aa们开始34学习python吧

6、去掉大小写字母和数字

案例:

def spellcheck(text): import re text=re.sub(\"+\",\"\",text) text=re.sub(\"([,.?(\\w+)\",r\"\\1 \\2\",text) return text text=\"This is very funny and cool.Indded!text=spellcheck(text) print

import retxt="Ayouleyang阿~优乐-扬"text = re.sub('[a-zA-Z0-9]','',txt)print(text)

结果:

str=\"1234 p=re.compile(r\"\\d{1}\") list=p.findall(str) if list._len_()!4: print(\"输入错误!数字不是4个!用findall函数直接获得匹配列表

阿~优乐-扬 1

7、去掉某个特殊字符

案列:

import re txt = '阿*a#优$乐. :扬 ;:youle+'text = re.sub('[,;;youle: :.;,$*#]+', "", txt)#[]中的符号都会被替换,类似于replace()print(text)

结果:

str=\"1234 p=re.compile(r\"\\d{1}\") list=p.findall(str) if list._len_()!4: print(\"输入错误!数字不是4个!用findall函数直接获得匹配列表

阿a优乐扬+ 1

8、保留英文,数字和特殊符号

案例:

def spellcheck(text): import re text=re.sub(\"+\",\"\",text) text=re.sub(\"([,.?(\\w+)\",r\"\\1 \\2\",text) return text text=\"This is very funny and cool.Indded!text=spellcheck(text) print

reg = "[^0-9A-Za-z\u4e00-]"#只保留英文,数字和-,u4e00“-”是需要保留的符号txt = "好吧!我的号码是131-246-XXX19!::"text = re.sub(reg, '', txt)print(text)

结果:

str=\"1234 p=re.compile(r\"\\d{1}\") list=p.findall(str) if list._len_()!4: print(\"输入错误!数字不是4个!用findall函数直接获得匹配列表

131-246-XXX19

总结

以上所述是小编给大家介绍的python 利用正则表达式提取特殊信息,希望对大家有所帮助,如果大家有任何疑问请给我留言,小编会及时回复大家的。在此也非常感谢大家对真格学网网站的支持!

如果你觉得本文对你有帮助,欢迎转载,烦请注明出处,谢谢!

m.sub的调用方法不正确,仔细读一下文档,主要是替换的目标没对。应该有分组信息。正则表达式写对与否是另一个问题,我还没仔细看。不能直接给你代码。否则失去了学习的目的内容来自www.zgxue.com请勿采集。


  • 本文相关:
  • python正则表达式从字符串中提取数字的思路详解
  • python使用正则表达式去除(过滤)html标签提取文字功能
  • python正则表达式匹配和提取ip地址
  • python利用正则表达式提取字符串
  • python 根据正则表达式提取指定的内容实例详解
  • 基于python正则表达式提取搜索结果中的站点地址
  • python使用正则表达式提取网页url的方法
  • 正则表达式提取img的src
  • asp.net常用正则表达式
  • 正则表达式的高级技巧分享
  • 用正则查找html中有id属性的html标签
  • 使用正则表达式匹配[***]样式的字符串
  • 正则表达式简单的检查输入email是否合法程序
  • eregi_replace()中特殊字符的处理方法
  • js正则解析url参数示例代码
  • 正则表达式验证
  • 正则表达式——匹配规则介绍
  • python正则表达式习题
  • python求一个的正则表达式,最好不用零宽断言,感谢,题如下
  • python 正则表达式 题目求解?
  • python正则表达式怎样匹配题目中的选项?
  • 一题有关Python的正则表达式如何计算
  • python程序 请利用正则表达式写一个简单的拼写检查程序。实现以下功能
  • python有关正则表达式的题目求详解?
  • python 求个正则表达式
  • 关于Python中的正则表达式难题求解!高悬赏
  • 求个简单的python 正则表达式
  • 网站首页网页制作脚本下载服务器操作系统网站运营平面设计媒体动画电脑基础硬件教程网络安全javascriptasp.netphp编程ajax相关正则表达式asp编程jsp编程编程10000问css/htmlflex脚本加解密web2.0xml/rss网页编辑器相关技巧安全相关网页播放器其它综合dart首页正则表达式python正则表达式从字符串中提取数字的思路详解python使用正则表达式去除(过滤)html标签提取文字功能python正则表达式匹配和提取ip地址python利用正则表达式提取字符串python 根据正则表达式提取指定的内容实例详解基于python正则表达式提取搜索结果中的站点地址python使用正则表达式提取网页url的方法正则表达式提取img的srcasp.net常用正则表达式正则表达式的高级技巧分享用正则查找html中有id属性的html标签使用正则表达式匹配[***]样式的字符串正则表达式简单的检查输入email是否合法程序eregi_replace()中特殊字符的处理方法js正则解析url参数示例代码正则表达式验证正则表达式——匹配规则介绍java 正则表达式详解比较正宗的验证邮箱的正则表达式正则表达式匹配任意字符(包括换最新手机号码、电话号码正则表达javascript 手机号码正则表达式验js利用正则配合replace替换指定字正则表达式匹配不包含某些字符串正则中需要转义的特殊字符小结js正则函数match、exec、test、s最全的常用正则表达式大全——包jquery中的正则表达式分析 正则基础asp常用的正则表达式实现字符串的替换正则基础之 神奇的转义javascript判断中文的正则正则表达式教程之匹配一组字符详解正则表达式在ubb论坛中的应用完美替换html代码关于内容的分离,正则抽出图片(一定要加精java正则表达式入门学习又一不错的应用-正则来查找替换字符串
    免责声明 - 关于我们 - 联系我们 - 广告联系 - 友情链接 - 帮助中心 - 频道导航
    Copyright © 2017 www.zgxue.com All Rights Reserved