IT学习网 - 爱学习 - 最具影响力综合资讯网站 -- 中国IT界的领航者!
热门关键字:      88888  as  xxx
站外
广告
站外
广告

python小脚本-提取邮箱

发布时间:2016-10-19 06:11文章来源:互联网文章作者: 佚名点击次数:
使用python正则表达式,在一堆各种字符中提取是邮箱名的字符串。 import refile = open(AT.txt)c=[]for line in file.readlines(): contant = re.findall(r[\w\d\.-_]+(?=\@),line) mail=list(set(contant)) for i in mail: if i != : print i c.append(i)Nu

使用python正则表达式,在一堆各种字符中提取是邮箱名的字符串。

import refile = open("AT.txt")c=[]for line in file.readlines():

contant = re.findall(r"[\w\d\.-_]+(?=\@)",line) mail=list(set(contant)) for i in mail: if i != "": print i c.append(i)Num = len(c)print Num

正则表达式[\w\d\.-_]+(?=\@)解析:

首先理解字符集,字符集所在位置可以是字符集中任意所以开始[\w\d\.-_]代表可以出现则代表邮箱@之前可以出现字母、数字、.、-、_。紧接在[]字符集之后+代表至少要匹配一次,说明@之前可以有多个字符,(?=\@)则表示之前的字符指导@截止,并且@不计算在之内。

list(set(contant))用于去除里面相同的邮箱名

for i in mail:这个for循环体,代表去除re.findall查找结果中的空列表。


python小脚本-提取邮箱
本文由 IT学习网 整理,转载请注明“转自IT学习网”,并附上链接。
原文链接:http://www.ourlove520.com/Article/netsafe/xitong/516289.html

标签分类:

上一篇:上一篇:MS15-034 IIS 7.0 HTTP.sys 远程代码执行漏洞(CVE-2015-1635) PO
下一篇: 下一篇:关于yum被锁定的处理方法
无觅关联推荐,快速提升流量