数码控科技猎奇Iphone动漫星座游戏电竞lolcosplay王者荣耀攻略allcnewsBLOGNEWSBLOGASKBLOGBLOGZSK全部技术问答问答技术问答it问答代码软件新闻开发博客电脑/网络手机/数码笔记本电脑互联网操作系统软件硬件编程开发360产品资源分享电脑知识文档中心IT全部全部分类全部分类技术牛文全部分类教程最新网页制作cms教程平面设计媒体动画操作系统网站运营网络安全服务器教程数据库工具网络安全软件教学vbscript正则表达式javascript批处理更多»编程更新教程更新游戏更新allitnewsJava新闻网络医疗信息化安全创业站长电商科技访谈域名会议专栏创业动态融资创投创业学院 / 产品经理创业公司人物访谈营销开发数据库服务器系统虚拟化云计算嵌入式移动开发作业作业1常见软件all电脑网络手机数码生活游戏体育运动明星影音休闲爱好文化艺术社会民生教育科学医疗健康金融管理情感社交地区其他电脑互联网软件硬件编程开发360相关产品手机平板其他电子产品摄影器材360硬件通讯智能设备购物时尚生活常识美容塑身服装服饰出行旅游交通汽车购房置业家居装修美食烹饪单机电脑游戏网页游戏电视游戏桌游棋牌游戏手机游戏小游戏掌机游戏客户端游戏集体游戏其他游戏体育赛事篮球足球其他运动球类运动赛车健身运动运动用品影视娱乐人物音乐动漫摄影摄像收藏宠物幽默搞笑起名花鸟鱼虫茶艺彩票星座占卜书画美术舞蹈小说图书器乐声乐小品相声戏剧戏曲手工艺品历史话题时事政治就业职场军事国防节日风俗法律法规宗教礼仪礼节自然灾害360维权社会人物升学入学人文社科外语资格考试公务员留学出国家庭教育学习方法语文物理生物工程学农业数学化学健康知识心理健康孕育早教内科外科妇产科儿科皮肤科五官科男科整形中医药品传染科其他疾病医院两性肿瘤科创业投资企业管理财务税务银行股票金融理财基金债券保险贸易商务文书国民经济爱情婚姻家庭烦恼北京上海重庆天津黑龙江吉林辽宁河北内蒙古山西陕西宁夏甘肃青海新疆西藏四川贵州云南河南湖北湖南山东江苏浙江安徽江西福建广东广西海南香港澳门台湾海外地区

java抓取网页或文件中的邮箱号码

来源:脚本之家  责任编辑:小易  

本文实例为大家分享了java抓取邮箱号码的具体代码,供大家参考,具体内容如下

java抓取文件中邮箱号码的具体代码

package reg;


import java.io.BufferedReader;
import java.io.FileNotFoundException;
import java.io.FileReader;
import java.io.IOException;
import java.util.ArrayList;
import java.util.List;
import java.util.regex.Matcher;
import java.util.regex.Pattern;


public class TestEmail {

public static void main(String[] args) {
// TODO Auto-generated method stub
 BufferedReader br=null;
 try {
br=new BufferedReader(new FileReader("D:/1.htm"));
String str=null;
StringBuilder sb=new StringBuilder();
while((str=br.readLine())!=null){
sb.append(str);
}
List es=getEmail(sb.toString());
for(String e:es){
System.out.println(e);
}
} catch (FileNotFoundException e) {
// TODO: handle exception
e.printStackTrace();
}catch (IOException e) {
// TODO: handle exception
e.printStackTrace();
}finally {
try {
if(br!=null) br.close();
} catch (IOException e) {
// TODO: handle exception
e.printStackTrace();
}
}
}
 public static List getEmail(String str){
 List es=new ArrayList();
Pattern p=Pattern.compile("[\\w\\.-]*\\w+@[\\w\\.-]*\\w+\\.\\w{2,5}");
// Pattern p=Pattern.compile("[\\w[.-]]+@[\\w[.-]]+\\.[\\w]+");
 Matcher m=p.matcher(str);
 while(m.find()){
 es.add(m.group());
 }
 return es;
 }
}


java抓取网页中邮箱号码的具体代码

package reg;

import java.io.BufferedReader; 
import java.io.InputStreamReader; 
import java.util.regex.Matcher; 
import java.util.regex.Pattern; 
 
public class Testemail01 
{ 
 public static String getWebCon(String domain) 
 { 
 System.out.println("开始抓取邮件地址..("+domain+")"); 
 StringBuffer sb=new StringBuffer(); 
 try 
 { 
 java.net.URL url=new java.net.URL(domain); 
 BufferedReader in=new BufferedReader(new InputStreamReader(url.openStream())); 
 String line; 
 while((line=in.readLine())!=null) 
 { 
 parse(line); 
 } 
 in.close(); 
 } 
 catch(Exception e) 
 { 
 sb.append(e.toString()); 
 System.err.println(e); 
 
 } 
 return sb.toString(); 
 } 
 public static void main(String[] args) 
 { 
 String s=Testemail01.getWebCon("http://tieba.baidu.com/p/2366935784"); 
 } 
 private static void parse(String line) 
 { 
 Pattern p=Pattern.compile("[\\w[.-]]+@[\\w[.-]]+\\.[\\w]+");//邮箱的正则表达式 
 Matcher m=p.matcher(line); 
 while(m.find()) 
 { 
 System.out.println(m.group()); 
 } 
 } 
}

以上就是本文的全部内容,希望对大家的学习有所帮助,也希望大家多多支持脚本之家。

您可能感兴趣的文章:


  • 本文相关:
  • java模拟新浪微博登陆抓取数据
  • java利用url实现网页内容的抓取
  • 详解java实现多种方式的http数据抓取
  • 详解java抓取网页的图片,java利用正则表达式抓取网站图片
  • java爬虫gecco工具抓取新闻实例
  • java实现登录之后抓取数据
  • java实现发送邮件功能时碰到的坑
  • java实现jsp在servelt中连接oracle数据库的方法
  • springmvc学习笔记-返回json的日期格式问题的解决方法
  • java获取中文拼音、中文首字母缩写和中文首字母的示例
  • java读取文件字符集示例方法
  • java中建立0-10m的消息(字符串)实现方法
  • java调用dll方法总结
  • windows7下的java运行环境搭建过程图解
  • java 中io流字符流详解及实例
  • java web开发中加载图片路径的两种方式
  • 免责声明 - 关于我们 - 联系我们 - 广告联系 - 友情链接 - 帮助中心 - 频道导航
    Copyright © 2017 www.zgxue.com All Rights Reserved