首页 > 编程语言 > 详细

java爬取网页上qq号,邮箱号等

时间:2021-09-05 20:24:31      阅读:15      评论:0      收藏:0      [点我收藏+]

直接拷贝代码执行即可(前提是能连上网络)

结果输出在控制台

import java.io.BufferedReader;
import java.io.FileReader;
import java.io.InputStreamReader;
import java.net.URL;
import java.net.URLConnection;
import java.util.regex.Matcher;
import java.util.regex.Pattern;

public class GetMail {
public static void main(String[] args) throws Exception {
//getMails();
getMails_url();
}

public static void getMails_url() throws Exception {
URL url = new URL("https://");//这里就是要爬取的网页
URLConnection conn = url.openConnection();
BufferedReader bufr = new BufferedReader(new InputStreamReader(conn.getInputStream()));
String line = null;
String maileRes = "[\u4E00-\u9FA5]+";//这里存放需要设定的规则

//匹配邮箱:"\\w+@\\w+(\\.\\w+)+"
//匹配汉字:"[\u4E00-\u9FA5]+";
//匹配QQ号:"[1-9][0-9]{4,14}"
//qq邮箱:"(.)+@(.)+(\\.[a-z]+){1,}";
Pattern p = Pattern.compile(maileRes);


while((line=bufr.readLine())!=null) {
Matcher m = p.matcher(line);
while(m.find()) {
System.out.println(m.group());
}

}
}

java爬取网页上qq号,邮箱号等

原文:https://www.cnblogs.com/chenguopa/p/15225652.html

(0)
(0)
   
举报
评论 一句话评论(0
关于我们 - 联系我们 - 留言反馈 - 联系我们:wmxa8@hotmail.com
© 2014 bubuko.com 版权所有
打开技术之扣,分享程序人生!