Java是一種強大而流行的編程語言,可用于多種用途,包括網頁開發、數據分析和爬蟲。在本文中,我們將介紹如何使用Java來爬取QQ號和備注。
//導入所需的包和類 import java.net.URL; import java.net.HttpURLConnection; import java.io.BufferedReader; import java.io.InputStreamReader; import java.util.regex.Matcher; import java.util.regex.Pattern; public class QQSpider { public static void main(String[] args) { //要爬取的QQ好友列表的鏈接 String url = "http://localhost:8888/qq/friendlist.html"; try { //創建URL對象和連接對象 URL obj = new URL(url); HttpURLConnection con = (HttpURLConnection) obj.openConnection(); //設置請求方法 con.setRequestMethod("GET"); //發送請求并讀取響應 BufferedReader in = new BufferedReader(new InputStreamReader(con.getInputStream(), "UTF-8")); String inputLine; StringBuffer response = new StringBuffer(); while ((inputLine = in.readLine()) != null) { response.append(inputLine); } in.close(); //使用正則表達式匹配QQ號和備注 Pattern pattern = Pattern.compile("(\\d+) (.+) "); Matcher matcher = pattern.matcher(response.toString()); while (matcher.find()) { String qq = matcher.group(1); String remark = matcher.group(2); System.out.println("QQ號:" + qq + ",備注:" + remark); } } catch (Exception e) { e.printStackTrace(); } } }
以上代碼演示了如何使用Java連接到指定的URL,讀取HTML響應,并使用正則表達式匹配QQ號和備注。這里我們使用了Java內置的HttpURLConnection類來發送GET請求,并將響應讀取到內存中。然后使用正則表達式匹配符合條件的字符串,提取出需要的QQ號和備注,并在控制臺上輸出結果。
現在,您已經學會了使用Java爬取QQ號和備注的方法,可以嘗試將代碼應用于實際項目,并進行自己的改進!