C是一種流行的編程語言,它在計算機編程領域有廣泛應用。在網絡編程方面,C語言可以用于獲取HTML頁面代碼。爬蟲程序就是利用C語言來獲取HTML頁面代碼的基礎。下面我們將介紹如何使用C語言獲取HTML頁面代碼。
#include <stdio.h> #include <stdlib.h> #include <string.h> #include <curl/curl.h> //回調函數,獲取代碼 size_t write_data(void *ptr, size_t size, size_t nmemb, char *data) { strcat(data, ptr); return size * nmemb; } int main(int argc, char *argv[]) { CURL *curl; //curl對象 CURLcode res; char data[1000000]; //存儲HTML代碼的字符數組 memset(data, 0, sizeof(data)); //數組初始化 curl = curl_easy_init(); //初始化curl對象 if(curl) { curl_easy_setopt(curl, CURLOPT_URL, "https://www.baidu.com"); //設置請求的URL地址 curl_easy_setopt(curl, CURLOPT_WRITEDATA, data); //設置回調函數的參數 curl_easy_setopt(curl, CURLOPT_WRITEFUNCTION, write_data); //設置回調函數 res = curl_easy_perform(curl); //執行請求 if(res != CURLE_OK) { //判斷請求是否成功 fprintf(stderr, "curl_easy_perform() failed: %s\n", curl_easy_strerror(res)); } curl_easy_cleanup(curl); //清除curl對象 } printf("%s", data); //打印獲取到的HTML代碼 return 0; }
上述代碼使用CURL庫來獲取HTML頁面代碼。首先,初始化一個curl對象,并設置請求的URL地址。然后,定義一個回調函數,用于獲取HTML代碼。在執行請求時,將回調函數作為參數傳入。最后,打印存儲HTML代碼的字符數組,即可得到HTML頁面代碼。