抓取網頁資料（金融股市實時資料）

最近查了幾天的資料去寫乙個網頁抓取**實時資料的程式，網上一堆資料都是翻來覆去的講解同樣的方法，還有都是抓取一般的沒有變化的對時間要求不要的網頁資料，然而對於**實時資料的抓取要求的是每秒鐘都會由很多**資料在發生變化，要保證程式能抓取到每秒鐘這些變化著的資料，好了，出於這個目的開始在網上搜說資料，很多人建議用libcurl方法，好的，libcurl很強大用起來很簡單，也想上邊說的那樣libcurl對於一般的沒有變化的網頁來說很強大，libcurl達不到每秒鐘刷取網頁資料10次以上的速度，而且libcurl還會有讀取失敗延時，而且是延時2~3秒，也就是說在這2~3秒之內網頁上變化的資料抓取不到，對於**來說這就會丟失很大一部分的資料。所以libcurl這個方案被否定了。

可是對於**這種實時更新對讀取次數要求有這麼高的，一般的方法都會造成資料的丟失，我能想到做的就是將資料丟失減小到最小範圍。我又聯想到，為什麼瀏覽器就不會丟失資料呢？可不可以做到像瀏覽器那樣一筆資料都不會丟失呢？（這個問題留在這裡帶以後解決。）我暫時用的方法就是利用wininet提供的庫函式來

開發internet程式。以下附上**：

這裡一定要做異常丟擲，考慮到如果程式正在執行中突然客戶端網路中斷，那麼做異常丟擲就會即使提示錯誤並終止。

}

利用函式cinternetsession::openurl()來實現對伺服器網頁的不斷請求操作。其中標誌：internet_flag_reload是強制重複讀取網頁。

以上程式即方法。其他更優化的方法正在研究中。。。也希望有想法有思路的同仁留下自己的方案。

抓取網頁資料（金融股市實時資料）

如何實時抓取動態網頁資料？

python 抓取網頁資料

網頁資料抓取爬蟲

抓取網頁資料（金融股市實時資料）

如何實時抓取動態網頁資料？

python 抓取網頁資料

網頁資料抓取 爬蟲

相關推薦

網頁資料抓取爬蟲