不同的瀏覽器會用不同的用戶代理字符串作為自身的標誌,當搜索引擎在通過網絡爬蟲訪問網頁時,也會通過用戶代理字符串來進行自身的標示,這也是為何網站統計報告能夠統計瀏覽器信息,爬蟲信息等。網站需要獲取用戶客戶端的信息,了解網站內容在客戶端的展現形式,壹些網站通過判斷UA來給不同的操作系統,不同的瀏覽器發送不同的頁面,不過這也可能造成某些頁面無法在某個瀏覽器中正常顯示.
我們可以獲取隨機User-Agent與使用,用上了隨機User-Agent和代理IP大部分網站就沒有什麽問題了,但還是會出現壹些反扒措施比較厲害的網站,還需要使用爬蟲代理IP來破除IP限制的。