python代碼如下:

python2

import urllib2

url = http://www.baidu.com/

request = urllib2.Request(url)

response = urllib2.urlopen(request)

print(response.read())

python3

from urllib import request

url = http://www.baidu.com/

req = request.Request(url)

response = request.urlopen(req)

print(response.read().decode()

我們開啟fiddler,運行完成代碼,然后在fiddler上面查看下我們的數據

很明顯就是python的版本,
因此我們在學習爬蟲的時候無論爬什么,代碼最好都要加上這個頭信息

下面我們在代碼上加入一個頭

from urllib import request

headers = {
    User-Agent:Mozilla/5.0 (Windows NT 10.0; WOW64
}

url = http://www.baidu.com/

req = request.Request(url,headers=headers)

response = request.urlopen(req)

print(response.read().decode())

抓包的結果如下:

更多關于云服務器域名注冊,虛擬主機的問題,請訪問三五互聯官網:www.shinetop.cn

贊(0)
聲明:本網站發布的內容(圖片、視頻和文字)以原創、轉載和分享網絡內容為主,如果涉及侵權請盡快告知,我們將會在第一時間刪除。文章觀點不代表本網站立場,如需處理請聯系客服。郵箱:3140448839@qq.com。本站原創內容未經允許不得轉載,或轉載時需注明出處:三五互聯知識庫 » python爬蟲之User Agent

登錄

找回密碼

注冊