Python实战(二)—— urllib2 下载网页的方式总结

    xiaoxiao2021-03-25  238

    方法一、最简洁

     

    #coding:utf-8 import urllib2 import cookielib url='http://baidu.com' print "method 1" responce1=urllib2.urlopen(url) print responce1.getcode() #200 print len(responce1.read()) #81

    方法二、添加data、http header信息

     

     

    print "method 2" request=urllib2.Request(url) request.add_header("User-Agent","Mozilla/5.0") responce2=urllib2.urlopen(request) print responce2.getcode() #200 print len(responce2.read()) #81

    方法三、添加处理器

     

     

    print "method 3" cj=cookielib.CookieJar() opener=urllib2.build_opener(urllib2.HTTPCookieProcessor(cj)) urllib2.install_opener(opener) responce3=urllib2.urlopen(url) print cj #<CookieJar[]> print responce3.getcode() #200 print responce3.read() #81

     

    每个方法依次升级,应用于模拟更丰富的http请求下载网页。

     

    转载请注明原文地址: https://ju.6miu.com/read-786.html

    最新回复(0)