python抓取页面数据实例

    xiaoxiao2021-12-10  16

    抓取文章数据保存在本地

    #coding=utf-8 import urllib import re def getHtml(url): page = urllib.urlopen(url) html = page.read() return html def getImg(html): reg = r'src="(.+?\.jpg)" pic_ext' imgre = re.compile(reg) imglist = re.findall(imgre,html) x = 0 for imgurl in imglist: urllib.urlretrieve(imgurl,'%s.jpg' % x) x+=1 html = getHtml("http://www.chtml.cn/") #这里可以直接保存到数据库中,作为测试这里打印给大家看 print getImg(html) 江山明月 认证博客专家 产品运营 项目经理 产品经理 人们生活在自己定义的世界中,人们给予事物赋予意义与价值,人们是伟大的,也是渺小的,甚至是不复存在的。在我们认为的目标下,不断的探索和发现这个世界,这个宇宙,又这么的真实,真想有一天能够弄清楚这一切。
    转载请注明原文地址: https://ju.6miu.com/read-700380.html

    最新回复(0)