python抓取页面数据实例

xiaoxiao2021-12-10 44

抓取文章数据保存在本地

#coding=utf-8 import urllib import re def getHtml(url): page = urllib.urlopen(url) html = page.read() return html def getImg(html): reg = r'src="(.+?\.jpg)" pic_ext' imgre = re.compile(reg) imglist = re.findall(imgre,html) x = 0 for imgurl in imglist: urllib.urlretrieve(imgurl,'%s.jpg' % x) x+=1 html = getHtml("http://www.chtml.cn/") #这里可以直接保存到数据库中，作为测试这里打印给大家看 print getImg(html) 江山明月认证博客专家产品运营项目经理产品经理人们生活在自己定义的世界中，人们给予事物赋予意义与价值，人们是伟大的，也是渺小的，甚至是不复存在的。在我们认为的目标下，不断的探索和发现这个世界，这个宇宙，又这么的真实，真想有一天能够弄清楚这一切。

转载请注明原文地址: https://ju.6miu.com/read-700380.html

专利

最新回复(0)