Python提取网页中超链接的方法
下面是最简单的实现方法,先将目标网页抓回来,然后通过正则匹配a标签中的href属性来获得超链接
代码如下:
import urllib2 import re url = 'http://www.sunbloger.com/' req = urllib2.Request(url) con = urllib2.urlopen(req) doc = con.read() con.close() links = re.findall(r'href="(http://[a-zA-Z0-9./]+)"', doc) for a in links: print a
总结
以上就是这篇文章的全部内容,希望本文的内容对大家的学习或者工作能有所帮助,如果有疑问大家可以留言交流。
Python中list初始化方法示例
本文实例讲述了Python中list初始化方法。分享给大家供大家参考,具体如下:1、基本方法。lst=[1,2,3,4,5]2、初始化连续数字。lst=[nforninrange(5,10)]print(lst)[5,6
Django返回json数据用法示例
本文实例讲述了Django返回json数据用法。分享给大家供大家参考,具体如下:1、前端。jQuery发送GET请求,并解析json数据。getJSON方法可参考这里。url="http:
Python基于pillow判断图片完整性的方法
本文实例讲述了Python基于pillow判断图片完整性的方法。分享给大家供大家参考,具体如下:1、安装第三方库。pipinstallpillow2、函数示例。#encoding=utf-8#auth
编辑:广州明生医药有限公司
标签:方法,给大家,示例,初始化,本文