[Python] python通过HTMLParser抓取网页上的全部链接 →→→→→进入此内容的聊天室

来自 , 2019-04-11, 写在 Python, 查看 221 次.

import HTMLParser, urllib
 
class linkParser(HTMLParser.HTMLParser):
    def __init__(self):
        HTMLParser.HTMLParser.__init__(self)
        self.links = []
    def handle_starttag(self, tag, attrs):
        if tag=='a':
            self.links.append(dict(attrs)['href'])
 
htmlSource = urllib.urlopen("http://www.sharejs.com").read(200000)
p = linkParser()
p.feed(htmlSource)
for link in p.links:
    print link
#//python/207

回复 "python通过HTMLParser抓取网页上的全部链接"

这儿你可以回复上面这条便签

作者你的名字是？

标题给你的便签一个标题。

语言你的便签是以

你的便签在这儿输入便签内容

创建短链接创建一个较短的URL，连接到这个便签

私人私人便签不会显示在最近列表中

保存期限我们应该什么时候删除这张便签？

防滥用键入这些字符

Code666 (代码贴、代码片段)

[Python] python通过HTMLParser抓取网页上的全部链接 →→→→→进入此内容的聊天室

回复 "python通过HTMLParser抓取网页上的全部链接"