[Python] python不用html分析模块,不用正则抓取网页的全部链接 →→→→→进入此内容的聊天室

来自 , 2019-10-18, 写在 Python, 查看 127 次.
URL http://www.code666.cn/view/af94ed0d
  1. import urllib
  2.  
  3. htmlSource = urllib.urlopen("http://www.sharejs.com").read(200000)
  4. for chunk in htmlSource.lower().split('href=')[1:]:
  5.     indexes = [i for i in [chunk.find('"',1),chunk.find('>'),chunk.find(' ')] if i>-1]
  6.     print chunk[:min(indexes)]
  7. #//python/209

回复 "python不用html分析模块,不用正则抓取网页的全部链接"

这儿你可以回复上面这条便签

captcha