[Python] python不用html分析模块,不用正则抓取网页的全部链接 →→→→→进入此内容的聊天室

来自 , 2019-05-31, 写在 Python, 查看 126 次.
URL http://www.code666.cn/view/853c68de
  1. import urllib
  2.  
  3. htmlSource = urllib.urlopen("http://www.sharejs.com").read(200000)
  4. for chunk in htmlSource.lower().split('href=')[1:]:
  5.     indexes = [i for i in [chunk.find('"',1),chunk.find('>'),chunk.find(' ')] if i>-1]
  6.     print chunk[:min(indexes)]
  7. #//python/209

回复 "python不用html分析模块,不用正则抓取网页的全部链接"

这儿你可以回复上面这条便签

captcha