用美丽的汤提取href


问题内容

我使用此代码来访问我的链接:

links = soup.find("span", { "class" : "hsmall" })
links.findNextSiblings('a')
for link in links:
  print link['href']
  print link.string

链接没有ID或类或其他内容,它只是具有href属性的经典链接。

我的脚本的响应是:

print link['href']
TypeError: string indices must be integers

您能帮我获得href价值吗?谢谢 !


问题答案:

好的,它现在可以与以下代码一起使用:

linkSpan = soup.find("span", { "class" : "hsmall" })
link = [tag.attrMap['href'] for tag in linkSpan.findAll('a', {'href': True})]
for lien in link:
  print "LINK = " + lien`