在网页上查找广告


问题内容

我正在编写一个试图确定页面上是否有广告的应用程序。目前,这是使用python通过硒webdriver通过浏览器驱动的。

我发现iframe中存在大量广告,并且循环制作了每个框架内的广告

browser = webdriver.Chrome()
browser.get("http://cnn.com")

all_iframes = browser.find_elements_by_tag_name("iframe")

for iframe in all_iframes:
   browser.switch_to_frame(iframe)
   print(browser.page_source)
   browser.switch_to_default_content()

browser.quit()

我想知道是否可以在多个页面上使用一致找到的标记或标记参数来确定页面上是否有广告(页面上iframe的内部和外部)。我是否必须在每个框架中查找诸如doubleclick或adtech或adblade之类的实例?

还是我必须针对每页生成不同的检查规则?

是否知道广告在网页上的显示方式?谢谢。


问题答案:

您可以按广告服务器进行搜索。

http://pgl.yoyo.org/as/serverlist.php?hostformat=adblockplus

查看其他项目并查看它们如何处理相同的任务将很有帮助:

http://adblockplus.org/en/source