Wikipedia转储文件上的功能

我们可以使用functions中的Wikipedia APIWikipedia中获得一些结果。

例如:

**import Wikipedia

print(Wikipedia.search("Bill",results=2)).**

我的问题是,如何为特定版本的Wikipedia(例如,仅Wikipedia 2017)使用Wikipedia API函数?!

achang95 回答:Wikipedia转储文件上的功能

我怀疑这是可能的。 PyWikibot使用MediaWiki的在线API(在本例中为站点Wikipedia)。这始终是实时数据。

您提到的转储是Wikipedia数据的脱机快照(假设您在谈论https://dumps.wikimedia.org/)。此数据未以任何方式连接到MediaWiki API,因此无法与之查询。

在特定时间可以浏览维基百科的数据的方法:

  • 如果仅页面数量有限:您可以编写一个脚本,该脚本将遍历页面的可用修订并选择最接近所需时间的脚本。这可能容易出错,需要大量工作并且无法真正扩展
  • 下载要查询的转储,并编写一个可以处理文件的脚本(例如,取决于您要执行的操作,数据库转储或静态html转储,您的问题并不清楚)
,

在具有特定版本的转储文件上,我们不能使用Wikipedia API。我们只是可以通过代码读取转储文件,然后在此文件上做我们需要的东西。

本文链接:https://www.f2er.com/2465070.html

大家都在问