如何在Midia Wiki上处理多个重复项

我基本上已经从MediaWiki API下载了许多与数学有关的页面。 其中有些只是重复同一条文章,但是每个标题的字母不同,例如:“ Adição_de_ s egmentos ”和“ Adição_de_ S egmentos ”(葡萄牙语)(我的母语)

当我开始分析特定文章的观看统计信息时,在浏览其不同标题时,我希望收到以下数据:

  1. 旧的(已弃用的)数据将保留到X天,然后再无其他显示;
  2. 打补丁的标题将具有从第X天开始的数据,然后一直保留到我要分析的最后一天。

但这不是发生的事情。即使从谷歌(作为搜索工具的一个例子)或在维基百科本身上搜索不再是必需的,仍有一些文章仍在接收视图。

那该怎么办?数据不同,一个标题在Y天有3个视图,而另一个标题有1个视图。我是否应该仅对它们进行汇总而不考虑它们可能会从一个用户那里获得相同的访问权限?还是某些情况是用户访问了一些旧链接,而Wikipedia只是将用户重定向到已修补的文章,却没有重新考虑统计数据的正确位置?

谢谢。

zhuxiwangzhenliang 回答:如何在Midia Wiki上处理多个重复项

暂时没有好的解决方案,如果你有好的解决方案,请发邮件至:iooj@foxmail.com
本文链接:https://www.f2er.com/2714900.html

大家都在问