凭借我们在搜索引擎优化(SEO)的专业知识和Ahrefs的大量的数据,我们将了解一下是否可以通过查看流行的保守和自由新闻网站的数据来识别谷歌是否存在所谓偏见。 如果你不熟悉 Ahrefs,我们是拥有网络大数据的顶级SEO工具之一。
谷歌每年都会对其排名算法进行数百次的调整。 其中大多数很小而未被人们注意到,但是每隔一段时间,就会出现一个大的“核心”更新,从而影响很大比例的搜索结果。 正如谷歌告诉我们这些更新的日期一样,我们认为,通过研究知名自由派和保守派新闻网站更新前后的自然访问量就可以找到谷歌算法是否存在偏见。
例如,下面是自2015年以来福克斯新闻的自然搜索量预估值。每条虚线代表谷歌的核心算法更新:
但是,仅查看一个网站的数据并不能告诉我们太多。于是我们对顶级的保守党和自由党新闻站点做了分析。我们从 AllSides 媒体偏向评分(左派右派评分)中得到了这些网站,以下是这些网站的列表:
保守派新闻媒体:
- New York Post
- The Last Refuge
- Drudge Report
- The Federalist
- Orange County Register
- The Epoch Times
- Washington Times
- Christian Broadcasting Network
- National Review
- Townhall
- The Mark Levin Show
- The Rush Limbaugh Show
- Breitbart
- Newsmax
- The National Interest
- The Gateway Pundit
- RedState
- PJ Media
- Washington Examiner
- Fox News
- Christian Today
- Zero Hedge
- The Daily Caller
- TheBlaze
- The Daily Wire
自由派新闻媒体:
- Vox
- U.S. News & World Report
- The Washington Post
- CNN
- Bustle
- NBC News
- Hollywood Reporter
- Los Angeles Times
- Yahoo News
- Al Jazeera
- Rolling Stone
- HuffPost
- The Verge
- The New York Times
- ABC News
- TIME
- CBS Local
- The Guardian
- Bloomberg
- NPR
- CBS News
- The Atlantic
- Politico
- Univision
在获得结果之前,我应该介绍一下 Ahrefs 数据。 我们拥有数亿个搜索词以及大量点击流数据。 我们通过查看人们搜索的所有不同的关键词、网站在搜索结果中的位置、以及用户点击的位置来估算自然流量。 对于核心更新,我们决定查看在谷歌核心算法更新开始时的流量,以及14天后的流量。 这是为了让谷歌有时间将算法更新运用到不同的数据中心,同时给我们提供时间来反映数据的变化。
我们的数据是标准化的,即搜索量是12个月的平均值。因此一些季节性因素已经考虑在内了。但也有特殊情况,例如选举,因为并非每年都有。我们不会一开始就研究最新的新闻或最近发生的事情,但是以后我们会查看所有的热门搜索和相关的点击流数据。
从2015年至今,我们看到在谷歌核心算法更新期间,每个类别的热门新闻网站的平均流量都在下降。
保守派新闻总量下降: -2.65%
自由派新闻总量下降: ‑1.78%
我们研究了在6年时间内的50个网站的流量,统计上差别并不是特别明显。在2016年的大选之前,这两个派别的影响大致相同。 在2020年大选之前,如果你看一下前一年的结果就会发现这两个派别影响还是大致相同的。但是,最新的更新似乎对保守派网站更友好。
如果我们查看各个数据点,则在每个谷歌核心算法更新中,保守派和自由派新闻网站都有看到正面或负面影响。下图中的每个箱形图代表每个类别中的热门网站。可以看到,每一次更新这两个类别中都有赢家和输家。 所以,网站在核心更新中获胜还是失败,主要取决于网站的质量。
流量是否有偏向?
对我们而言突出的一件事是,自由派网站绝对比保守派网站能获得更多的访问量。
现在的问题是,为什么会这样呢? 这是否表示这种流量偏向比我们的关键词数据还早出现? 让我们来看看是否可以解释这样的流量差异。
内容的数量
当查看被索引的页面数时,自由党新闻源的索引页面比保守新闻源多8倍。 实际上,该图表与上述流量占比图表几乎相同。 所以,顶级的自由党新闻站点通常比顶级的保守党新闻站点有更多机会对不同的话题进行排名。
品牌词 vs. 非品牌词流量
CNN 和 Fox News 的品牌词流量大致相同,这意味着有相似数量的人专门在自然搜索中寻找它们。 但是,品牌词流量在 CNN 的总流量中占比较小,这很可能是因为它们只是拥有更多的内容。 CNN 的索引页数量是 Fox News 的约2.5倍,因此他们有更多机会为不同的内容进行排名。
流量差异的其他因素
仅使用谷歌的搜索数据,很难确切地确定为什么自由派网站比保守派网站能获得更多的访问量。 页需保守派可能较少使用谷歌,他们从电视,应用程序或社交媒体获得的新闻也可能比谷歌搜索更多。 也许真的是这样,但是如果没有其他数据,这些结论就无法得到证实,仅仅只能是推测。
我们本可以寻找偏见的更多方法
如果我们查看特定的搜索词,相信我们是能够找到一些有偏向的例子。 但是问题是这个偏向主要取决于进行分析的人员。因为数据非常庞大切复杂,需要一种好的方法来确定网站和内容是否与特定搜索词相关。 不幸的是,实现非常困难且极为主观,这就是为什么我们选择不遵循这条路线。
我们也可以查看链接数据或其他网站到这些新闻网站的链接。 同样,我相信此数据是有偏向的,因为页面越多、越受欢迎、并排名越高的网站自然就会获得更多的链接。 我们已经在外链增长研究中证明了这一点。
我们本可以查看谷歌通过其自动填充功能提供的相关搜索建议,但我们已经知道它们从这些结果中删除了许多负面的字词。 同样这已经是有偏向的,所以在这里很难证明。
最后
一切都有内在的偏向。 尽管我们的数据表明,过去几年来谷歌核心算法似乎并没有极度的偏向某方,但我们仍然不能自信地说在谷歌系统的其他地方也没有偏向性。
对数据有疑问?在 Twitter 上找我吧。
译者,Park Cheng,魔贝课凡联合创始人。