但在进入正题之前,需要声明:
如果你是网站的所有者,那么就没有必要估计网站流量了。你可以安装(免费的)Google 分析(Google Analytics)来获得关于网站流量的准确数据。
但是既然你已经点进这篇文章了,你一定是想知道其他网站的流量。我说的没错吧?
你可能是想了解竞争对手网站的流量情况,他们是不可能与你分享 Google 分析账户的。
今天我会介绍 3 招看穿任一网站流量的方法。
第一招. 使用流量估算工具
流量估算工具主要可以分成两类:
- 估算总体流量的工具:网站的访问者来自各处,搜索引擎、论坛、社交媒体等。这些工具可以估算所有来源流量的总和。
- 只估算自然搜索流量的工具:许多网站从搜索引擎(如 Google 等)获得了大量自然流量,这些流量叫做“自然搜索流量”(organic search traffic)。这类工具不会考虑自然搜索流量以外的流量信息。
我们来详细了解一下。
1. 找出某网站的总体流量
在 Ahrefs,我们尝试了所有业界领先的总体流量估算工具,并开展了一系列小型的内部实验来确认估算的准确性,最终 SimilarWeb 获胜。
SimilarWeb 提供了大量与流量相关的数据,包括:
- 总访问量(Total visits);
- 每次访问网页数(Pages per visit);
- 平均访问时间(Average visit duration);
- 跳出率(Bounce rate)
以下是 2018 年 7 月 ahrefs.com 的流量估算情况。
奇怪的是,SimilarWeb 并未给出网页浏览量(pageviews)的数据,但是可以通过反向工程——总访问量乘以每次访问网页数——得出。(对我们来说,这个数字是 563 万 * 7.5 = 4,223 万)。
SimilarWeb 免费版可以交互图表的方式展示多达 6 个月的月度流量数据。
而付费用户可以看到长达 2 年的数据。
所有的流量估值包含了移动端和桌面端的数据,如果你是付费订阅用户,则可以按设备类别对这些数据进行区分。
向下滚动网页,你可以看到更多关于流量的有用数据,如
来自各国(桌面端)的流量……
还可以按流量来源(直接访问、引介、搜索等)进行细分……
根据指入域名进行细分(这在开展链接建设或者寻找客座博文机会时有用)……
来看看带来自然搜索流量最多的前 5 个搜索短语吧……
这些数据从何而来?
为了更好地理解这些数据的可靠性,我们需要挖掘它们的来源。
以下是 SimilarWeb 关于数据来源的说明:
我们的数据主要来自以下 4 个渠道:
- 一组受监控的设备,其体量目前业界第一;
- 位于不同国家(和地区)的本地互联网服务提供商(ISP);
- 我们的爬虫可扫描所有公共站点,以创建高度精确的数字世界地图;
- 直接与我们相连的网站和应用程序的数十万个直接测量源
通俗地说,SimilarWeb 通过各种渠道,搜集与用户在线活动相关的匿名数据。
SimilarWeb 并未明示他们的覆盖面究竟有多大。但是他们并没有获得全球每一个个体的信息。因此他们的数据取自一个相对容量较小的“在线人口”样本。
这些数据准确吗?
让我们来测试一下:
- 我们从 Flippa 选取了 116 个网站样本;
- 使用 SimilarWeb 导出这 116 个站点的独立访客总数和网页访问总数;
- 比较这些数据。
我们的发现如下:
- SimilarWeb 高估了 91.67% 网站的独立访客总数;
- 在统计独立访客总数时,SimilarWeb 平均要高估 308.81%;
- SimilarWeb 高估了 70.83% 网站的网页访问总数;
- 在统计网页访问总数时,SimilarWeb 平均要高估 210.58%。
根据我们的测试,总体来看 SimilarWeb 大大高估了实际独立访客和网页访问总数。但是 SimilarWeb 并不总是高估这些数据,其低估独立访客总数的情况占比约 1/12,在低估网页访问量时,比重在 ¼ 到 ⅓ 之间。
重点来了:
对于我们选用的样本网站,SimilarWeb 只给出了其中 ⅕ 的数据。
至于另外的 ⅘,我们看到了这样的提示:
没有数据。呵呵。
如果你疑惑为什么会出现这种情况,可能与我们选取的样本容量有关。毕竟它们都是来自 Flippa 的小型网站。
前面提到 SimilarWeb 只根据全体在线人口的一小部分来进行估算。所以如果他们无法展示某一网站的流量估值,那是因为他们选取的子集(一小部分在线在人口)中没有足够的用户访问测试网站。
这就是为什么 SimilarWeb 在分析小型网站的时候,往往只能提供较少的数据,甚至无法提供数据。
为了证明这一推论,我们使用 SimilarWeb 分析了全球 Ahrefs 排名(Ahrefs Rank)前 100 的网站,结果 SimilarWeb 无一例外地提供它们的流量估值数据。
回到这些数据:
因为 SimilarWeb 只能提供差不多 ⅕ 网站的数据信息,于是我们的观察结果仅仅基于 24 个网站。不得不承认,这个样本是相当小的。
因此,你在理解这些数据的时候必须慎之又慎。
2. 找出某网站的自然搜索流量
尽管市面不乏自然流量估算工具,但是我们显然倾向于使用我们自己的工具(Ahrefs),我们相信它的数据是最优质的。
我们可以提供的与流量相关的数据有:
- 来自 Google(全球)的月度访问量;
- 流量价值(即:若按照每次点击付费(PPC)竞价,该网站或 URL 的自然流量价值);
- 该网站排名进入 Google 前 100 名的关键词数据。
我们来看一下 2018 年 7 月 Ahrefs 的流量估值:
每个月 ahrefs.com 的自然搜索流量为 27 万。
此为“实时”的流量估值,即它是一个“滚动着的均值”(rolling average)。每当我们更新数据库中与网站排名相关的关键词时,这个数字都会变化。正因为这样,流量估值每一天都会发生些许变化。这个数据包含了桌面端和移动端的流量。
只需要将该子域名或子目录(如:blog.ahrefs.com 或者 ahrefs.com/blog)的链接粘贴进入网站分析(Site Explorer)工具。在下拉菜单中选择“前缀”(Prefix)即可。
如果输入的前缀为 ahrefs.com/blog,你就可以看到 “/blog/” 子目录下所有页面的搜索流量总和,如下图所示:
如果你想看看该子目录下每个页面的流量情况,可以使用热门页面(Top Pages)报告。该报告将根据流量(从高到低)将这些页面列出。
需要注意的是,这是全球的流量数据。点击概览(Overview)报告中的自然搜索(Organic Search)选择卡,你可以看到来自 170 个国家的流量分布。
我们将历史自然流量数据绘制成了图表。这里显示了从 2015 年中至今的每日自然流量估值。这张图表是可交互的。你可以通过滑动鼠标的方式查看若干年中某一特定日期的流量估值。
想只看来自某一个国家的流量?我们提供了这个选项。
你可以如下图所示只查看来自英国的流量:
等一下,还有:点击自然搜索关键词报告,你能看到所有为网站带来流量的关键词列表,从贡献流量最多的关键词开始。
你会发现,Ahrefs 可以几乎可以输出任一网站或 URL 的大量数据。这是如何做到的呢?
这些数据从何而来?
Ahrefs 根据数据库中的 61 亿个关键词计算估值。
该数据库每月更新一次,其中还包括了搜索量的更新(来看看上个月比较有意思的搜索数据)。
简单来说,我们是这样估算站点流量的:
- 找出网站所有有排名的关键词;
- 检查每个关键词的月度搜索量、排名位置以及点击率(涵盖超过 170 个国家和地区;
- 估算出每个关键词为网站带来的流量;
- 根据这些数字估算出站点的总自然搜索流量。
你可以点击此处以进一步了解我们的计算方法。
这些数据准确吗?
我们来验证一下。具体做法如下:
- 选取与之前一样的来自 Flippa 的 116 个网站作为样本(这些网站的全球自然搜索流量都经过了验证);
- 从 Ahrefs 下载这 116 个样本站点的自然流量数据;
- 比较。
结果如下:
- Ahrefs 低估了 74.14% 网站的自然搜索独立访客总数;
- 在统计自然搜索独立访客总数时,Ahrefs 平均要低估 38.08%;
- Ahrefs 低估了 90.52% 网站的自然搜索页面访问总数;
- 在统计自然搜索页面访问总数时,Ahrefs 平均要低估 52.04%。
根据我们的测试,总体来看 Ahrefs 低估了自然搜索独立访客和自然搜索页面访问总数。但 Ahrefs 并不总是低估这些指标,其低估自然搜索独立访客总数的比例在 ¼ 左右,而低估自然搜索页面访问总数的比例大约为 1/10。
然而为什么 Ahrefs 倾向于低估流量数据呢?
因为我们估算的基础是 Ahrefs 数据库所包含的 61 亿个关键词的流量。这个数字听起来是不是很大?它的确够大,在市面同类工具中,Ahrefs 的数据库是最大的。
但是即使是存储有 61 亿个关键词信息的数据库仍然不足以覆盖每一个有可能被录入 Google 搜索框的关键词。那是不可能的。
例如,许多用户会使用超长尾短语进行搜索:
我们的数据库不包含这个长尾关键词,于是也就无法估算由它带来的流量。
所有的自然流量估算工具都是这样工作的,我们并不特殊。大家都倾向于低估流量。至于低估到何种程度取决于关键词数据库的体量。体量越大,估算的流量也就越准确。
这就是为什么拥有市场最大的关键词数据库对我们(Ahrefs)如此重要。
需要指出的是,没有人可以完全准确地计算搜索量,即使是Google也做不到。这是我们倾向于低估的另外一个原因。
比较多个站点,用哪个工具最好?
有时,比较两个或多个站点的相对流行度,比一味追求绝对的准确度更为重要。
例如,你面前摆着一份包含了 100 个网站域名的列表,每个域名代表一个潜在的业务拓展机会,
你想从流量最大的那些网站开始,与他们建立联系。
此时,你需要做的就是比较这些站点,并将它们按流量从大到小进行排名。
你应该使用哪个工具呢?
我们将使用斯皮尔曼相关系数(Spearman correlation)对手头的数据进行分析后决定。
SimilarWeb 数据的斯皮尔曼相关系数:
实际的“独立访客” VS SimilarWeb 的估算值 | 实际的“页面浏览数” VS SimilarWeb 的估算值 |
---|---|
0.713 | 0.779 |
Ahrefs 数据的斯皮尔曼相关系数:
实际的“自然搜索独立访客” VS Ahrefs 的估算值 | 实际的“自然搜索页面访问量” VS Ahrefs 的估算值 |
---|---|
0.767 | 0.784 |
是不是很困惑?
以下是关于斯皮尔曼相关系数的解释:
斯皮尔曼秩相关系数是用来比较两个变量强度和方向(正或负)的一种方法。其结果总于-1到+1之间。对两个数据集进行排名。
更困惑了是不是?让我们来举例说明。
我们要考察的是两个数据集——“实际”流量(数据集#1)和估计流量(数据集#2)——的相关性。如果两个数据集以任何形式呈正相关,那么斯皮尔曼相关系数会在 0 到 1 之间;如果呈负相关,斯皮尔曼相关系数会在 ‑1 到 0 之间。
即,斯皮尔曼相关系数越接近 1,两个数据集就越正相关。
我们假设某三个网站的实际流量如下:
- 网站 1 — 100
- 网站 2 — 5,000
- 网站 3 — 40,000
Ahrefs 提供的流量估值分别如下:
- 网站 1 — 50
- 网站 2 — 2,000
- 网站 3 — 10,000
这时,两个数据集的相关系数正好是 1。(两个数据集对应数据的“等级”都互相完美正相关)
但如果 Ahrefs 提供的流量估值如下:
- 网站 1 — 10,000
- 网站 2 — 2,000
- 网站 3 — 50
这时,两个数据集的相关系数正好是 ‑1。(两个数据集对应数据的“等级”都互相完美负相关)
因此,工具的相关性数值越高,它就越适合用来比较两个或多个网站。
比较上面的斯皮尔曼相关系数,你会发现 Ahrefs 和 SimilarWeb 输出的流量数据与“实际”流量数据都呈现了很强的相关性,但是 Ahrefs 略胜一筹。
这意味着你需要使用我们的网站批量分析(Batch Analysis Tool)工具来获取外链机会域名的流量估值,并将它们从大到小排序。
这样你就可以对这些网站的相对流行度有一个较好的判断。
所以你应该使用哪个流量估算工具?
需要强调的一点是,不同的工具有不同的用途。
SimilarWeb 估算的是整体流量,而 Ahefs 估算的是自然搜索(如 Google 等)流量。
SimilarWeb 的一个独到之处是它可以展示一个网站大部分流量的来源(如:自然搜索、社交媒体等):
以 thewirecutter.com 为例,根据 SimilarWeb 的数据,你可以看到它 ⅓ 的流量来自搜索引擎。
于是我们有了一个很酷的工具流:
如果 SimilarWeb 提供的数据展示了某网站的大量流量来自搜索引擎,你就可以使用 Ahrefs 进行深挖,以更好地理解这些流量。
还是以 thewirecutter.com 这个网站为例,Ahrefs 能:
展示其过去 3 年多时间内自然搜索流量的变化……
列出它 310 万个排名关键词中的每一个……
筛选出网站上吸引了最多自然搜索流量的页面……
能做的数不胜数!
好了,不炫耀了。😉 我们来比较一下两者的价格吧。
SimilarWeb 网站没有公布具体的价格信息。但是 Quora 上的这则讨论表明,SimilarWeb 最便宜的套餐(提供最多过去 6 个月的历史数据)价格为 199 美金/月。
这比 Ahrefs 最便宜的套餐贵了足足 1 倍。况且我们还提供 7 天试用,SimilarWeb 可没有这种东西……
但是在你做决定之前,我们来看看其他可以帮助你了解网站流量的方法。
第二招. 搜索“广告服务”(Advertise with us)页面
大多数博主都会收到很多“我想在你网站打广告;你网站流量有多大?”的邮件。于是他们会发布一个专门的广告页面并公开这些流量信息。
geekwire.com 就有一个这样的页面:
这里显示了月度网页访问量、独立访问数量和其他一些有用信息(如社交媒体信息等)。这种实践也不是大型网站的专利,我在许多独立博客上也看到过这样的页面。
那么应该如何发现这些页面呢?
最简单的方法是在 Google 搜索:
site:website.com advertise with us
如果所输入的域名包含这个页面,那么它十有八九会是第一个结果:
在广告服务页面没有看到流量数据?查看一下有没有指向“媒体资源包”(media pack)的链接,许多站点都会在此处公布他们的流量数据。
这种策略并不总是奏效,原因很简单,主要是以下三点:
- 并不是所有的网站都有广告服务页面;
- 广告服务页面并不总是会公布流量数据;
- 流量数据并不总是最新的。
如果你找到了公布有流量数据信息的广告服务页面,还需要去检查一下上面公布的数据是否是最新的。
大多数网站会列出最近一次更新的时间……
而有一些网站并不会这么做。
例如,geekwire.com 的广告服务页面已经有差不多一年时间没有更新了。
如果网站的流量数据最近没有更新过(哪怕是没有提供“最近一次更新”日期),就不要相信那些数字。它们很可能是不准确的。
第三招. 问!
如果你想要知道某个网站最准确的、最新的流量数据,你需要联系该网站的所有者并直接询问。
但是博主并不会把这些数据告诉一个陌生人,对吧?
但是当你有充分的理由的时候,许多博主是愿意将这些数据与你分享的,比如:
- 你考虑购买他们的网站;
- 你想在他们的网站投放广告。
比如,我曾经尝试通过以下这封邮件了解网站的流量数据:
嗨,
我想要咨询在你们网站打广告的报价。
可以告诉我你们提供的广告选项有哪些吗?我对你原生广告(即软文广告)特别感兴趣,你们是否提供这个选项?
我的预算在 200 美金到 1000 美金之间。
还有就是我想知道你们网站每个月的独立访客和页面浏览总数(如果你可以提供 2017 年 3 月的数据就最好了),你们的广告服务页面提到了月独立访客总数为 20000,这个数字现在还是准确的吗?
谢谢你,占用了你的时间。
里查德
如我所说,大部分博主是很乐意与真实的广告主分享最新的流量数据的。许多人甚至会将 Google Analytics 截图为证。
虽然通常情况下这是最可靠的获取流量数据的方法。但它也并非 100% 万无一失。原因包括:
- 某些博主为了高价出售广告(位),会捏造流量数据;
- 并非所有人都会在网站安装 Google 分析。许多人依靠准确度较低的分析平台(如 WordPress 插件)来获取数据;
- Google 分析很容易被错误安装,这意味着数据不总是准确无误的。如果报告显示的流量过高,请检查网站是否存在重复的 Google 分析代码,或者询问他们网站的跳出率,超低的跳出率往往是 Google 分析代码重复安装的标志。
因此,即使你已经与博主取得了联系并获得了那些难以捉摸的流量数据,我们仍然建议使用第三方工具验证其有效性。
以下提供其他一些估算网站流量的技巧
你可以从流量估算开始,同时也可以通过手动检查的方法了解某网站的流行程度,如:
- 帖子的(平均)评论数量;
- YouTube 视频观看次数;
- 社媒分享次数;
- 粉丝页面的参与度(如 Facebook 主页,Twitter 等)
如果你关注 Ahrefs 博客,就会发现每一篇文章下面都有很多评论。
无论内容多么精彩,大多数读者都不愿意留下评论。因此,持续获得大量评论的博客几乎肯定会获得大量流量。
社交分享也是网站高流量的标志之一。
例如,如果我们使用网站分析(Site Explorer)查看 ahrefs.com 的热门内容,会发现 Ahrefs 博客上的大多数帖子被大规模地分享到了社交媒体。
最后是 YouTube……
我们在 YouTube 上所有的视频都有成百上千的观看量。
如果有这么多人观看了我们的 YouTube 视频,那一次也会有很多人访问了我们的网站。
结语
流量估算工具并不完美。但是,它们确实提供了解你没有所有权的网站的流量信息的最快方法。
如果你需要准确的数字,除了直接去问,别无它法。
你还知道其他估算/找出网站流量数据的可靠方法吗?让我们也知道一下吧。
译者:Alex Wang, Not Soup Yet 创始人