网站流量

三招看穿网站流量

Joshua Hardwick
Ahrefs内容营销总监。他负责确保我们发布的每篇文章都是神作。
    想知道某个网站的流量信息?下面教你几招。

    但在进入正题之前,需要声明:

    如果你是网站的所有者,那么就没有必要估计网站流量了。你可以安装(免费的)Google 分析(Google Analytics)来获得关于网站流量的准确数据。

    Ahrefs 博客增长(Ahrefs’ blog growth),数据来自 Google 分析

    小提示.
    通过分析服务器的日志文件可以了解更多关于网站流量的信息。具体可参考这篇文章

    但是既然你已经点进这篇文章了,你一定是想知道其他网站的流量。我说的没错吧?

    你可能是想了解竞争对手网站的流量情况,他们是不可能与你分享 Google 分析账户的。

    今天我会介绍 3 招看穿任一网站流量的方法。

    第一招. 使用流量估算工具

    流量估算工具主要可以分成两类:

    1. 估算总体流量的工具:网站的访问者来自各处,搜索引擎、论坛、社交媒体等。这些工具可以估算所有来源流量的总和。
    2. 只估算自然搜索流量的工具:许多网站从搜索引擎(如 Google 等)获得了大量自然流量,这些流量叫做“自然搜索流量”(organic search traffic)。这类工具不会考虑自然搜索流量以外的流量信息。

    我们来详细了解一下。

    1. 找出某网站的总体流量

    在 Ahrefs,我们尝试了所有业界领先的总体流量估算工具,并开展了一系列小型的内部实验来确认估算的准确性,最终 SimilarWeb 获胜。

    SimilarWeb 提供了大量与流量相关的数据,包括:

    • 总访问量(Total visits);
    • 每次访问网页数(Pages per visit);
    • 平均访问时间(Average visit duration);
    • 跳出率(Bounce rate)
    小提示.
    可以帮助你了解 SimilarWeb 是如何定义及计算这些指标的。

    以下是 2018 年 7 月 ahrefs.com 的流量估算情况。

    pasted image 0 46

    奇怪的是,SimilarWeb 并未给出网页浏览量(pageviews)的数据,但是可以通过反向工程——总访问量乘以每次访问网页数——得出。(对我们来说,这个数字是 563 万 * 7.5 = 4,223 万)。

    SimilarWeb 免费版可以交互图表的方式展示多达 6 个月的月度流量数据。

    interactive graph similar web

    而付费用户可以看到长达 2 年的数据。

    所有的流量估值包含了移动端和桌面端的数据,如果你是付费订阅用户,则可以按设备类别对这些数据进行区分。

    向下滚动网页,你可以看到更多关于流量的有用数据,如

    来自各国(桌面端)的流量……

    pasted image 0 38

    小提示.
    SimilarWeb 免费版只提供流量占比前 5 名国家的数据。

    还可以按流量来源(直接访问、引介、搜索等)进行细分……

    pasted image 0 23

    根据指入域名进行细分(这在开展链接建设或者寻找客座博文机会时有用)……

    pasted image 0 34

    来看看带来自然搜索流量最多的前 5 个搜索短语吧……

    pasted image 0 44

    这些数据从何而来?

    为了更好地理解这些数据的可靠性,我们需要挖掘它们的来源。

    以下是 SimilarWeb 关于数据来源的说明

    我们的数据主要来自以下 4 个渠道:

    • 一组受监控的设备,其体量目前业界第一;
    • 位于不同国家(和地区)的本地互联网服务提供商(ISP);
    • 我们的爬虫可扫描所有公共站点,以创建高度精确的数字世界地图;
    • 直接与我们相连的网站和应用程序的数十万个直接测量源

    通俗地说,SimilarWeb 通过各种渠道,搜集与用户在线活动相关的匿名数据。

    SimilarWeb 并未明示他们的覆盖面究竟有多大。但是他们并没有获得全球每一个个体的信息。因此他们的数据取自一个相对容量较小的“在线人口”样本。

    这些数据准确吗?

    让我们来测试一下:

    1. 我们从 Flippa 选取了 116 个网站样本;
    2. 使用 SimilarWeb 导出这 116 个站点的独立访客和网页访问总数
    3. 比较这些数据。
    小提示.
    我们只从 Flippa 选取那些至少有一年历史的网站,同时这些网站的流量情况必须已经得到验证(verified traffic)。

    我们的发现如下:

    • SimilarWeb 高估了 91.67% 网站的独立访客总数
    • 在统计独立访客总数时,SimilarWeb 平均要高估 308.81%;
    • SimilarWeb 高估了 70.83% 网站的网页访问总数
    • 在统计网页访问总数时,SimilarWeb 平均要高估 210.58%。

    根据我们的测试,总体来看 SimilarWeb 大大高估了实际独立访客和网页访问总数。但是 SimilarWeb 并不总是高估这些数据,其低估独立访客总数的情况占比约 1/12,在低估网页访问量时,比重在 ¼ 到 ⅓ 之间。

    重点来了:

    对于我们选用的样本网站,SimilarWeb 只给出了其中 ⅕ 的数据。

    至于另外的 ⅘,我们看到了这样的提示:

    pasted image 0 26

    没有数据。呵呵。

    如果你疑惑为什么会出现这种情况,可能与我们选取的样本容量有关。毕竟它们都是来自 Flippa 的小型网站。

    前面提到 SimilarWeb 只根据全体在线人口的一小部分来进行估算。所以如果他们无法展示某一网站的流量估值,那是因为他们选取的子集(一小部分在线在人口)中没有足够的用户访问测试网站。

    这就是为什么 SimilarWeb 在分析小型网站的时候,往往只能提供较少的数据,甚至无法提供数据。

    为了证明这一推论,我们使用 SimilarWeb 分析了全球 Ahrefs 排名(Ahrefs Rank)前 100 的网站,结果 SimilarWeb 无一例外地提供它们的流量估值数据。

    回到这些数据:

    因为 SimilarWeb 只能提供差不多 ⅕ 网站的数据信息,于是我们的观察结果仅仅基于 24 个网站。不得不承认,这个样本是相当小的。

    因此,你在理解这些数据的时候必须慎之又慎。

    2. 找出某网站的自然搜索流量

    尽管市面不乏自然流量估算工具,但是我们显然倾向于使用我们自己的工具(Ahrefs),我们相信它的数据是最优质的。

    我们可以提供的与流量相关的数据有:

    • 来自 Google(全球)的月度访问量;
    • 流量价值(即:若按照每次点击付费(PPC)竞价,该网站或 URL 的自然流量价值);
    • 该网站排名进入 Google 前 100 名的关键词数据。

    我们来看一下 2018 年 7 月 Ahrefs 的流量估值:

    pasted image 0 20

    每个月 ahrefs.com 的自然搜索流量为 27 万。

    此为“实时”的流量估值,即它是一个“滚动着的均值”(rolling average)。每当我们更新数据库中与网站排名相关的关键词时,这个数字都会变化。正因为这样,流量估值每一天都会发生些许变化。这个数据包含了桌面端和移动端的流量。

    想知道网站某一分部的流量情况?

    只需要将该子域名或子目录(如:blog.ahrefs.com 或者 ahrefs.com/blog)的链接粘贴进入网站分析(Site Explorer)工具。在下拉菜单中选择“前缀”(Prefix)即可。

    pasted image 0 22

    如果输入的前缀为 ahrefs.com/blog,你就可以看到 “/blog/” 子目录下所有页面的搜索流量总和,如下图所示:

    pasted image 0 42

    如果你想看看该子目录下每个页面的流量情况,可以使用热门页面(Top Pages)报告。该报告将根据流量(从高到低)将这些页面列出。

    pasted image 0 28

    需要注意的是,这是全球的流量数据。点击概览(Overview)报告中的自然搜索(Organic Search)选择卡,你可以看到来自 170 个国家的流量分布。

    pasted image 0 31

    小提示.
    点击显示更多(Show more),你可以看到包含 170 个国家的完整列表。

    我们将历史自然流量数据绘制成了图表。这里显示了从 2015 年中至今的每日自然流量估值。这张图表是可交互的。你可以通过滑动鼠标的方式查看若干年中某一特定日期的流量估值。

    ahrefs interactive traffic

    想只看来自某一个国家的流量?我们提供了这个选项。

    你可以如下图所示只查看来自英国的流量:

    pasted image 0 43

    等一下,还有:点击自然搜索关键词报告,你能看到所有为网站带来流量的关键词列表,从贡献流量最多的关键词开始。

    pasted image 0 27

    你会发现,Ahrefs 可以几乎可以输出任一网站或 URL 的大量数据。这是如何做到的呢?

    这些数据从何而来?

    Ahrefs 根据数据库中的 61 亿个关键词计算估值。

    该数据库每月更新一次,其中还包括了搜索量的更新(来看看上个月比较有意思的搜索数据)。

    简单来说,我们是这样估算站点流量的:

    1. 找出网站所有有排名的关键词;
    2. 检查每个关键词的月度搜索量、排名位置以及点击率(涵盖超过 170 个国家和地区;
    3. 估算出每个关键词为网站带来的流量;
    4. 根据这些数字估算出站点的总自然搜索流量。

    你可以点击此处以进一步了解我们的计算方法。

    这些数据准确吗?

    我们来验证一下。具体做法如下:

    1. 选取与之前一样的来自 Flippa 的 116 个网站作为样本(这些网站的全球自然搜索流量都经过了验证);
    2. 从 Ahrefs 下载这 116 个样本站点的自然流量数据;
    3. 比较。

    结果如下:

    • Ahrefs 低估了 74.14% 网站的自然搜索独立访客总数
    • 在统计自然搜索独立访客总数时,Ahrefs 平均要低估 38.08%;
    • Ahrefs 低估了 90.52% 网站的自然搜索页面访问总数
    • 在统计自然搜索页面访问总数时,Ahrefs 平均要低估 52.04%。

    根据我们的测试,总体来看 Ahrefs 低估了自然搜索独立访客和自然搜索页面访问总数。但 Ahrefs 并不总是低估这些指标,其低估自然搜索独立访客总数的比例在 ¼ 左右,而低估自然搜索页面访问总数的比例大约为 1/10。

    小提示.
    值得一提的是,以上结果所基于的样本量要大于此前的 SimilarWeb 测试,因为 Ahrefs 输出了所有 116 个网站的数据(而 SimilarWeb 只显示了其中的 1/5)。

    然而为什么 Ahrefs 倾向于低估流量数据呢?

    因为我们估算的基础是 Ahrefs 数据库所包含的 61 亿个关键词的流量。这个数字听起来是不是很大?它的确够大,在市面同类工具中,Ahrefs 的数据库是最大的。

    但是即使是存储有 61 亿个关键词信息的数据库仍然不足以覆盖每一个有可能被录入 Google 搜索框的关键词。那是不可能的。

    例如,许多用户会使用超长尾短语进行搜索:

    pasted image 0 40

    我们的数据库不包含这个长尾关键词,于是也就无法估算由它带来的流量。

    所有的自然流量估算工具都是这样工作的,我们并不特殊。大家都倾向于低估流量。至于低估到何种程度取决于关键词数据库的体量。体量越大,估算的流量也就越准确。

    这就是为什么拥有市场最大的关键词数据库对我们(Ahrefs)如此重要。

    需要指出的是,没有人可以完全准确地计算搜索量,即使是Google也做不到。这是我们倾向于低估的另外一个原因。

    比较多个站点,用哪个工具最好?

    有时,比较两个或多个站点的相对流行度,比一味追求绝对的准确度更为重要。

    例如,你面前摆着一份包含了 100 个网站域名的列表,每个域名代表一个潜在的业务拓展机会,

    你想从流量最大的那些网站开始,与他们建立联系。

    此时,你需要做的就是比较这些站点,并将它们按流量从大到小进行排名。

    你应该使用哪个工具呢?

    我们将使用斯皮尔曼相关系数(Spearman correlation)对手头的数据进行分析后决定。

    SimilarWeb 数据的斯皮尔曼相关系数:

    实际的“独立访客” VS SimilarWeb 的估算值实际的“页面浏览数” VS SimilarWeb 的估算值
    0.7130.779

    Ahrefs 数据的斯皮尔曼相关系数:

    实际的“自然搜索独立访客” VS Ahrefs 的估算值实际的“自然搜索页面访问量” VS Ahrefs 的估算值
    0.7670.784

    是不是很困惑?

    以下是关于斯皮尔曼相关系数的解释:

    斯皮尔曼秩相关系数是用来比较两个变量强度和方向(正或负)的一种方法。其结果总于-1到+1之间。对两个数据集进行排名。

    更困惑了是不是?让我们来举例说明。

    我们要考察的是两个数据集——“实际”流量(数据集#1)和估计流量(数据集#2)——的相关性。如果两个数据集以任何形式呈相关,那么斯皮尔曼相关系数会在 0 到 1 之间;如果呈相关,斯皮尔曼相关系数会在 ‑1 到 0 之间。

    即,斯皮尔曼相关系数越接近 1,两个数据集就越正相关。

    我们假设某三个网站的实际流量如下:

    • 网站 1 — 100
    • 网站 2 — 5,000
    • 网站 3 — 40,000

    Ahrefs 提供的流量估值分别如下:

    • 网站 1 — 50
    • 网站 2 — 2,000
    • 网站 3 — 10,000

    这时,两个数据集的相关系数正好是 1。(两个数据集对应数据的“等级”都互相完美正相关)

    但如果 Ahrefs 提供的流量估值如下:

    • 网站 1 — 10,000
    • 网站 2 — 2,000
    • 网站 3 — 50

    这时,两个数据集的相关系数正好是 ‑1。(两个数据集对应数据的“等级”都互相完美负相关)

    因此,工具的相关性数值越高,它就越适合用来比较两个或多个网站。

    比较上面的斯皮尔曼相关系数,你会发现 Ahrefs 和 SimilarWeb 输出的流量数据与“实际”流量数据都呈现了很强的相关性,但是 Ahrefs 略胜一筹。

    这意味着你需要使用我们的网站批量分析(Batch Analysis Tool)工具来获取外链机会域名的流量估值,并将它们从大到小排序。

    pasted image 0 21

    这样你就可以对这些网站的相对流行度有一个较好的判断。

    所以你应该使用哪个流量估算工具?

    需要强调的一点是,不同的工具有不同的用途。

    SimilarWeb 估算的是整体流量,而 Ahefs 估算的是自然搜索(如 Google 等)流量。

    SimilarWeb 的一个独到之处是它可以展示一个网站大部分流量的来源(如:自然搜索、社交媒体等):

    pasted image 0 41

    thewirecutter.com 为例,根据 SimilarWeb 的数据,你可以看到它 ⅓ 的流量来自搜索引擎。

    于是我们有了一个很酷的工具流:

    如果 SimilarWeb 提供的数据展示了某网站的大量流量来自搜索引擎,你就可以使用 Ahrefs 进行深挖,以更好地理解这些流量。

    还是以 thewirecutter.com 这个网站为例,Ahrefs 能:

    展示其过去 3 年多时间内自然搜索流量的变化……

    wirecutter traffic

    列出它 310 万个排名关键词中的每一个……

    pasted image 0 25

    筛选出网站上吸引了最多自然搜索流量的页面……

    pasted image 0 39

    能做的数不胜数

    好了,不炫耀了。😉 我们来比较一下两者的价格吧。

    SimilarWeb 网站没有公布具体的价格信息。但是 Quora 上的这则讨论表明,SimilarWeb 最便宜的套餐(提供最多过去 6 个月的历史数据)价格为 199 美金/月。

    这比 Ahrefs 最便宜的套餐贵了足足 1 倍。况且我们还提供 7 天试用,SimilarWeb 可没有这种东西……

    但是在你做决定之前,我们来看看其他可以帮助你了解网站流量的方法。

    第二招. 搜索“广告服务”(Advertise with us)页面

    大多数博主都会收到很多“我想在你网站打广告;你网站流量有多大?”的邮件。于是他们会发布一个专门的广告页面并公开这些流量信息。

    geekwire.com 就有一个这样的页面:

    pasted image 0 45

    这里显示了月度网页访问量、独立访问数量和其他一些有用信息(如社交媒体信息等)。这种实践也不是大型网站的专利,我在许多独立博客上也看到过这样的页面。

    那么应该如何发现这些页面呢?

    最简单的方法是在 Google 搜索

    site:website.com advertise with us 

    如果所输入的域名包含这个页面,那么它十有八九会是第一个结果:

    pasted image 0 33

    在广告服务页面没有看到流量数据?查看一下有没有指向“媒体资源包”(media pack)的链接,许多站点都会在此处公布他们的流量数据。

    pasted image 0 24

    这种策略并不总是奏效,原因很简单,主要是以下三点:

    1. 并不是所有的网站都有广告服务页面;
    2. 广告服务页面并不总是会公布流量数据;
    3. 流量数据并不总是最新的。

    如果你找到了公布有流量数据信息的广告服务页面,还需要去检查一下上面公布的数据是否是最新的。

    大多数网站会列出最近一次更新的时间……

    TravelFashionGirl.com 的例子。

    而有一些网站并不会这么做。

    例如,geekwire.com 的广告服务页面已经有差不多一年时间没有更新了。

    如果网站的流量数据最近没有更新过(哪怕是没有提供“最近一次更新”日期),就不要相信那些数字。它们很可能是不准确的。

    第三招. 问!

    如果你想要知道某个网站最准确的、最新的流量数据,你需要联系该网站的所有者并直接询问。

    但是博主并不会把这些数据告诉一个陌生人,对吧?

    但是当你有充分的理由的时候,许多博主是愿意将这些数据与你分享的,比如:

    1. 你考虑购买他们的网站;
    2. 你想在他们的网站投放广告。

    比如,我曾经尝试通过以下这封邮件了解网站的流量数据:

    pasted image 0 29

    嗨,

    我想要咨询在你们网站打广告的报价。

    可以告诉我你们提供的广告选项有哪些吗?我对你原生广告(即软文广告)特别感兴趣,你们是否提供这个选项?

    我的预算在 200 美金到 1000 美金之间。

    还有就是我想知道你们网站每个月的独立访客和页面浏览总数(如果你可以提供 2017 年 3 月的数据就最好了),你们的广告服务页面提到了月独立访客总数为 20000,这个数字现在还是准确的吗?

    谢谢你,占用了你的时间。

    里查德

    小提示.
    除非你真的在寻找广告机会,否则我们不建议这样发邮件。不要浪费别人的时间。

    如我所说,大部分博主是很乐意与真实的广告主分享最新的流量数据的。许多人甚至会将 Google Analytics 截图为证。

    虽然通常情况下这是最可靠的获取流量数据的方法。但它也并非 100% 万无一失。原因包括:

    • 某些博主为了高价出售广告(位),会捏造流量数据
    • 并非所有人都会在网站安装 Google 分析。许多人依靠准确度较低的分析平台(如 WordPress 插件)来获取数据;
    • Google 分析很容易被错误安装,这意味着数据不总是准确无误的。如果报告显示的流量过高,请检查网站是否存在重复的 Google 分析代码,或者询问他们网站的跳出率,超低的跳出率往往是 Google 分析代码重复安装的标志。

    因此,即使你已经与博主取得了联系并获得了那些难以捉摸的流量数据,我们仍然建议使用第三方工具验证其有效性。

    以下提供其他一些估算网站流量的技巧

    你可以从流量估算开始,同时也可以通过手动检查的方法了解某网站的流行程度,如:

    • 帖子的(平均)评论数量;
    • YouTube 视频观看次数;
    • 社媒分享次数;
    • 粉丝页面的参与度(如 Facebook 主页,Twitter 等)

    如果你关注 Ahrefs 博客,就会发现每一篇文章下面都有很多评论。

    pasted image 0 30

    无论内容多么精彩,大多数读者都不愿意留下评论。因此,持续获得大量评论的博客几乎肯定会获得大量流量。

    小提示.
    我还建议在使用这种策略的时候检查评论的质量,有时垃圾评论也会导致评论数虚高。

    社交分享也是网站高流量的标志之一。

    例如,如果我们使用网站分析(Site Explorer)查看 ahrefs.com 的热门内容,会发现 Ahrefs 博客上的大多数帖子被大规模地分享到了社交媒体。

    pasted image 0 36

    最后是 YouTube……

    我们在 YouTube 上所有的视频都有成百上千的观看量。

    pasted image 0 37

    如果有这么多人观看了我们的 YouTube 视频,那一次也会有很多人访问了我们的网站。

    结语

    流量估算工具并不完美。但是,它们确实提供了解你没有所有权的网站的流量信息的最快方法。

    如果你需要准确的数字,除了直接去问,别无它法。

    你还知道其他估算/找出网站流量数据的可靠方法吗?让我们也知道一下吧。

    译者:Alex Wang, Not Soup Yet 创始人