什么是技术 SEO?11 个最佳方法

什么是技术 SEO? 11 个最佳方法

Joshua Hardwick
Ahrefs内容营销总监。他负责确保我们发布的每篇文章都是神作。
    技术 SEO 是一个优化网站以帮助诸如 Google 之类的搜索引擎查找、理解和索引该页面的过程。

    虽然像 Google 这样的现代搜索引擎相对较擅长发现和理解内容,但还远非完美。技术问题可以很容易地阻止他们在搜索结果中爬网、建立索引和显示网页。

    在这篇文章中,我们将介绍一些任何技术水平的人都可以实现技术 SEO 的最佳方法。

    1. 确保重要内容“可爬网”和“可索引”
    2. 使用HTTPs
    3. 修复重复内容问题
    4. 创建网站地图
    5. 使用 hreflang 获得多语言内容
    6. 重定向 HTTP 到 HTTPS
    7. 使用架构标记获得“丰富摘要”
    8. 修复孤立页面
    9. 确保页面加载速度快
    10. 使用架构提高进入知识图的几率
    11. 不要对内部链接运用 nofollow

    爬网是搜索引擎发现最新内容的方式。蜘蛛在这里访问并从已知网页下载新数据。

    例如,假设你将一个新页面添加到你的网站,并从主页链接到该页面。 Google 下次抓取你的主页时,它会发现指向新页面的链接,如果它确定页面上的内容对搜索者有价值,就会将其编入索引。

    只要不阻止搜索引擎对页面进行爬网或索引,此过程就可以正常运行。

    Robots.txt是一个告诉 Google 等搜索引擎可以爬网和不能爬网哪些页面的文件。你可以导航到 yourwebsite.com/robots.txt 查看。

    在上面的例子中,这两行简单的代码阻止了搜索引擎爬网网站上的每个页面。你可以以此看到该文件的原理,以及犯下这样代价高昂的错误有多容易。

    你可以在 Google 搜索控制台 中检查 robots.txt 阻止了哪些页面。只需转到覆盖率报告,切换到查看排除的 URL,然后查找“被 robots.txt 阻止”的错误。

    如果其中有不应阻止的 URL,则需要删除或编辑 robots.txt 文件以解决该问题。

    然而,可爬网页面并不总是可索引的。如果你的网页存在 meta robots 标签或 x‑robots 标题设置为“ noindex ”,则搜索引擎无法索引该页面。

    你可以使用 Ahrefs 的 SEO 工具栏上的免费页面报告来检查是否有这样的情况。

    要检查所有页面上的 rogue noindex 标记,请在Ahrefs 站长工具中运行带有网站诊断的爬网,并检查 Indexability report (可索引性报告)中是否存在“ Noindex page ”的警告。

    删除所有应被索引的页面的“ noindex ” 元标记或 x‑robots-tag 来修复这些问题。

    HTTPS 加密网站和访问者之间发送的数据。它有助于保护敏感信息(如信用卡的详细信息)不被泄露。

    HTTPS 给网络用户带来的益处使它自 2014 年以来一直是排名因素,这不足为奇。

    怎么知道你的网站是否在使用 HTTPS 呢?

    转到 https://www.yourwebsite.com,检查加载栏中的锁定图标。

    如果看到红色的“ Not secure (不安全)”警告,说明你未使用 HTTPS,需要安装 TLS/SSL 证书。你可以从 LetsEncrypt 免费获得安装包。

    如果看到灰色的“ Not secure ”警告…

    …那么你就遇到了一个混合内容的问题。这意味着页面本身是通过 HTTPS 加载的,但它是通过 HTTP 加载资源文件(图像、CSS 等)的。

    有四种方法可以解决此问题:

    • 为资源选择一个安全主机(如果有的话)。
    • 本地托管资源(如果法律允许的话)。
    • 在站点中排除该资源。
    • 使用 HTTP内容安全策略( CSP

    但是,如果你在一个页面上遇到了混合内容问题,那么其他页面也很有可能也受到影响。要检查这种情况,请使用 Ahrefs 站长工具对你的网站进行爬网,该工具可检查包括 HTTP / HTTPS 混合内容在内的 100 多个预定义的 SEO 问题。

    推荐阅读:什么是HTTPS?你需要知道的一切

    重复内容是指相同或相似的内容出现在网络上的多个位置。它可以发生在一个网站或多个网站上。

    例如,这篇来自 Buffer 的帖子出现在两个位置:

    https://buffer.com/library/social-media-manager-checklist

    https://buffer.com/resources/social-media-manager-checklist

    抛开人们的想法而谈, Google 不会因内容重复而惩罚网站,这一点已多次证实

    但是重复的内容可能会导致其他问题,例如:

    • 搜索结果出现不良或不友好的 URL
    • 反向链接稀释;
    • 浪费爬网预算;
    • 摘抄或联合发表的内容排名高于你的网站。

    你可以在 Google 搜索控制台中查看内容重复的页面。只需转到覆盖率报告,切换以查看排除的 URL,然后查找与重复项相关的问题。

    Google 解释了这些问题的含义以及如何在这里解决它们。

    但是,搜索控制台只告诉你 Google 已经识别为重复的 URL,Google 可能还未发现其他的重复内容问题。要找到这些内容,请使用 Ahrefs 站长工具运行免费爬网,并检查重复内容报告。

    通过在每组重复项中选择一个 URL 作为“规范”(主要)版本来解决该问题。

    网站地图列出了网站上所有重要内容。它们有多种格式,但是 XML 文件是最常见的。

    以下是我们博客的网站地图的样子:

    如今,许多人都质疑站点地图的重要性,因为通常情况下, Google 在即使没有内容时也可以找到你的大部分内容。 但是,一位 Google 代表在 2019 年确认了网站地图的重要性,指出网站地图是 Google 第二重要的 URL 来源: 

    但为什么会这样?

    原因之一是网站地图通常包含“孤立”页面,这些是 Google 无法通过爬网找到的页面,因为它们没有来自你的网站上可爬网页面的内部链接

    包括 Wix,Squarespace 和 Shopify 在内的大多数现代 CMS 都会自动为你生成一个网站地图。如果你使用的是 WordPress,则需要使用一个流行的 SEO 插件(如 Yoast  RankMath )来创建一个网站地图。

    然后,你可以通过搜索控制台将其提交给 Google。

    值得注意的是,Google 还将网站地图中的 URL 视为建议规范。这有助于解决重复内容问题(请参见上一点),但最好的做法是尽可能使用规范标签

    https://www.youtube.com/watch?v=JLCwGo43fAY&feature=youtu.be&t=3m16s

    推荐阅读:如何创造 XML网站地图(并向 Google 提交)

    Hreflang是一个 HTML 属性,用于指定网页的语言和地理目标。它可用于其他语言版本的网页或其他地理位置定位的网站。

    例如,我们的主页有多种语言版本:

    每一个变体都使用 hreflang 告知搜索引擎其语言和地理定位。

    Hreflang 对 SEO 很重要,主要有两个原因:

    1. 它有助于消除重复内容。假设你有两个相似的页面。如果没有 hreflang,Google 可能会将这些页面视为重复页面,并只为其中一个页面编制索引。
    2. 它可以帮助排名。此视频中,Google 的 Gary Ilyes 解释了, hreflang 群集中的页面共享排名信号。这意味着,如果你的英文页面具有大量链接,则该页面的西班牙语版本会有效地共享这些信息。这可能有助于该页面在其他国家的 Google 中排名。

    实现 hreflang 很容易。只需将适当的 hreflang 标记添加到页面的所有版本。

    例如,如果你的主页有英语、西班牙语和德语版本,你可以将这些 hreflang 标记添加到这些页面:

    <link rel="alternate" hreflang="x-default" href="https://yourwebsite.com" />

    <link rel="alternate" hreflang="es” href="https://yourwebsite.com/es/" />

    <link rel="alternate" hreflang="de” href="https://yourwebsite.com/de/" />

    在下面的参考资料中了解更多有关实现 hreflang 和多语言 SEO 的信息。

    即使你使用的是 HTTPs,你的网站也可以通过 HTTP 版本访问。这并不理想,因为如果访问者可以访问网站的非安全版本,那么使用 HTTPS 是没有意义的。

    要检查是否存在这种情况,请尝试导航到站点的 HTTP 版本。如果浏览器自动重定向,则可能没有问题。

    如果能够访问 HTTP 版本,则需要将 HTTP 重定向到 HTTPs。

    你可以通过将以下代码添加到 .htaccess 文件来完成此操作:

    RewriteEngine On

    RewriteCond %{HTTPS} off

    RewriteRule ^(.*)$ https://%{HTTP_HOST}%{REQUEST_URI} [L,R=301]

    或者,如果你正在使用 WordPress,只需在“设置”下将你的 WordPress 地址和站点地址更改为 HTTPS 版本。

    此处所述,也可以在服务器级别执行此操作。 只要确保在执行此操作时使用永久(301)重定向,而不是临时(302)重定向。

    在下面的参考资料中了解有关 301 和 302 重定向的更多信息:

    丰富网页摘要是在搜索结果的标题、说明和 URL 下面显示的额外信息。

    丰富网页摘要的好处是在搜索结果中增加不动产,有时还可以提高点击率。

    但是,仅当你使用架构标记向他们提供信息时,Google 才会显示特定类型内容的丰富摘要。 如果你以前从未听说过架构标记,那么它是帮助搜索引擎更好地理解和在搜索结果中表示你的内容的附加代码。

    例如,如果你的网站上有一份宫保鸡丁的食谱,你可以添加此标记向 Google 提供有关烹调时间、卡路里等信息:

    <script type="application/ld+json">
    {  
        "@context": "https://schema.org/",  
        "@type": "Recipe",
        "name": "Kung Pao Chicken",  
        "image": [
        "https://yourwebsite.com/kung-pao-chicken.png"
         ],
        "description": "A delicious recipe for King Pao Chicken."
         },  
        "prepTime": "PT0M",
        "cookTime": "PT20M",
        "totalTime": "PT20M",
        "nutrition": {  
             "@type": "NutritionInformation",
             "calories": "383 cal"
         },
         "aggregateRating": {
         "@type": "AggregateRating",
            "ratingValue": "4.8",
            "ratingCount": "25"
         }
    }
    </script>

    这不仅为 Google 提供了更多关于你的页面的信息,而且也使它有资格获得以下丰富的摘要:

    在下面的指南中了解更多有关实现丰富网页摘要模式的信息。

    孤立页面没有来自网站上可爬网页面的内部链接。因此,搜索引擎无法找到或索引它们(除非它们具有来自其他网站的反向链接)。

    通常,使用大多数审核工具很难找到孤立的页面,因为它们像搜索引擎一样对你的网站爬网。但是,如果你使用的是为你生成网站地图的 CMS,则可以在 Ahrefs 的网站诊断中将其用作 URL 的源。只需在爬网设置中选中爬网自动检测到的站点地图和反向链接选项。

    小提示.
    如果网站地图的位置不在 robots.txt 文件中,并且无法在 yourwebsite.com/sitemap.xml 上访问,则应在抓取设置中选中“特定网站地图”选项并粘贴你的站点地图网址。 

    爬网完成后,请转到链接报告并检查“(没有传入内部链接的)孤立页面”问题。

    如果有重要的 URL,则应将其合并到网站结构中。这可能意味着从导航栏或其他相关的可爬网页面添加内部链接。如果它们不重要,则可以删除、重定向或忽略它们。这取决于你。

    推荐阅读:SEO内部链接优化:实战指南

    加载缓慢的页面使访问者感到烦恼。这就是 Google 在 2010 年将台式机网页速度和 2018 年将移动设备网页速度列为排名因素的原因之一。

    不幸的是,页面速度是一个复杂的话题。有很多工具和指标可以用来衡量速度,但 Google 的Pagespeed Insights 是一个合理的起点。它给你在桌面和移动设备上的性能评分为 0 至 100,并告诉你哪些方面需要改进。

    但是,与其专注于单个领域,不如让我们以最小的努力地来讨论一些可能对页面速度产生最显著的积极影响的事情。

    • 切换到速度更快的DNS提供程序。Cloudflare 是一个很好(而且免费)的选择。只需注册一个免费帐户,然后与域名注册商交换你的域名服务器。
    • 安装一个缓存插件。CCaching 临时存储文件,以便可以将文件更快、更有效地交付给访问者。如果你使用的是 WordPress,则 WP Rocket  WP Super Cache 是​​两个不错的选择。
    • 缩小 HTMLCSS 和 JavaScript 文件。缩小可从代码中删除空白和注释,以减小文件大小。你可以用 WP Rocket 或 Autoptimize
    • 使用CDN。内容分发网络(CDN)将你的网页副本存储在全球的服务器上。然后,它将访问者连接到最近的服务器,以使请求的文件传播的距离更短。CDN 提供程序有很多,但是 Cloudflare 是一个不错的选择。
    • 压缩图像。图像通常是网页上最大的文件,可以通过压缩减小它们的大小,并确保它们尽可能少地花费时间加载。图像压缩插件有很多,但我们喜欢 Shortpixel

    在下面的视频和链接资源中了解更多有关提高页面速度的信息。

    https://www.youtube.com/watch?v=BrY6a-lsLp8

    推荐阅读:如何从开始到结束提高页面速度(高级指南)

    Google 的知识图是一个实体及其关系的知识库。其数据通常显示在 SERP 功能中,例如 Ahrefs 的知识面板:

    虽然没有确定的进入知识图的过程,但使用组织标记可以有所帮助。

    你可以使用流行的 WordPress 插件(例如 Yoast 和 RankMath)添加此文件,也可以使用架构标记生成器手动创建和添加它。

    只要确保:

    • 至少使用 name、logo、url 和sameAs 属性
    • 将所有的社会概况作为你的 sameAs 参考(以及可能的 Wikidata 和Wikipedia 页面)
    • 使用 Google 的结构化数据测试工具验证标记。

    以下是我们使用的组织标记:

    <script type="application/ld+json">
    {
        "@context": "http://schema.org",
        "@type": "Organization",
        "name": "Ahrefs",
        "description": "Ahrefs is a software company that develops online SEO tools and free educational materials for marketing professionals.",
        "url": "https://ahrefs.com",
        "logo": "https://cdn.ahrefs.com/images/logo/logo_180x80.jpg",
        "email": "support@ahrefs.com",
        "address": {
                        "@type": "PostalAddress",
                        "addressCountry": "SG",
                        "postalCode": "048581",
                        "streetAddress": "16 Raffles Quay"
        },
        "founder": {
                        "@type": "Person",
                        "name": "Dmitry Gerasimenko",
                        "gender": "Male",
                        "jobTitle": "CEO",
                        "image": "https://cdn.ahrefs.com/images/team/dmitry-g.jpg",
                        "sameAs": [
                            "https://twitter.com/botsbreeder",
                            "https://www.linkedin.com/in/dmitrygerasimenko/"
            ]      
        },
        "foundingDate": "2010-07-15",
        "sameAs" : [
            "https://www.crunchbase.com/organization/ahrefs",
            "https://www.facebook.com/Ahrefs",
            "https://www.linkedin.com/company/ahrefs",
            "https://twitter.com/ahrefs",
            "https://www.youtube.com/channel/UCWquNQV8Y0_defMKnGKrFOQ"
        ],
        "contactPoint" : [
            {
                "@type" : "ContactPoint",
                "contactType" : "customer service",
                "email": "support@ahrefs.com",
                "url": "https://ahrefs.com"
            }
        ]
    }
    </script>
    

    将标记添加到哪个页面并不重要,但是主页、联系人或页面介绍通常是你的最佳选择。 正如 Google 的约翰·穆勒( JohnMueller )在 2019 年的一次网站管理员中心会议上证实,没有必要在每一页都包含它。

    https://youtu.be/cXbWuQQp81A?t=3096

    推荐阅读:谷歌的知识图表解释:它如何影响 SEO

    Nofollow 链接通常用于标记指向你不想认可的页面的出站链接,告诉 Google 不要将排名积分“传递给链接的页面”(但是 Google 可能会选择忽略该建议)。

    因此,不应将它们用于内部链接。但是,根据我们对前 110,000 个网站的研究,有 3.6% 的内部链接设置了 nofollow。

    许多网站所有者这样做是为了阻止页面的索引,但是 nofollow 并不用于此。在内部链接上使用 nofollow 只会造成伤害,因为它可能会阻止爬网行并导致孤立内容。

    这是分页时常见的问题。

    要检查你的网站是否存在未跟踪的内部链接,请在Ahrefs 站长工具中运行爬网,然后转到链接报告并查找相关问题。

    解决这个问题很容易。只需从受影响的链接中删除 nofollow 属性。

    结语

    技术 SEO 是一项复杂的业务,在本文中我们没有足够的时间介绍更多最佳方法。 但是,以上建议应足以将最常见的技术问题消灭在萌芽状态,并轻松将你的网站的性能置于网络其余部分的前 10%。

    有什么问题吗?来 Twitter 联系我。

    译者,Frida Zheng,Not Soup Yet 运营专员