검색 엔진이 작동하는 방식

저자: Joshua Hardwick

전 Ahrefs 콘텐츠 총괄

검색 엔진은 웹 크롤러를 사용해 수십억 개의 페이지를 크롤링하면서 작동합니다. 크롤러는 스파이더나 봇이라고도 하며, 웹을 돌아다니고 링크를 따라가며 새 페이지를 찾아 색인에 추가합니다. 검색 엔진은 물론 ChatGPT 같은 AI 어시스턴트도 그 색인에서 결과를 가져옵니다.

SEO를 한다면 검색 엔진이 어떻게 작동하는지 이해하는 것이 중요합니다. 어떻게 작동하는지 모르면 최적화하기도 어렵기 때문입니다.

가이드에서 다음 사항을 확인해 보세요.


파트 1

검색 엔진 기본

먼저 검색 엔진이 무엇인지, 왜 존재하는지, 어떻게 돈을 버는지 살펴보겠습니다.

검색 엔진이란 무엇인가요?

검색 엔진은 웹 콘텐츠로 이루어진 검색 가능한 데이터베이스입니다. 두 가지 주요 구성 요소는 다음과 같습니다.

1
검색 색인. 웹페이지에 대한 정보를 담은 디지털 라이브러리입니다.
2
검색 알고리즘. 검색 색인에서 결과를 매칭하도록 설계된 컴퓨터 프로그램입니다.

검색 엔진의 목표는 무엇인가요?

모든 검색 엔진은 사용자에게 가장 품질이 좋고 관련성 높은 결과를 제공하는 것을 목표로 합니다. 이는 시장 점유율을 확보하는 방법 중 하나이기도 합니다.

검색 엔진은 어떻게 돈을 버나요?

검색 엔진에는 두 가지 유형의 검색 결과가 있습니다:

1
검색 색인의 자연 검색 결과. 여기는 비용을 내고 들어갈 수 없습니다.
2
광고주의 유료 결과. 여기는 비용을 내고 들어갈 수 있습니다.

누군가 유료 검색 결과를 클릭할 때마다 광고주는 검색 엔진에 비용을 지불합니다. 이를 클릭당 과금(PPC) 광고라고 하며, 이것이 시장 점유율이 중요한 이유입니다. 사용자가 많을수록 광고 클릭이 늘고 수익도 증가합니다.

검색 엔진은 광고로 수익을 올립니다

유료 결과와 자연 검색 결과가 모두 표시된 Google 검색 결과 스크린샷

파트 2

검색 엔진이 색인을 구축하는 방법

각 검색 엔진은 검색 색인을 구축하는 자체적인 과정을 가지고 있습니다. 아래는 Google이 사용하는 과정을 단순화한 버전입니다.1

Google이 검색 색인을 구축하는 방법

Google이 검색 색인을 구축하는 방법을 보여주는 다이어그램: 크롤링, 처리, 색인 생성

하나씩 정리해 보겠습니다.

URL

모든 것은 알려진 URL 목록에서 시작합니다. Google은 다양한 방식으로 이를 발견하지만, 가장 일반적인 세 가지는 다음과 같습니다.

  • 백링크 기반. Google에는 수천억 개의 웹페이지로 이루어진 색인이 있습니다.2 누군가 알려진 페이지에서 새 페이지로 링크하면 Google은 그 링크를 통해 새 페이지를 찾을 수 있습니다.
  • 사이트맵 기반. 사이트맵은 사이트에서 중요하다고 여겨지는 페이지와 파일이 무엇인지 Google에 알려줍니다.3
  • URL 제출을 통해. Google은 사이트 소유자가 구글 서치 콘솔에서 개별 URL의 크롤링을 요청하도록 허용합니다.

크롤링 중

크롤링은 스파이더라는 컴퓨터 봇이 알려진 URL을 방문해 다운로드하는 과정입니다. Google의 크롤러는 Googlebot입니다.4

처리 및 렌더링

처리는 Google이 크롤링된 페이지를 이해하고 핵심 정보를 추출하는 단계입니다. 이를 위해 Google은 페이지를 렌더링해야 하는데, 이는 페이지의 코드를 실행해 사용자에게 어떻게 보이는지 이해하는 과정입니다.

Google 밖에서는 이 과정의 모든 세부 사항을 아는 사람이 없습니다. 하지만 그건 중요하지 않습니다. 우리가 정말로 알아야 할 것은, 이 과정에 링크를 추출하고 색인을 위해 콘텐츠를 저장하는 작업이 포함된다는 점입니다.

색인

인덱싱은 크롤링된 페이지에서 처리된 정보가 검색 인덱스에 추가되는 과정입니다.

검색 색인은 검색 엔진을 사용할 때 검색하는 대상입니다. ChatGPT, Claude, Gemini 같은 AI 어시스턴트도 웹페이지를 찾기 위해 검색 색인을 사용합니다. 그래서 Google과 Bing 같은 주요 검색 엔진에 색인되는 것이 매우 중요합니다. 색인에 없으면 사용자는 여러분을 찾을 수 없습니다.

알고 계셨나요?

Google은 검색 엔진 시장의 91.43%를 차지합니다. 대부분의 사람들이 사용하는 검색 엔진이기 때문에, 다른 검색 엔진보다 더 많은 트래픽을 보내줄 수 있습니다.5


파트 3

검색 엔진이 페이지의 순위를 매기는 방법

콘텐츠를 발견하고 크롤링하여 색인하는 것은 퍼즐의 첫 단계에 불과합니다. 검색 엔진은 사용자가 검색을 수행할 때 일치하는 결과의 순위를 매길 방법도 필요합니다. 이것이 검색 알고리즘의 역할입니다.

검색 알고리즘이란 무엇인가요?

검색 알고리즘은 색인에서 관련 결과를 매칭하고 순위를 매기는 공식입니다. Google은 알고리즘에서 많은 요소를 사용합니다.

주요 Google 순위 결정 요소

Google의 모든 순위 결정 요소는 공개되지 않았기 때문에 아는 사람이 없습니다. 하지만 저희는 몇 가지 핵심 요소를 알고 있습니다. 그중 일부를 살펴보겠습니다.

백링크

백링크는 한 웹사이트의 한 페이지에서 다른 웹사이트로 연결되는 링크입니다. 이는 Google의 가장 강력한 순위 결정 요소 중 하나입니다.6 아마도 이것이 10억 개가 넘는 페이지를 분석한 우리의 연구에서 연결 도메인과 자연 검색 트래픽 사이에 강한 상관관계를 확인한 이유일 것입니다.7

참조 도메인과 검색 트래픽 간의 상관관계

Ahrefs 콘텐츠 익스플로러 인덱스의 10억 개 이상 페이지를 대상으로 한 연구를 기반으로 합니다.

10억 개가 넘는 페이지에서 참조 도메인과 검색 트래픽 간의 상관관계를 보여주는 차트

하지만 수량이 전부는 아닙니다. 품질도 중요합니다. 고품질 백링크가 몇 개 있는 페이지가 저품질 백링크가 많은 페이지보다 더 높은 순위를 차지하는 경우가 많습니다.

Ahrefs에서 웹사이트의 백링크를 무료로 확인할 수 있습니다.

무료 Ahrefs 웹마스터 툴즈 계정에 가입하고 사이트 익스플로러에 도메인을 입력한 다음, 백링크 보고서로 이동하세요.

웹사이트의 백링크 데이터를 보여주는 Ahrefs 사이트 익스플로러 스크린샷

Ahrefs의 크롤러는 웹에서 다섯 번째로 활발하게 활동하므로,8 여기에서 백링크에 대한 꽤 완전한 뷰를 확인할 수 있습니다.

관련성

관련성은 특정 결과가 검색자에게 얼마나 유용한지를 의미합니다. Google은 이를 판단하는 다양한 방법을 가지고 있습니다. 가장 기본적으로는 검색 쿼리와 동일한 키워드가 포함된 페이지를 찾습니다. 또한 다른 사람들이 그 결과를 유용하다고 느꼈는지 확인하기 위해 상호작용 데이터도 살펴봅니다.9

신선도

신선도는 쿼리에 따라 달라지는 순위 결정 요소입니다. 최신 결과가 필요한 검색에서는 영향이 더 큽니다.9 그래서 ”new netflix series”에서는 최근에 게시된 결과가 1위로 보이지만, ”how to solve a rubik’s cube.”에서는 그렇지 않습니다.

신선도는 쿼리에 의존하는 순위 결정 요소입니다

Google 검색 결과에서 신선도가 쿼리에 따라 달라지는 순위 결정 요소임을 보여주는 예시

페이지 속도

페이지 속도는 데스크톱과 모바일에서 순위 결정 요소입니다.10 11 하지만 이는 부정적인 순위 요소에 가깝습니다. 아주 빠른 페이지에 유리하다기보다는 가장 느린 페이지에 불리하게 작용하기 때문입니다.

Ahrefs에서 무료로 페이지 속도를 확인할 수 있습니다.

무료 Ahrefs 웹마스터 툴즈 계정에 가입하고, Ahrefs의 사이트 감사로 웹사이트를 크롤링한 다음, 성능 보고서로 이동하세요. 일반적으로 빨간색이 적게 보일수록 더 좋습니다.

페이지 속도 및 성능 데이터를 보여주는 Ahrefs 사이트 감사 스크린샷

모바일 친화성

모바일 친화성은 2019년에 Google이 모바일 우선 인덱스로 전환한 이후 모바일과 데스크톱 모두에서 순위 결정 요소였습니다.12


파트 4

검색 엔진이 결과를 개인화하는 방법

Google은 각 사용자에 맞게 검색 결과를 조정합니다. 이를 위해 위치, 언어, 검색 기록과 같은 정보를 사용합니다.9 이러한 사항을 더 자세히 살펴보겠습니다.

위치

구글은 위치를 사용해 로컬 의도가 있는 검색 결과를 개인화합니다. 그래서 "이탈리아 음식점"으로 검색할 때 모든 결과가 지역 음식점에서 나오거나 지역 음식점에 대한 내용인 것입니다. 구글은 점심을 먹으러 지구 반대편까지 비행할 가능성이 낮다는 것을 알고 있습니다.

언어

Google은 스페인어 사용자에게 영어 결과를 보여줘 봐야 의미가 없다는 것을 압니다. 그래서 서로 다른 언어를 사용하는 사용자에게는 (가능한 경우) 현지화된 콘텐츠 버전을 순위에 반영해 보여줍니다.

Google은 언어에 따라 서로 다른 버전의 결과를 순위에 반영합니다

Google이 언어에 따라 서로 다른 버전의 결과를 순위에 반영하는 예시

검색 기록

Google은 더 개인화된 검색 경험을 제공하기 위해 여러분이 하는 일과 방문하는 장소를 저장합니다.13 이를 거부할 수는 있지만, 아마 대부분은 거부하지 않을 것입니다.

핵심 요점

  • 검색 엔진은 크게 색인과 알고리즘이라는 두 가지 요소로 구성됩니다.
  • 인덱스를 구축하기 위해 알려진 페이지를 크롤링하고 링크를 따라가며 새로운 페이지를 찾습니다.
  • 검색 알고리즘의 목표는 가장 품질이 좋고 가장 관련성 높은 결과를 반환하는 것입니다.
  • 검색 결과의 품질은 시장 점유율을 구축하는 데 중요합니다.
  • Google의 자연 검색 결과 순위 결정 요소를 모두 아는 사람은 없습니다.
  • 주요 순위 결정 요소에는 백링크, 관련성, 신선도가 포함됩니다.
  • Google은 위치, 언어, 검색 기록을 기반으로 결과를 개인화합니다.

참조

  1. “JavaScript SEO 기본 이해하기”. Google. 2022년 8월 16일에 확인함.
  2. “정보 정리 — Google 검색 작동 방식”. Google. 2022년 8월 16일에 검색함.
  3. “사이트맵 알아보기”. Google. 2022년 8월 16일에 확인함.
  4. “Googlebot”. Google. 2022년 8월 16일에 확인함.
  5. “전 세계 검색 엔진 시장 점유율”. Statcounter. 2022년 8월 16일에 확인함.
  6. “Google Q&A+ #March”. YouTube. 2022년 8월 16일에 확인함.
  7. “CloudFlare Radar”. CloudFlare. 2022년 8월 16일에 확인함.
  8. “웹 검색 순위에서 사이트 속도 사용하기”. Google. 2022년 8월 16일에 확인함.
  9. “모바일 우선 인덱스 모범 사례”. Google. 2022년 8월 16일에 확인함.
  10. “웹 및 앱 활동 찾기 및 제어하기”. Google. 2022년 8월 16일에 확인함.
가이드:Joshua Hardwick

전 Ahrefs 콘텐츠 총괄(쉽게 말해 발행하는 모든 블로그 글의 뛰어난 품질을 책임지는 사람).

단계별로 SEO 마스터하기

/01

검색 엔진이 작동하는 방식

SEO를 배우기 전에 검색 엔진이 어떻게 작동하는지 이해해야 합니다.

/02

SEO 기본

SEO 성공을 위한 웹사이트 설정법을 배우고, SEO의 네 가지 핵심 요소를 파악해 보세요.

/03

키워드 조사

SEO의 시작점은 타겟 고객이 무엇을 검색하고 있는지를 이해하는 것입니다.

/04

SEO 콘텐츠

검색 엔진에서 순위에 오르는 콘텐츠를 만드는 방법을 알아보세요.

/05

온페이지 SEO

여기에서 검색 엔진이 페이지를 이해하도록 도와주기 위해 페이지를 최적화할 수 있습니다.

/06

링크 빌딩

링크는 검색 엔진이 새 페이지를 찾고 그 "권위"를 판단하는 방법입니다. 링크 없이는 경쟁이 치열한 키워드에서 높은 순위를 얻기 어렵습니다.

/07

기술적 SEO

구글이 당신의 웹사이트에 접근하고 이해하는 것을 방해하는 기술적 실수가 없도록 확인하는 것이 중요합니다.

/08

SEO에게 AI란?

오늘날 SEO에 대해 이야기하면서 생성형 AI를 언급하지 않을 수는 없습니다.