
저자: Ryan Law
Ahrefs 콘텐츠 마케팅 디렉터
ChatGPT에 운동할 때 쓰기 좋은 최고의 오버이어 헤드폰을 추천해 달라고 하면, 실제로 어떤 일이 벌어질까요?
AI 검색 엔진은 어떻게 답변을 생성하고 제품 추천을 고를까요? Google 같은 기존 검색 엔진과는 무엇이 다르고(또 어디에서 겹칠까요)?
그리고 가장 중요한 건, 여러분의 웹사이트, 브랜드, 제품이 어떻게 하면 노출되게 할 수 있을까요?
이 장을 검토하고 기여해 준 Gianluca Fiorelli와 Mark Williams-Cook에게 감사드립니다.
AI 검색 엔진은 대규모 언어 모델(LLM)을 사용해 정보를 찾고 응답을 생성하는 질의응답 시스템입니다.
전통적인 검색 엔진과 AI 검색 엔진 사이에는 몇 가지 핵심 차이가 있습니다(다만 전통적인 검색 엔진이 더 많은 AI 기능을 통합하면서 이러한 차이는 점점 줄어들고 있습니다):
다음은 ChatGPT, Claude 또는 AI 모드에서 볼 수 있는 것과 비슷한, 전형적인 AI 검색 인터페이스의 모습입니다:

이런 답변에 노출되도록 하려면, 먼저 AI 검색 엔진이 작동하게 만드는 핵심 프로세스를 이해해야 합니다.
LLM은 방대한 양의 콘텐츠로 학습됩니다. 사실상 Wikipedia 전체, Common Crawl Dataset 전체, Google Books 전체, 그리고 웹상의 수백만, 수천만 페이지에 달하는 콘텐츠를 “읽은” 셈입니다.
이 학습 데이터는 LLM이 세상을 “이해”하는 데 도움을 줍니다. 예를 들어 당신의 헤드폰 회사가 학습 데이터에 관련 맥락에서 여러 번 등장하고, 긍정적인 표현(“가성비 최고”, “헬스장용으로 좋음” 등)과 함께 언급된다면, 헤드폰 관련 프롬프트에 대한 LLM의 응답에서 당신의 회사가 언급될 가능성이 높습니다.
알고 계셨나요?
이 학습 과정은 여기서 설명한 것보다 더 복잡합니다. HTML을 제거하고, 개인 식별 정보를 삭제하며, 차단 목록 단어를 제외하고, 데이터를 특정 언어로 필터링하는 사전 학습 단계가 있습니다. 또한 언어 모델이 유용한 채팅 어시스턴트처럼 행동하도록(단순한 다음-토큰 예측기가 아니라) 학습시키는 사후 학습 단계도 있습니다. 더 알아보려면 Andrej Karpathy의 영상 Deep Dive into LLMs like ChatGPT를 시청하세요.

바로 여기서 엔터티 기반 SEO가 결정적으로 중요해집니다. 브랜드가 지식 그래프에 일관되게 등장하고, 스키마 마크업으로 올바르게 구조화되어 있으며, 웹 전반의 고품질 콘텐츠에서 관련 엔터티와 함께 자주 등장한다면 학습 데이터에서 더 강력한 '엔터티 신호'를 구축하게 됩니다.

Gianluca Fiorelli, 전략 및 국제 SEO/AI 검색 컨설턴트
결정적으로 LLM에는 여러 가지 특이한 점이 있습니다:
흔한 오해 중 하나는 LLM이 소프트웨어 패치처럼 ‘지식 업데이트’를 받는다는 것입니다. 하지만 실제로 각 모델은 고정된 데이터셋으로 단 한 번 학습됩니다. 더 최신의 지식 커트오프를 가진 새 모델 출시를 보게 되더라도, 그것은 기존 모델의 업데이트가 아니라 처음부터 새로 학습된 완전히 새로운 모델입니다.

Gianluca Fiorelli, 전략 및 국제 SEO/AI 검색 컨설턴트
환각을 일으키고 오래된 정보를 공유하는 검색 엔진은 그다지 유용해 보이지 않습니다. 그래서 LLM은 그라운딩이라는 과정으로 이런 한계의 일부를 극복합니다.
LLM은 두 가지 방식으로 답변을 검증하고 개선할 수 있습니다. 하나는 계산기나 기타 데이터 API 같은 도구를 활용하는 것이고, 다른 하나는 외부 소스에서 추가 정보를 가져오는 것입니다. 이 두 번째 과정은 기술적으로 검색 증강 생성(RAG)이라고 합니다.
사용자가 질문을 입력하면 LLM은 스스로에게 이렇게 묻습니다. “이미 답을 알고 있나, 아니면 추가 정보를 가져와야 하나?” LLM이 다음 토큰을 높은 확신으로 예측할 수 있다면(예: “적혈구는 무슨 일을 하나요?”처럼 크게 변하지 않는 질문) 기본 지식으로 답할 가능성이 큽니다. 확신이 낮다면(예: “가성비 좋은 커피 그라인더 추천은?”처럼 변동 가능성이 큰 질문) 검색 도구를 사용해 인터넷의 다른 출처에서 관련 정보를 찾아올 수 있습니다.
LLM은 다음과 같이 추가 정보가 도움이 될 수 있는 쿼리 유형을 인식하도록 파인튜닝되어 있습니다:
일부 LLM 모델은 추가 검색을 트리거할 가능성도 매우 높습니다(예: "딥 리서치" 모델은 여러 번의 RAG 검색을 트리거하도록 특별히 구성되어 있습니다).

RAG를 통해 그라운드 트루스를 찾는 이 과정(흔히 “그라운딩”이라고도 함)에는 여러 이점이 있습니다. LLM은 제3자 출처와 대조해 응답을 확인함으로써 사실 정확도를 높이고 환각을 줄일 수 있습니다. 학습 데이터가 비교적 오래되었더라도 최신 정보를 가져와 공유할 수 있습니다. 또한 더 자세하고 포괄적인 답변을 제공하고, 공유하는 모든 내용에 대해 더 나은 투명성과 출처 표기를 제공할 수 있습니다.
AI 검색 엔진은 쿼리 팬아웃(query fan-out)이라는 프로세스를 통해 이런 그라운딩을 수행합니다.
결정적으로, 쿼리 팬아웃은 전통적인 SEO가 AI 가시성에 왜 핵심인지 설명해 줍니다.
ChatGPT, Gemini, Perplexity 같은 AI 어시스턴트는 Google, Bing, Brave와 같은 검색 인덱스를 사용해 최신 정보를 가져옵니다.
검색 제공업체가 중요한 이유는 업체마다 순위 알고리즘, 색인, 커버리지가 다르기 때문입니다. Google 검색에서 브랜드 가시성을 높이면 ChatGPT보다 AI 모드에서의 가시성에 더 도움이 될 수 있는데, ChatGPT는 Bing에 더 크게 의존하기 때문입니다.
| AI 검색 엔진 | 그라운딩에 사용되는 검색 인덱스 |
|---|---|
웹 검색이 트리거되면 LLM은 검색 인덱스에 관련 결과를 요청합니다. 검색 인덱스는 결과 목록을 반환하고, LLM은 페이지 제목, 반환된 페이지 스니펫의 내용, 최신성(얼마나 최근에 게시되었는지) 같은 정보를 평가해 크롤링할 가장 관련성 높은 페이지를 선택합니다.
AI 검색에서 SEO가 중요한 이유
다시 강조할 만합니다. Google과 Bing 같은 전통적 검색 엔진은 AI 검색 엔진이 답변에서 어떤 콘텐츠를 언급하고 인용할지 결정하는 데 핵심적인 역할을 합니다.
다르게 말하면, 전통적 검색에서 높은 순위를 차지할수록 AI 검색에서의 가시성도 높아집니다.
그렇다면 LLM은 정확히 무엇을 검색할까요?
LLM은 쿼리 팬아웃이라는 과정을 사용합니다. ChatGPT 및 기타 AI 검색 엔진에 입력되는 많은 프롬프트는 매우 길고 대화체이며, 종종 완전히 고유합니다. 이런 프롬프트를 그대로 구글링해도 항상 유용한 콘텐츠가 나오지는 않습니다.
따라서 사용자의 정확한 검색어로 웹 검색을 실행하는 대신…
"전자상거래 브랜드를 대상으로 분석 제품을 판매하는 중견 B2B SaaS 회사를 위해 6개월 콘텐츠 전략을 계획하고 있습니다. 이 회사는…"

…LLM은 그 최초 프롬프트를 사용해 관련 정보를 가져오는 데 도움이 되도록 더 짧고 관련된 쿼리들을 연속으로 생성합니다.
이런 팬아웃 쿼리도 대규모 언어 모델이 생성하기 때문에 비결정적입니다. 즉, 같은 검색이라도 정기적으로 바뀔 수 있습니다.

Mark Williams-Cook, 설립자, AlsoAsked
이 과정은 SEO 담당자에게 익숙하게 느껴질 것입니다. 이러한 관련 쿼리는 롱테일 키워드, 하위 인텐트, ‘People Also Ask’ 질문과 매우 유사합니다:
실제로 ChatGPT, Gemini, Copilot이 인용한 링크 중 12%만 원래 사용자의 프롬프트에 대해 Google 상위 10개 결과에 등장합니다. 하지만 그렇다고 전통적인 순위가 중요하지 않다는 뜻은 아닙니다. AI 검색 엔진은 여러 개의 검색 쿼리를 생성해 콘텐츠를 가져오는데, 그 팬아웃 쿼리는 기존의 SEO 작업이 매우 중요해지는, 보다 전통적이고 키워드 중심의 검색인 경우가 많습니다.

쿼리 팬아웃은 해방감을 줍니다. 사람들이 어떤 대화형 프롬프트를 쓸지 추측할 필요가 없기 때문입니다. 대신 LLM이 자연스럽게 생성하는 분해된 쿼리, 즉 의미적 구성 요소에 맞춰 최적화하세요. 이는 전통적인 키워드 리서치와 매우 비슷합니다. [주제] + [수식어], 비교형 쿼리, 정의형 쿼리, ‘모범 사례’ 콘텐츠 등이죠. 기존 SEO 리서치만으로도 팬아웃 영역은 이미 상당 부분 커버하고 있을 가능성이 큽니다.

Gianluca Fiorelli, 전략 및 국제 SEO/AI 검색 컨설턴트
LLM이 검색 인덱스에서 관련 페이지를 가져오면 전체를 다 읽지는 않습니다. 대신 페이지를 작은 텍스트
이러한 청크는 보통 각각 수백~수천 단어로, 대부분의 웹페이지에서 아주 일부에 불과합니다. 또한 LLM은 엄격한 컨텍스트 윈도우 제한 하에서 작동합니다. 즉, 사용자 프롬프트, 가져온 모든 청크, 그리고 모델 자체의 응답을 포함해 처리할 수 있는 텍스트 양이 제한됩니다. 따라서 어떤 콘텐츠를 가져오고 포함할지 매우 선별적으로 결정해야 합니다.
예시는 다음과 같습니다:
| 전체 페이지 콘텐츠 | "그라운딩은 모델이 외부 출처를 가져오고, 관련 사실을 추출한 다음, 그 추출물을 활용해 환각을 줄이고 최신성을 높이는 워크플로입니다.… 그다음 여러 출처를 스캔하고 정보를 비교한 뒤, 텍스트를 그대로 복사하는 대신 답변을 종합합니다. 이 종합 단계는 특정 단일 출처에 과도하게 의존하는 것을 피하는 데 도움이 됩니다." |
| 스니펫 | “어시스턴트가 웹 검색을 사용해 외부 출처를 가져오고, 검색된 사실에 응답을 그라운딩함으로써 환각을 줄이는 방법을 설명한다.” |
| 확장 (1~2행) | "그라운딩은 모델이 외부 출처를 가져오고, 관련 사실을 추출한 다음, 그 추출물을 활용해 환각을 줄이고 최신성을 높이는 워크플로입니다. 모델은 웹 검색을 시작하기 전에 쿼리가 최신 정보 또는 검증 가능한 정보를 필요로 하는지 평가합니다." |
| 확장 (33~34행) | "그다음 여러 출처를 스캔하고 정보를 비교한 뒤, 텍스트를 그대로 복사하는 대신 답변을 종합합니다. 이 종합 단계는 특정 단일 출처에 과도하게 의존하는 것을 피하는 데 도움이 됩니다." |
LLM이 콘텐츠를 쉽게 이해할 수 있게 하세요
이 점이 중요합니다. AI 검색 엔진이 인터넷에서 콘텐츠를 가져올 때 전체 페이지가 아니라 일부 발췌문만 볼 수 있습니다. LLM의 답변에 인용될 가능성을 극대화하려면, 페이지 전체에 접근하지 못하더라도 LLM이 페이지의 관련성과 가치를 쉽게 이해할 수 있어야 합니다.
그다음 AI 검색 엔진은 이 텍스트를 응답 생성 과정에 통합합니다.
원본 웹 콘텐츠는 모델의 답변에 그라운딩됩니다. 즉, 이전 단계에서 추출한 텍스트 또는 데이터 스니펫을 모델의 컨텍스트에 추가하여, 사실상 “웹에서 가져온 유용할 수 있는 컨텍스트가 여기 있으니, 이제 이 정보를 사용해 사용자의 질문에 답해라.”라고 지시하는 것입니다.
그 다음 모델은 타고난 지식과 검색된 콘텐츠를 결합해 답변을 생성하고 사용자에게 공유합니다. 이 응답에는 보통 출처가 포함됩니다. 그라운딩 과정에서 사용된 소스로 연결되는, 클릭할 수 있는 URL입니다.
AI 검색 엔진이 가져온 모든 페이지가 최종 답변에서 출처로 인용되는 것은 아닙니다. 모델은 다음과 같은 여러 요인을 바탕으로 어떤 출처를 인용할지 선택합니다:
즉, 콘텐츠가 검색되어 읽히더라도 눈에 보이는 인용을 받는다는 보장은 없습니다. 해당 콘텐츠가 답변의 특정 주장과 직접적으로 관련 있다고 판단되어야 합니다.
이것이 AI 검색 엔진이 작동하는 핵심이지만, 여기에는 한 단계 더 복잡한 요소가 있습니다. 바로 개인화입니다.
ChatGPT를 비롯한 AI 검색 엔진은 사용자별로 결과를 개인화할 수 있어, 같은 프롬프트라도 사람에 따라 다른 결과가 생성될 수 있습니다. 개인화는 다음을 포함한 여러 방식의 영향을 받을 수 있습니다:
시스템 프롬프트를 이해하기 위한 비유를 들어보겠습니다. 축구를 한다고 가정하면, ‘학습 데이터’는 수년간 해온 모든 연습, 즉 장기적인 근육 기억입니다. 시스템 프롬프트는 경기장에 들어가기 직전에 코치가 해주는 말입니다. 출력에 영향을 미칠 가능성이 더 큰, 강력한 단기 기억이라고 할 수 있습니다.

Mark Williams-Cook, 설립자, AlsoAsked

따라서 특정 프롬프트의 단일 응답에 집착하기보다는, 시간의 흐름에 따라 그리고 여러 프롬프트에 걸쳐 브랜드와 웹사이트의 평균 가시성을 추적하는 것이 좋습니다.
ChatGPT부터 Perplexity, Google AI Mode까지 모든 AI 검색 엔진은 조금씩 다르지만, 핵심 프로세스는 동일합니다. 특히 SEO 담당자와 마케터에게 중요한 점은 Google과 Bing 같은 전통적 검색 엔진이 AI 검색 엔진이 작동하는 데 필요한 인프라의 상당 부분을 제공한다는 것입니다. AI 검색 최적화는 전통적인 SEO 모범 사례에 크게 의존합니다.

라이언 로는 Ahrefs의 콘텐츠 마케팅 디렉터입니다. 라이언은 작가, 콘텐츠 전략가, 팀 리더, 마케팅 디렉터, 부사장, CMO, 에이전시 창립자 등 다양한 역할로 13년의 경력을 쌓았습니다. 또한 Google, Zapier, GoDaddy, Clearbit, Algolia를 포함한 수많은 기업이 콘텐츠 마케팅과 SEO를 개선하도록 도왔습니다. 그는 소설가이기도 하며, 콘텐츠 마케팅 강의 2개의 제작자이기도 합니다.
SEO를 배우기 전에 검색 엔진이 어떻게 작동하는지 이해해야 합니다.
SEO 성공을 위한 웹사이트 설정법을 배우고, SEO의 네 가지 핵심 요소를 파악해 보세요.
SEO의 시작점은 타겟 고객이 무엇을 검색하고 있는지를 이해하는 것입니다.
검색 엔진에서 순위에 오르는 콘텐츠를 만드는 방법을 알아보세요.
여기에서 검색 엔진이 페이지를 이해하도록 도와주기 위해 페이지를 최적화할 수 있습니다.
링크는 검색 엔진이 새 페이지를 찾고 그 "권위"를 판단하는 방법입니다. 링크 없이는 경쟁이 치열한 키워드에서 높은 순위를 얻기 어렵습니다.
구글이 당신의 웹사이트에 접근하고 이해하는 것을 방해하는 기술적 실수가 없도록 확인하는 것이 중요합니다.
지역 검색 결과에서 가시성을 높이고 지역 고객을 더 많이 확보하는 방법을 알아보세요.
오늘날 SEO에 대해 이야기하면서 생성형 AI를 언급하지 않을 수는 없습니다.
ChatGPT 같은 AI 검색 엔진이 답변을 정확히 어떻게 생성하고, 어떤 브랜드와 제품을 언급할지 어떻게 선택하는지 알아보세요.