사용자는 일회성 쿼리를 입력하는 대신 후속 질문을 하고 대화를 이어갈 수 있습니다.
AI 검색 엔진은 링크 목록을 순위별로 반환하는 대신 직접적인 답변과 추천을 제공합니다(그리고 이러한 답변은 수시로 바뀔 수 있습니다).
검색 사용자가 웹사이트를 방문하도록 유도하는 대신, 사용자는 채팅 인터페이스에서 질문에 대한 답을 바로 받게 됩니다(그 결과 웹사이트로 돌아오는 클릭 수가 줄어듭니다).

다음은 ChatGPT, Claude 또는 AI 모드에서 볼 수 있는 것과 비슷한, 전형적인 AI 검색 인터페이스의 모습입니다.

프롬프트, 그라운딩 메시지, 응답, 언급, 인용을 보여주는 AI 검색 인터페이스 다이어그램

대화형 프롬프트: 사용자의 질문.
그라운딩 메시지: LLM이 답변에 활용할 추가 정보를 찾기로 결정했음을 보여주는 메시지입니다.
응답: 사용자의 프롬프트에 대해 AI가 생성한 답변.
언급: 응답 텍스트 안에서 자연스럽게 언급된 엔터티(예: 브랜드 또는 제품).
인용: 답변 생성에 사용된 소스 URL로, 보통 문서 끝에 나열됩니다.

이런 답변에 노출되도록 하려면, 먼저 AI 검색 엔진이 작동하게 만드는 핵심 프로세스를 이해해야 합니다.

파트 2

학습 작동 방식

LLM은 방대한 양의 콘텐츠로 학습됩니다. 사실상 Wikipedia 전체, Common Crawl Dataset 전체, 구글 북스 전체, 그리고 웹상의 수백만, 수천만 페이지에 달하는 콘텐츠를 “읽은” 셈입니다.

이 학습 데이터는 LLM이 세상을 “이해”하는 데 도움을 줍니다. 예를 들어 여러분의 헤드폰 회사가 학습 데이터에 관련 맥락에서 여러 번 등장하고, 긍정적인 표현(“가성비 최고”, “헬스장용으로 좋음” 등)과 함께 언급된다면, 헤드폰 관련 프롬프트에 대한 LLM의 응답에서 여러분의 회사가 언급될 가능성이 높습니다.

알고 계셨나요?

이 학습 과정은 여기서 설명한 것보다 더 복잡합니다. HTML을 제거하고, 개인 식별 정보를 삭제하며, 차단 목록 단어를 제외하고, 데이터를 특정 언어로 필터링하는 사전 학습 단계가 있습니다. 또한 언어 모델이 단순한 토큰 예측기가 아니라 유용한 채팅 어시스턴트처럼 행동하도록 학습시키는 사후 학습 단계도 있습니다. 더 알아보려면 Andrej Karpathy의 영상 Deep Dive into LLMs like ChatGPT를 시청하세요.

대규모 웹 콘텐츠로 대규모 언어 모델이 학습되는 방식을 보여주는 다이어그램

바로 여기서 엔터티 기반 SEO가 결정적으로 중요해집니다. 브랜드가 지식 그래프에 일관되게 등장하고, 스키마 마크업으로 올바르게 구조화되어 있으며, 웹 전반의 고품질 콘텐츠에서 관련 엔터티와 함께 자주 등장한다면 학습 데이터에서 더 강력한 '엔터티 신호'를 구축하게 됩니다.

Gianluca Fiorelli, 전략 및 국제 SEO/AI 검색 컨설턴트

결정적으로 LLM에는 여러 가지 특이한 점이 있습니다:

확률적: 같은 프롬프트를 사용해도 매번 다른 응답이 나올 수 있습니다. 이런 확률적 특성 때문에 키워드를 최적화하듯이 "프롬프트를 최적화"할 수는 없습니다. 대신 분포 관점에서 생각하세요. 유사한 프롬프트 100개에서 내 브랜드가 등장할 확률은 얼마나 될까요? 그래서 몇 개의 프롬프트에 집착하기보다, 많은 프롬프트에 걸친 평균 가시성을 추적하는 편이 더 낫습니다.
지식에 컷오프가 있습니다: 기본적으로 LLM의 지식은 해당 모델을 학습할 때 사용된 데이터셋에 포함된 내용으로 제한됩니다. 각 모델은 특정 날짜까지의 데이터 스냅샷으로 한 번 학습됩니다. 더 최근의 지식 컷오프를 가진 새 모델이 주기적으로 출시됩니다(과거 기준으로 대략 6개월마다).
환각 발생: 사실이 아닌 내용을 확신에 차서 말할 수 있습니다. LLM은 사실을 검증하는 방식이 아니라, 다음에 어떤 단어가 올 가능성이 큰지 예측하는 방식으로 텍스트를 생성합니다. 도움을 주고 정확하도록 학습되긴 했지만, 내장된 팩트체크 메커니즘이 없기 때문에 웹 검색을 통한 그라운딩이 매우 중요합니다.

흔한 오해 중 하나는 LLM이 소프트웨어 패치처럼 ‘지식 업데이트’를 받는다는 것입니다. 하지만 실제로 각 모델은 고정된 데이터셋으로 단 한 번 학습됩니다. 더 신선한 지식 컷오프를 가진 새 모델이 출시되더라도, 그것은 기존 모델의 업데이트가 아니라 처음부터 새로 학습된 완전히 새로운 모델입니다.

Gianluca Fiorelli, 전략 및 국제 SEO/AI 검색 컨설턴트

환각을 일으키고 오래된 정보를 공유하는 검색 엔진은 그다지 유용해 보이지 않습니다. 그래서 LLM은 그라운딩이라는 과정으로 이런 한계의 일부를 극복합니다.

파트 3

그라운딩과 RAG가 작동하는 방식

LLM은 두 가지 방식으로 답변을 검증하고 개선할 수 있습니다. 하나는 계산기나 기타 데이터 API 같은 도구를 활용하는 것이고, 다른 하나는 외부 소스에서 추가 정보를 가져오는 것입니다. 이 두 번째 과정은 기술적으로 검색 증강 생성(RAG)이라고 합니다.

사용자가 질문을 입력하면 LLM은 스스로에게 이렇게 묻습니다. “이미 답을 알고 있나, 아니면 추가 정보를 가져와야 하나?” LLM이 다음 토큰을 높은 확신으로 예측할 수 있다면(예: “적혈구는 무슨 일을 하나요?”처럼 크게 변하지 않는 질문) 기본 지식으로 답할 가능성이 큽니다. 확신이 낮다면(예: “가성비 좋은 커피 그라인더는 뭐지?”처럼 변동 가능성이 큰 질문) 검색 도구를 사용해 인터넷의 다른 출처에서 관련 정보를 찾아올 수 있습니다.

LLM은 다음과 같이 추가 정보가 도움이 될 수 있는 쿼리 유형을 인식하도록 파인튜닝되어 있습니다.

모델의 학습 범위 밖 주제: “Ahrefs 키워드 익스플로러가 사용하는 내부 순위 요소는 무엇인가요?”
신선하거나 시간에 민감한 정보가 필요한 주제: “구글의 가장 최근 주요 업데이트는 무엇이며, 언제 배포되었나요?”
웹 검색을 명시적으로 요청하는 주제: “2026년에 인기 있는 링크 빌딩 전술을 인터넷에서 검색해 줘.”
출처와 근거를 요청하는 프롬프트: “구글이 알고리즘에서 사용자 참여 신호를 사용한다는 것을 확인할 수 있는 출처를 제공하세요.”

일부 LLM 모델은 추가 검색을 트리거할 가능성도 매우 높습니다(예: "딥 리서치" 모델은 여러 번의 RAG 검색을 트리거하도록 특별히 구성되어 있습니다).

그라운딩과 검색 증강 생성(RAG)이 작동하는 방식을 보여주는 다이어그램

RAG를 통해 그라운드 트루스를 찾는 이 과정(흔히 “그라운딩”이라고도 함)에는 여러 이점이 있습니다. LLM은 제3자 출처와 대조해 응답을 확인함으로써 사실 정확도를 높이고 환각을 줄일 수 있습니다. 학습 데이터가 비교적 오래되었더라도 최신 정보를 가져와 공유할 수 있습니다. 또한 더 자세하고 포괄적인 답변을 제공하고, 공유하는 모든 내용에 대해 더 나은 투명성과 출처 표기를 제공할 수 있습니다.

AI 검색 엔진은 쿼리 팬아웃(query fan-out)이라는 프로세스를 통해 이런 그라운딩을 수행합니다.

파트 4

쿼리 팬아웃이 작동하는 방식

결정적으로, 쿼리 팬아웃은 전통적인 SEO가 AI 가시성에 왜 핵심인지 설명해 줍니다.

ChatGPT, Gemini, Perplexity 같은 AI 어시스턴트는 구글, Bing, Brave와 같은 검색 인덱스를 사용해 최신 정보를 가져옵니다.

검색 제공업체가 중요한 이유는 업체마다 순위 알고리즘, 색인, 커버리지가 다르기 때문입니다. 구글 검색에서 브랜드 가시성을 높이면 ChatGPT보다 AI 모드에서의 가시성에 더 도움이 될 수 있는데, ChatGPT는 Bing에 더 크게 의존하기 때문입니다.

AI 검색 엔진	그라운딩에 사용되는 검색 인덱스
ChatGPT	Bing, Google
Claude	Brave
Gemini	Google
Copilot	Bing
Perplexity	In-house
AI Mode	Google
AI Overviews	Google

웹 검색이 트리거되면 LLM은 검색 인덱스에 관련 결과를 요청합니다. 검색 인덱스는 결과 목록을 반환하고, LLM은 페이지 제목, 반환된 페이지 스니펫의 내용, 신선도(얼마나 최근에 게시되었는지) 같은 정보를 평가해 크롤링할 가장 관련성 높은 페이지를 선택합니다.

AI 검색에서 SEO가 중요한 이유

다시 강조하지만 구글과 Bing 같은 전통적 검색 엔진은 AI 검색 엔진이 답변에서 어떤 콘텐츠를 언급하고 인용할지 결정하는 데 핵심적인 역할을 합니다.

다르게 말하면, 전통적 검색에서 높은 순위를 차지할수록 AI 검색에서의 가시성도 높아집니다.

그렇다면 LLM은 정확히 무엇을 검색할까요?

LLM은 쿼리 팬아웃이라는 과정을 사용합니다. ChatGPT 및 기타 AI 검색 엔진에 입력되는 많은 프롬프트는 매우 길고 대화체이며, 종종 완전히 고유합니다. 이런 프롬프트를 그대로 구글링해도 항상 유용한 콘텐츠가 나오지는 않습니다.

사용자의 정확한 검색어로 웹 검색을 실행하는 대신…

"전자상거래 브랜드를 대상으로 분석 제품을 판매하는 중견 B2B SaaS 회사를 위해 6개월 콘텐츠 전략을 계획하고 있습니다. 이 회사는…"

…LLM은 그 최초 프롬프트를 사용해 관련 정보를 가져오는 데 도움이 되도록 더 짧고 관련된 쿼리들을 연속으로 생성합니다.

이런 팬아웃 쿼리도 대규모 언어 모델이 생성하기 때문에 비결정적입니다. 즉, 같은 검색이라도 정기적으로 바뀔 수 있습니다.

Mark Williams-Cook, 설립자, AlsoAsked

이 과정은 SEO 담당자에게 익숙하게 느껴질 것입니다. 이러한 관련 쿼리는 롱테일 키워드, 하위 인텐트, 연관성 있는 질문과 매우 유사합니다.

일반적인 B2B SaaS 콘텐츠 전략 프레임워크
SaaS를 위한 TOFU 및 BOFU 콘텐츠 예시
콘텐츠 새로고침과 내부 링크 모범 사례
콘텐츠 중심 데모 성장 지표

실제로 ChatGPT, Gemini, Copilot이 인용한 링크 중 12%만 원래 사용자의 프롬프트에 대해 구글 상위 10개 결과에 등장합니다. 그렇다고 전통적인 순위가 중요하지 않다는 뜻은 아닙니다. AI 검색 엔진은 여러 개의 검색 쿼리를 생성해 콘텐츠를 가져오는데, 그 팬아웃 쿼리는 기존의 SEO 작업이 매우 중요해지는, 보다 전통적이고 키워드 중심의 검색인 경우가 많습니다.

AI 검색 엔진이 하나의 사용자 프롬프트를 여러 관련 쿼리로 팬아웃하는 방식을 보여주는 다이어그램

쿼리 팬아웃은 해방감을 줍니다. 사람들이 어떤 대화형 프롬프트를 쓸지 추측할 필요가 없기 때문입니다. 대신 LLM이 자연스럽게 생성하는 분해된 쿼리, 즉 의미적 구성 요소에 맞춰 최적화하세요. 이는 [주제] + [수식어], 비교형 쿼리, 정의형 쿼리, ‘모범 사례’ 콘텐츠로 구성되는 전통적인 키워드 리서치와 매우 비슷합니다. 기존 SEO 리서치만으로도 팬아웃 영역은 이미 상당 부분 커버하고 있을 가능성이 큽니다.

Gianluca Fiorelli, 전략 및 국제 SEO/AI 검색 컨설턴트

파트 5

검색, 청킹, 답변 합성이 작동하는 방식

LLM이 검색 인덱스에서 관련 페이지를 가져오면 전체를 다 읽지는 않습니다. 대신 페이지를 작은 텍스트 '덩어리'로 나누고 모델이 쿼리에 가장 연관성 있다고 여겨지는 텍스트 부분을 우선시(때로는 확장)합니다.

이러한 청크는 보통 각각 수백~수천 단어로, 대부분의 웹페이지에서 아주 일부에 불과합니다. 또한 LLM은 엄격한 컨텍스트 윈도우 제한 하에서 작동합니다. 즉, 사용자 프롬프트, 가져온 모든 청크, 그리고 모델 자체의 응답을 포함해 처리할 수 있는 텍스트 양이 제한됩니다. 따라서 어떤 콘텐츠를 가져오고 포함할지 매우 선별적으로 결정해야 합니다.

예시는 다음과 같습니다.

전체 페이지 콘텐츠	"그라운딩은 모델이 외부 출처를 가져오고, 관련 사실을 추출한 다음, 그 추출물을 활용해 환각을 줄이고 신선도를 높이는 워크플로입니다.… 그다음 여러 출처를 스캔하고 정보를 비교한 뒤, 텍스트를 그대로 복사하는 대신 답변을 합성합니다. 이 합성 단계는 특정 단일 출처에 과도하게 의존하는 것을 피하는 데 도움이 됩니다."
스니펫	“어시스턴트가 웹 검색을 사용해 외부 출처를 가져오고, 검색된 사실에 응답을 그라운딩함으로써 환각을 줄이는 방법을 설명한다.”
확장 (1~2행)	"그라운딩은 모델이 외부 출처를 가져오고, 관련 사실을 추출한 다음, 그 추출물을 활용해 환각을 줄이고 최신성을 높이는 워크플로입니다. 모델은 웹 검색을 시작하기 전에 쿼리가 최신 정보 또는 검증 가능한 정보를 필요로 하는지 평가합니다."
확장 (33~34행)	"그다음 여러 출처를 스캔하고 정보를 비교한 뒤, 텍스트를 그대로 복사하는 대신 답변을 합성합니다. 이 합성 단계는 특정 단일 출처에 과도하게 의존하는 것을 피하는 데 도움이 됩니다."

LLM이 콘텐츠를 쉽게 이해할 수 있게 하세요

이 점이 중요합니다. AI 검색 엔진이 인터넷에서 콘텐츠를 가져올 때 전체 페이지가 아니라 일부 발췌문만 볼 수 있습니다. LLM의 답변에 인용될 가능성을 극대화하려면, 페이지 전체에 접근하지 못하더라도 LLM이 페이지의 관련성과 가치를 쉽게 이해할 수 있어야 합니다.

그다음 AI 검색 엔진은 이 텍스트를 응답 생성 과정에 통합합니다.

원본 웹 콘텐츠는 모델의 답변에 그라운딩됩니다. 즉, 이전 단계에서 추출한 텍스트 또는 데이터 스니펫을 모델의 컨텍스트에 추가하여, 사실상 “웹에서 가져온 유용할 수 있는 컨텍스트가 여기 있으니, 이제 이 정보를 사용해 사용자의 질문에 답해라”고 지시하는 것입니다.

파트 6

인용이 선택되는 방식

그 다음 모델은 타고난 지식과 검색된 콘텐츠를 결합해 답변을 생성하고 사용자에게 공유합니다. 이 응답에는 보통 출처가 포함됩니다. 그라운딩 과정에서 사용된 소스로 연결되는, 클릭할 수 있는 URL입니다.

AI 검색 엔진이 가져온 모든 페이지가 최종 답변에서 출처로 인용되는 것은 아닙니다. 모델은 다음과 같은 여러 요인을 바탕으로 어떤 출처를 인용할지 선택합니다.

관련성: 검색된 콘텐츠가 응답의 특정 주장에 얼마나 직접적으로 기여했는지.
신선도: 출처가 얼마나 최신으로 보이는지 판별합니다.
다양성: 인용 출처가 얼마나 다양한지 판정합니다(AI 검색 엔진은 같은 출처를 반복 인용하기보다 서로 다른 여러 출처를 인용하는 쪽을 선호하는 경우가 많습니다).

즉, 콘텐츠가 검색되어 읽히더라도 눈에 보이는 인용을 받는다는 보장은 없습니다. 해당 콘텐츠가 답변의 특정 주장과 직접적으로 관련 있다고 판단되어야 합니다.

파트 7

개인화가 작동하는 방식

이것이 AI 검색 엔진이 작동하는 핵심이지만, 여기에는 한 단계 더 복잡한 요소가 있습니다. 바로 개인화입니다.

ChatGPT를 비롯한 AI 검색 엔진은 사용자별로 결과를 개인화할 수 있어, 같은 프롬프트라도 사람에 따라 다른 결과가 생성될 수 있습니다. 개인화는 다음을 포함한 여러 방식의 영향을 받을 수 있습니다.

현재 대화 맥락: 같은 채팅의 이전 메시지가 현재 프롬프트에 대한 응답에 영향을 줍니다. 하이킹 장비에서 “내구성”을 중요하게 생각한다고 언급해 두면, 이후 채팅에서 “배낭 추천”을 요청할 때 ChatGPT가 검색 기준에 이 요소를 포함할 것이라고 기대할 수 있습니다.
메모리: 많은 LLM은 여러 채팅에 걸쳐 특정 사실이나 선호를 시스템이 유지할 수 있게 해주는 메모리 기능을 갖추고 있습니다. 예를 들어 메모리가 활성화되어 있으면 ChatGPT는 사용자가 공유한 세부 정보(이름이나 관심사 등)를 추론해 기억하고, 이후 대화에서 이를 반영해 응답을 개인화합니다.
위치, 시간, 날짜: 많은 AI 검색 엔진은 사용자에 대한 정보를 추론해 이를 바탕으로 응답을 맞춤화할 수 있습니다. 예를 들어 IP 주소를 이용해 대략적인 위치를 파악해(“내 주변 브런치” 같은 쿼리에) 반영하기도 하고, 날짜와 시간도 고려합니다(“캠핑 준비물 리스트”는 겨울에는 4계절 텐트를, 여름에는 3계절 텐트를 추천할 수도 있습니다).
시스템 프롬프트: 시스템 메시지에 공유된 특정 선호는 대화에 영향을 미칩니다(시스템 프롬프트에 "나는 비건이라는 걸 기억해"를 추가하면 "건강한 아침 식사 아이디어" 같은 프롬프트에 대한 응답이 달라집니다).

시스템 프롬프트를 이해하기 위한 비유를 들어보겠습니다. 축구를 한다고 가정하면, ‘학습 데이터’는 수년간 해온 모든 연습, 즉 장기적인 근육 기억입니다. 시스템 프롬프트는 경기장에 들어가기 직전에 코치가 해주는 말입니다. 출력에 영향을 미칠 가능성이 더 큰, 강력한 단기 기억이라고 할 수 있습니다.

Mark Williams-Cook, 설립자, AlsoAsked

따라서 특정 프롬프트의 단일 응답에 집착하기보다는, 시간의 흐름에 따라 그리고 여러 프롬프트에 걸쳐 브랜드와 웹사이트의 평균 가시성을 추적하는 것이 좋습니다.

마무리

ChatGPT부터 Perplexity, 구글 AI Mode까지 모든 AI 검색 엔진은 조금씩 다르지만, 핵심 프로세스는 동일합니다. 특히 SEO 담당자와 마케터에게 중요한 점은 구글과 Bing 같은 전통적 검색 엔진이 AI 검색 엔진이 작동하는 데 필요한 인프라의 상당 부분을 제공한다는 것입니다. AI 검색 최적화는 전통적인 SEO 모범 사례에 크게 의존합니다.

추가 읽을거리

대규모 언어 모델(LLM)이란?

의미론 가이드 또는 검색과 LLM 모두에서 가시성을 확보하는 방법 — I Love SEO

ChatGPT 같은 LLM 심층 분석

GPT가 웹을 보는 방식

지식 집약적 NLP 작업을 위한 검색 증강 생성(RAG)

헌법적 AI: AI 피드백을 통한 무해성

가이드:Ryan Law

라이언 로는 Ahrefs의 콘텐츠 마케팅 디렉터입니다. 라이언은 작가, 콘텐츠 전략가, 팀 리더, 마케팅 디렉터, 부사장, CMO, 에이전시 창립자 등 다양한 역할로 13년의 경력을 쌓았습니다. 또한 Google, Zapier, GoDaddy, Clearbit, Algolia를 포함한 수많은 기업이 콘텐츠 마케팅과 SEO를 개선하도록 도왔습니다. 그는 소설가이기도 하며, 콘텐츠 마케팅 강의 2개의 제작자이기도 합니다.

기여자

Gianluca Fiorelli

Mark Williams-Cook

단계별로 SEO 마스터하기

/01

AI 검색 엔진이 작동하는 방식

ChatGPT 같은 AI 검색 엔진이 답변을 정확히 어떻게 생성하고, 어떤 브랜드와 제품을 언급할지 선택하는 방법을 알아보세요.