다국어 SEO 실험 3개월 — HEXACO, 첫 번째 마일스톤

왜 HEXACO였나

한국에서 MBTI가 유행한 지 수년째다. 일본과 중국에도 같은 흐름이 보인다. 16personalities가 그 한가운데서 월 수천만 방문자를 끌고 있었다. 그러면 다음 MBTI는 뭘까. 여기서 출발했다.

MBTI가 잘 팔린 이유는 과학이 아니라 4글자로 공유 가능한 라벨이라는 것이다. 빅파이브는 학술적으로 더 정확하지만 점수 기반이라 "나는 O 80, C 55, E 70인 사람"이라고 자기소개하는 사람은 없다.

그래서 후보를 좁혀봤다. 에니어그램은 이미 코어 팬층이 두꺼웠고 검색어 경쟁도 포화 상태였다. 애착유형은 연애 맥락에 너무 묶여 있어서 일상적인 자기소개로 쓰기엔 어색했다. 빅파이브는 방금 말한 이유로 제외했다. 남은 게 HEXACO였다. 학술적으로 인정받는 모델이지만 대중적으로는 거의 알려지지 않았다. 게다가 여섯 차원을 High/Low로 나누면 2⁶ = 64가지 조합이 나온다 (숫자만으로 유형이 되는 건 아니고 각 조합에 이름과 성격을 붙이는 작업이 별도로 필요했지만, 그 얘기는 이 글의 범위 밖이다). 어쨌든 빅파이브가 가지지 못한 유형화 가능성이 여기엔 있었다.

전략 — 인텐트, 다국어, 하이브리드

세 개의 축으로 나눴다.

브랜드 쿼리는 처음부터 버렸다. hexaco라는 단어는 원조 학술 사이트와 오래된 심리학 블로그들이 이미 상위를 잡고 있다. 내가 들어갈 수 있는 건 free hexaco test, hexaco 성격검사 무료 같은 행동 + 수식 조합이었다. 롱테일부터 하나씩 접근했다.

다국어도 초반부터 깔았다. 영어권은 MBTI 콘텐츠로 레드 오션이지만, 한국어·일본어·스페인어·독일어·아랍어 쪽은 HEXACO 콘텐츠 자체가 없다시피 했다. 첫 달에 유럽·아시아 주요 언어 10개 정도로 시작해서 몇 주 간격으로 추가했고, 3월 중순에 18개 언어를 다 덮었다. 각 언어마다 기초 검색어를 먼저 잡는 쪽을 택했다.

블로그는 뒤늦게 붙였다. 처음엔 테스트만으로 갈 수 있을 줄 알았는데, 검색 유입을 만들려면 결국 양질의 설명 콘텐츠가 필요했다. 3월 초에 다국어 블로그를 추가했다.

다만 양산형 SEO 글은 의식적으로 피했다. 컨셉을 먼저 잡고, 초안이 나오면 내가 생각한 개요와 순서를 다시 주고 가다듬었다.¹ AI 시대라고 해도 편집장의 수작업은 빠질 수 없다. 다국어로 확장하면 작업량이 빠르게 불어나지만, 이 과정을 빼면 양산형 콘텐츠에 묻힌다.

3개월 동안 한 일

1월 말메타 태그, JSON-LD 구조화 데이터, 사이트맵, hreflang 기초 세팅
2월16개 언어 키워드 최적화, WebSite schema, 파비콘/OG 이미지 정리
3월 초MDX 기반 다국어 블로그 시스템 구축
3월 중About/Learn/블로그 콘텐츠 다국어 작성, 내부 링크 강화
3월 말네이티브 QA 대수술
4월 초Search Console 첫 본격 분석
4월 중데이터 기반 메타 타이틀 CTR 최적화

가장 긴 시간이 든 건 다국어 콘텐츠 작성이 아니었다. 네이티브 QA였다. 자동 번역은 출발점이고, 언어마다 어색한 표현과 검색어 패턴 차이를 직접 손봐야 했다.

고민한 부분도 있었다. 64유형의 네이밍과 설명 전체를 블로그에 공개한 것이다. 누가 베껴 쓸 수 있다는 걸 알면서도 먼저 공개했다. 먼저 정리한 사람이라는 위치가 더 가치 있다고 봤다.

같은 이유로 자극적인 요소도 걷어냈다 — 바이럴 장치, 호기심을 쥐어짜는 썸네일, "당신은 상위 1% 천재입니다" 같은 것들. UI도 튀지 않게, 색도 요란하지 않게 했다. 단기 트래픽에는 도움이 되겠지만, 학술적 신뢰를 쌓는 사이트로 롱텀을 가려면 그게 독이 된다고 봤다. 요즘 사람들에게 간이 좀 밍밍한 사이트가 됐는지도 모르겠다.

숫자로 본 3개월

Google Search Console 기준 월별 일 평균 노출:

2월: 일 평균 8회
3월: 일 평균 149회
4월 초: 일 평균 600회 이상

시작점이 사실상 0이라 배수 계산은 의미가 없다. 50개국 1,504명이 테스트를 끝까지 완료했다.

국가 분포는 예상과 달랐다. 한국 1위는 모국어라 납득되지만 2위가 멕시코였다. 3위 일본, 그리고 독일·프랑스·튀르키예·러시아가 뒤를 이었다. 미국은 노출은 꽤 많은데 CTR이 1%대로 가장 낮았다. 영어권이 예상보다 훨씬 어렵다는 첫 신호였다.

CTR이 높게 나온 키워드들은 대부분 비영어권 + 인텐트 조합이었다. 한국어 "헥사코 테스트 무료" 20%대, 일본어 "hexaco 診断無料" 40%대, 독일어 "hexaco test deutsch" 24%. 최근에는 중국어 免费 hexaco 测试에서도 Baidu 1위가 찍혔다.

예상과 달랐던 것들

영어권은 예상보다 훨씬 어려웠다

"영어 먼저"라는 통념을 따르지 않은 게 다행이었다. 브랜드 쿼리는 앞서 말한 대로 이미 잡혀 있었고, 인텐트 쿼리(personality test 류)도 16personalities가 깔고 앉아 있다. 64 personality test 같은 변형 키워드를 노린 것도 그래서다. 그래도 영어권은 마지막에 붙일 시장이었다.

영어 퍼스트 전략은 LLM era 이전의 조언이다

작업하다가 LLM(주로 클로드 코드)과 상의해보면 자꾸 "영어부터 시작해서 검증되면 다른 언어로 확장하라"는 답이 돌아왔다. 책에도 그렇게 쓰여 있고, 인디해커 컨퍼런스 토크에도 그렇게 나온다. 다 LLM era 이전의 조언이다. 그때는 영어 외 언어 콘텐츠를 만드는 비용이 너무 컸기 때문에 영어로 일단 검증하고 가는 게 합리적이었다.

지금은 조금만 신경 쓰면 처음부터 18개 언어를 동시에 깔 수 있다. 자동 번역으로 출발하고 네이티브 QA로 다듬는 워크플로가 며칠 안에 잡힌다. 영어권에서 포화 키워드와 싸우는 동안 비영어권 롱테일은 여전히 비어 있다.

Google Search Console은 검색의 일부만 보여준다

3개월 내내 GSC가 메인 도구였다. 그러다 자체 로그를 훑어보다가 Baidu에서 유입이 이미 3월 말부터 꾸준히 들어오고 있다는 걸 뒤늦게 발견했다. GSC는 구글만 본다. Baidu, Bing China, Yandex, Naver는 각자 다른 관측 도구가 필요하다. 다국어 사이트를 운영할 거면 최소 두 개의 독립 관측은 있어야 한다.

번역은 완성이 아니라 프로세스다

18개 언어를 자동 번역으로 채우고 방치했다. 3월 말에 네이티브 QA를 돌려보니 언어마다 2~5개씩 어색한 표현이 나왔다. 프랑스어와 터키어에서는 발음 구별 부호(é è ç, ş ç ğ ı)를 일부 누락한 채로 배포해버렸다. 문법적으로 빠져도 뜻은 통하지만 현지 화자 눈에는 낯설게 보인다. 고치고 나서도 UI 문구 하나 바꿀 때마다 QA를 다시 돌려야 했다.

중간 관찰

3개월로는 가설을 증명할 수 없다. 지금 보이는 선은 위로 가고 있지만, 이 기울기가 유지될지 정체할지 꺾일지 알 수 없다. 이것이 HEXACO에만 해당하는 특수한 현상인지, 포화 시장에서 니치를 파는 일반적인 전략이 되는지도 아직 모른다. 다만 책으로 배우는 것보다 직접 굴려보는 게 빨랐다.