메인 콘텐츠로 건너뛰기

구글 TranslateGemma, 55개 언어를 ‘노트북·폰’에 쑤셔 넣었다

출근길 지하철에서 와이파이도 안 잡히는데, 갑자기 해외 고객에게서 장문의 메시지가 온다면 어떨까요?
이제 굳이 “번역 좀만 기다려 주세요”라고 할 필요가 점점 줄어들고 있습니다. 구글이 아예 고급 번역 모델을 노트북과 스마트폰 안으로 들여보냈기 때문이죠.

오늘 소개할 주인공은 구글의 새 오픈 번역 모델 패밀리, TranslateGemma입니다.
이 모델은 한 줄로 요약하면 이렇게 부를 수 있습니다.

“클라우드에 의존하지 않고, 내 기기에서 돌아가는 구글급 번역 엔진”

이 글에서는 다음 내용을 차례로 살펴봅니다.

  • TranslateGemma가 무엇이고, 기존 번역 모델과 뭐가 다른지

  • 4B·12B·27B, 세 가지 크기 모델이 각각 어디에 쓰이는지

  • 두 단계 학습(SFT + RL)으로 어떻게 ‘작은데 더 똑똑한’ 모델을 만들었는지

  • 이미지 속 글까지 번역하는 멀티모달 능력과 실제 활용 아이디어

  • 오픈 웨이트(Open Weights) 라이선스로 개발자와 기업이 누릴 수 있는 이점


TranslateGemma란? 구글이 푼 ‘노트북·폰용 번역 괴물’

TranslateGemma는 구글이 2026년 공개한 오픈 번역 모델 모음으로, 최신 개방형 LLM 계열인 Gemma 3 위에 얹어 만든 특화 모델입니다1.

가장 큰 특징은 세 가지입니다.

첫째, 55개 언어 지원
스페인어·프랑스어 같은 메이저 언어는 물론, 아이슬란드어·스와힐리어 등 상대적으로 데이터가 적은 언어까지 아우릅니다12.
구글은 여기에 더해 추가로 약 500개 언어쌍도 훈련에 사용했는데, 이들은 아직 공식 벤치마크에 전부 실린 건 아니지만 “실전에서 쓸 만한 수준까지”를 목표로 설계했습니다3.

둘째, 모바일부터 클라우드까지 커버하는 3종 세트

  • 4B(40억 파라미터): 스마트폰·엣지 디바이스용

  • 12B(120억 파라미터): 일반 소비자 노트북, 로컬 개발 환경용

  • 27B(270억 파라미터): H100 GPU 한 장이나 TPU 한 장으로 돌리는 클라우드 서버용24

심플하게 말하면, “폰·노트북·서버 각각에 맞는 번역 엔진이 따로 있다”는 개념입니다.

셋째, ‘오픈 웨이트(Open Weights)’ 공개
모델 가중치를 구글이 Kaggle, Hugging Face 등에 올려두었고, 기업이 수정·상용 서비스 적용·재배포까지 할 수 있게 열어두었습니다. 다만 위험한 사용은 금지하는 등 별도 이용 약관이 붙어 있어, 전통적인 오픈소스 라이선스와는 구분해 “오픈 웨이트”라 부릅니다25.

흥미로운 점은, 이 모든 것을 하면서도 단순 번역 엔진에 머물지 않고 챗봇처럼 대화도 가능한 범용 모델이라는 점입니다2. 번역 특화지만, 여전히 “LLM”의 성격을 유지하고 있는 셈이죠.


작은데 더 똑똑하다? 12B가 27B를 이긴 이유

일반적으로는 파라미터 수가 많을수록 더 잘한다고 생각하기 쉽습니다. 그런데 TranslateGemma는 그 통념을 정면으로 뒤집습니다.

구글이 번역 품질을 MetricX라는 척도로 평가했는데, 이 수치는 “낮을수록 오류가 적다”는 뜻입니다2.

  • Gemma 3 27B 기준 모델: MetricX 4.04

  • Gemma 3 12B 기준 모델: MetricX 4.86

  • TranslateGemma 12B: MetricX 3.60

숫자만 보면 잘 안 와 닿지만, 같은 12B 기준 모델 대비 약 26% 정도 오류율이 감소했고2, 심지어 두 배 더 큰 27B 기준 모델보다도 더 적은 오류를 냈습니다.

이 말은 곧, “무식하게 크게 만드는 것보다, 제대로 갈고 닦은 작은 모델이 더 정확할 수 있다”는 실증 사례가 된 셈입니다.

언어별로는 어떤 변화가 있었을까요?

  • 영어 ↔ 아이슬란드어: 오류율 30% 이상 감소

  • 영어 ↔ 스와힐리어: 약 25% 개선2

특히 데이터가 적은 저자원 언어에서 개선 폭이 더 크게 나타난 것이 인상적입니다. 글로벌 서비스를 하는 스타트업 입장에서는 “메이저 언어 + 롱테일 언어”를 함께 공략할 수 있는 도구가 된 셈이죠.

다만 모든 언어쌍에서 장점만 있는 것은 아닙니다.
전문 번역가가 참여한 인간 평가에서는 대부분 자동 평가와 비슷한 결과가 나왔지만, 일본어 → 영어 번역에서 고유명사 처리 문제가 발견되며 품질이 떨어진 사례도 보고되었습니다2. 이 부분은 후속 버전에서 보정될 가능성이 크지만, 중요한 이름·지명·회사명 등이 많은 문서라면 사람이 마지막 검수를 보는 게 안전한 상황입니다.


어떻게 이렇게 좋아졌나? 두 단계 학습의 비밀

TranslateGemma의 핵심은, 구글의 거대 모델인 Gemini의 ‘직감’을 작은 모델 안에 증류(distillation) 한 데 있습니다1.

훈련 과정은 크게 두 단계로 나뉩니다.

1단계: 감독 학습(SFT) – “사람과 Gemini가 함께 만든 평행 말뭉치”

먼저, 기본 Gemma 3 모델에 평행 데이터(parallel data)를 대량으로 먹입니다. 여기에는 두 가지가 섞여 있습니다.

  • 전문 번역가가 직접 만든 인간 번역 데이터

  • 구글의 최신 Gemini 모델이 생성한 고품질 인공 번역 데이터1

이 조합 덕분에, 저자원 언어에서도 어느 정도 수준 이상 품질을 확보할 수 있었습니다. 사람이 일일이 번역하기 어려운 방대한 언어쌍을, Gemini가 일종의 “선생님 역할”을 하며 메워준 셈입니다.

2단계: 강화학습(RL) – “사람처럼 자연스럽게 말하게 만들기”

그 다음 단계가 흥미롭습니다. 단순히 정답 문장을 따라 쓰게 하는 걸 넘어, “더 자연스러운 번역”을 위해 강화학습을 적용했습니다12.

여기서 사용된 보상 모델(reward model)이 포인트입니다.

  • MetricX-QE, AutoMQM 같은 고급 평가 지표를 포함한 여러 개의 자동 평가 모델 앙상블

  • 별도 모델이 “이 문장이 원어민이 쓴 것처럼 자연스러운지”까지 평가2

즉, 번역 문장을 여러 모델이 동시에 심사위원처럼 평가하고, 그 피드백을 바탕으로 RL을 돌리면서 점점 나은 번역 스타일로 수렴하게 만든 것입니다.

또 한 가지 중요한 설정이 있습니다. 훈련 데이터의 약 30%를 일반적인 지시문 응답(instruction) 데이터로 채웠다는 점입니다2. 덕분에 TranslateGemma는 번역 특화 모델이면서도,

  • “이 문장을 더 캐주얼하게 바꿔줘”

  • “이메일 형식에 맞게 다듬어 줘”

  • “이 번역 결과를 요약해 줘”

같은 챗봇형 요청에도 대응할 수 있는, 다재다능한 모델이 되었습니다.


멀티모달 유지: 이미지 속 글까지 번역하는 AI

TranslateGemma는 Gemma 3의 멀티모달 능력을 그대로 이어받았습니다123.
즉, 단순한 텍스트 번역을 넘어서 이미지 안의 텍스트도 읽고 번역할 수 있습니다.

흥미로운 점은, 구글이 이 작업을 위해 이미지 번역 전용 학습을 따로 하지 않았는데도 성능이 잘 나온다는 겁니다3. 텍스트 번역 품질을 올려놨더니, 그 개선 효과가 Vistra 같은 이미지-텍스트 번역 벤치마크에도 자연스럽게 전이된 것으로 보입니다23.

실제 활용을 상상해 보면 더 재밌습니다.

  • 여행 중, 식당 메뉴판을 찍으면 바로 내 언어로 번역

  • 해외 전시회에서 부스 포스터를 찍고, 중요 포인트만 요약 번역

  • 외국어로 된 종이 계약서를 촬영해서 텍스트 추출 + 번역 + 요약까지 한 번에

특히 4B 모델이 폰에서도 돌아간다는 점을 감안하면, “네트워크 끊긴 상태에서도 이미지 번역이 되는 여행·비즈니스용 앱”이 충분히 가능해집니다.


어디에 어떻게 쓸까? 개발자·창업자 시점 활용 아이디어

TranslateGemma는 단순히 “구글이 또 모델 하나 내놨구나” 수준으로 끝내기엔 아까운 자산입니다. 오픈 웨이트 + 55개 언어 + 모바일·노트북 호환이라는 조합은 꽤 강력한 그림을 그려줍니다.

1. 완전 로컬 번역 앱·서비스

클라우드 API를 안 쓰고, 사용자 기기에서 직접 번역이 돌아가는 앱을 만들 수 있습니다.

  • 개인정보가 민감한 문서 번역(의료, 법률, 내부 문서)

  • 오프라인 환경이 잦은 현장 업무(건설, 공장, 군·재난 현장 등)

  • 구독형 번역 앱(초기 설치 후, 추가 트래픽 비용 최소화)

노트북 기준으로는 12B 모델이 가장 현실적인 선택지가 될 것이고, 모바일은 4B 모델을 적용해 “가벼운 실시간 번역”을 노릴 수 있습니다24.

2. 글로벌 서비스 ‘다국어 UX’ 자동화

글로벌 SaaS나 커머스 서비스를 운영한다면, TranslateGemma를 로컬 혹은 프라이빗 클라우드에 올려두고,

  • 고객 지원 티켓 자동 번역·요약

  • 다국어 FAQ·헬프센터 자동 생성

  • 유저 리뷰를 영어/한국어 중심으로 통합 분석

과 같은 워크플로우를 꾸밀 수 있습니다.
특히 저자원 언어에서 크게 개선된 점을 감안하면2, 특정 국가의 사용자가 적더라도 초기부터 그들의 언어를 지원하는 “과감한 현지화 전략”을 시도해 볼 수 있습니다.

3. 멀티모달 기반 실용 앱

멀티모달 능력을 활용하면, 단순 번역을 넘어 현실 세계를 이해하는 도우미를 만들 수 있습니다.

  • 길거리 표지판·지하철 노선도·공공 서류를 인식하고 번역해주는 여행 도우미

  • 외국어 교과서·연구 논문 PDF를 사진 찍고, 번역 + 개념 설명까지 해주는 학습 앱

  • 수출입 업무에서 외국어 포장지·라벨·매뉴얼을 읽고 요약해 주는 B2B 도구

모바일에서 돌아가는 4B 모델을 붙이면, 카메라 라이브뷰 + 온디바이스 번역 같은 경험도 충분히 현실적입니다13.

4. 기업 내부 특화 번역 엔진

TranslateGemma의 또 다른 장점은 수정·파인튜닝이 가능한 오픈 웨이트라는 점입니다25.

이를 활용하면,

  • 특정 업계 용어(의학·반도체·법률 등)에 최적화된 사내 번역 모델

  • 특정 브랜드 톤·스타일을 일관되게 유지하는 마케팅 번역 모델

  • 회사 내부 문서 포맷에 맞춰 번역과 동시에 레이아웃까지 맞춰주는 자동 문서 파이프라인

같이 회사만의 “커스텀 번역 AI”를 구축할 수 있습니다.
다만, 구글의 Gemma 이용 약관과 금지 용도 정책을 반드시 확인하고, 법무 검토와 함께 도입하는 게 안전합니다25.


시사점 정리: 번역은 점점 ‘기능’이 아니라 ‘인프라’가 된다

TranslateGemma가 흥미로운 이유는, 단순히 “번역 품질이 좋아졌다”가 아닙니다.

  • 클라우드 의존에서, 기기 자체로 번역이 이동하는 전환점

  • 작지만 똑똑한 특화 모델이, 큰 범용 모델을 능가하는 사례

  • 오픈 웨이트 전략으로, 구글이 중국·미국 경쟁사와 다른 길을 택했다는 신호25

앞으로 번역은, 별도의 서비스가 아니라 모든 앱과 서비스 안에 자연스럽게 깔려 있는 ‘공기 같은 기능’이 될 가능성이 큽니다.
특히 모바일과 노트북에서 직접 돌아가는 수준까지 왔다는 것은, “언어 장벽”이 점점 ‘속도와 UX 문제’로만 남아가고 있다는 뜻이기도 합니다.

개인 사용자 입장에서는,

  • 해외 정보 탐색,

  • 외국인 친구와의 대화,

  • 해외 취업·이직 준비

등에서 점점 더 자연스러운 도움을 받게 될 것이고,

개발자·창업자 입장에서는,

  • 글로벌 서비스를 빠르게 현지화하고,

  • 개인정보를 외부로 보내지 않으면서,

  • 번역을 자사 인프라에 깊게 녹여 넣는

전략을 고민할 때, TranslateGemma는 상당히 매력적인 선택지가 될 것입니다.

이제 번역은 “외주를 주는 기능”에서 “내 서비스 안에 심는 인프라”가 되는 단계로 넘어가고 있습니다.
TranslateGemma는 그 변화를 본격적으로 여는, 꽤 의미 있는 한 수라고 봐도 무방합니다.


참고

1TranslateGemma: A new suite of open translation models

2Google's new open TranslateGemma models bring translation for 55 languages to laptops and phones

3Google launches TranslateGemma, open translation models supporting 55 languages

#AI뉴스#인공지능

이 노트는 요약·비평·학습 목적으로 작성되었습니다. 저작권 문의가 있으시면 에서 알려주세요.