Skip to main content
Views 5

Gemini API 호출 850억 돌파, 5개월 만의 ‘두 배 성장’이 의미하는 것

Summary

Gemini API는 개발자와 기업이 Google의 생성형 AI 모델을 서비스에 붙일 때 쓰는 “연결 관문” 같은 존재입니다. 그런데 이 관문을 통과한 요청이 3월 약 350억 건에서 8월 약 850억 건으로, 단 5개월 만에 두 배 이상 뛰었다고 합니다1.

이번 글에서는 “왜 이렇게 갑자기 늘었는지”, “기업용 Gemini Enterprise는 어디까지 왔는지”, “사용자 평가가 갈리는 이유는 뭔지”를 한 번에 정리해 보겠습니다. 숫자만 보면 축포를 터뜨릴 일인데, 속사정은 생각보다 입체적이거든요.

Gemini API 요청 350억→850억, 무엇이 점화했나

API 호출이 폭증했다는 건, 단순히 “사람들이 챗봇을 더 많이 썼다” 정도가 아닙니다. 개발팀이 실제 서비스(앱, 웹, 내부 툴, 자동화 파이프라인)에 Gemini를 붙여서 “반복적으로” 돌리기 시작했다는 뜻에 가깝습니다. 한 번 붙으면 호출은 매일, 매시간, 기능이 늘수록 눈덩이처럼 불어납니다.

흥미로운 포인트는 이 상승세가 올해 봄 Gemini 2.5 출시 이후 본격화됐고, Gemini 3 출시와 함께 더 이어졌다는 점입니다1. 모델 업데이트가 단순 성능 자랑으로 끝나지 않고, 실제 프로덕션 투입을 자극하는 ‘트리거’로 작동한 셈이죠.

모델 성능이 아니라 “비용·속도”가 채택을 밀어붙였다

기업이나 개발자가 LLM을 붙이다가 가장 먼저 부딪히는 벽은 대개 품질이 아니라 비용과 지연시간(레이턴시)입니다. “답은 꽤 똑똑한데, 이렇게 느리고 비싸면 운영이 안 되는데요?”라는 순간이 오거든요.

이 지점에서 Gemini 3 Flash처럼 “빠르고 상대적으로 저렴한” 계열이 기업 워크플로우에 매력적으로 들어옵니다. VentureBeat는 Gemini 3 Flash가 비용과 지연시간을 낮춘 조합으로 기업 활용에 유리하다고 전했는데2, 이런 ‘고빈도 호출에 최적화된 모델’이 늘면 API 트래픽이 증가하는 건 거의 정해진 수순입니다. 챗봇 상담, 문서 요약, 로그 분석, 검색 보조처럼 자잘하지만 호출이 잦은 작업이 특히 그렇습니다.

돈을 버는 듯하지만… R&D까지 덮기엔 아직 멀다

기사에서 가장 현실적인 대목은 여기입니다. Gemini 2.5는 운영 비용 관점에서는 이익을 내고 있지만, 연구개발(R&D) 비용까지 포함하면 아직 수익이 나지 않는다고 전해졌습니다1.

쉽게 말해 “돌려서 남는 돈은 생기기 시작했는데, 모델을 더 똑똑하게 만들기 위해 쏟아붓는 돈까지 다 합치면 아직 적자”라는 구조입니다. 생성형 AI 비즈니스가 대체로 겪는 성장통이죠. 트래픽이 늘수록 매출 기회도 커지지만, 동시에 경쟁에서 뒤처지지 않으려면 다음 모델을 계속 만들어야 하니까요.

Gemini Enterprise 1,500개 기업·800만 가입자… 그런데 평가는 왜 갈릴까?

기업용 서비스 Gemini Enterprise는 1,500개 기업에서 800만 명의 가입자를 확보했고, 온라인으로 100만 명이 추가 가입 중이라고 합니다1. 숫자만 보면 “이미 대세”처럼 느껴지죠.

만족도도 나쁘지 않습니다. 한 컨설팅 회사의 내부 설문에서 83%가 만족했다고 전해졌고1, 특히 “기업 데이터와 연결되는 경험”을 유용하게 보는 반응이 있었습니다1. 실제 현장에서는 ‘우리 회사 문서/메일/드라이브/정책’과 자연스럽게 이어지는지가 체감 가치를 크게 좌우하니까요.

다만 불만도 분명합니다. “간단한 질문에는 괜찮지만, 전문 업무나 맞춤형 앱 개발에서는 부족하다”는 평가가 함께 나왔습니다1. 여기서 많은 팀이 공감하는 함정이 하나 있습니다. 데모에서는 반짝 좋았는데, 막상 현업의 예외 케이스(권한, 용어, 문서 품질, 감사 로그, 책임 소재)가 쏟아지는 순간부터 AI가 ‘업무 파트너’가 아니라 ‘추가 관리 대상’이 되기도 하거든요.

2월 4일 실적 발표가 중요한 이유: “성장”의 성격이 드러난다

Google은 2월 4일 분기 실적 발표에서 이런 수치를 더 자세히 공개할 예정이라고 합니다1. 여기서 시장과 실무자 모두가 궁금해할 포인트는 단순히 “850억이 대단하다”가 아니라, 그 850억이 어떤 사용 패턴에서 나왔는지입니다.

예를 들어 테스트·실험 트래픽인지, 아니면 장기 운영되는 프로덕션 트래픽인지에 따라 의미가 확 달라집니다. 전자는 ‘관심의 폭발’이고, 후자는 ‘구조적 채택’이니까요. 기업용 가입자가 늘었다는 사실과 API 호출이 늘었다는 사실이 같은 방향을 가리킨다면, 그때는 흐름이 꽤 단단하다고 볼 수 있습니다.

시사점: “AI 경쟁”은 이제 모델 싸움이 아니라 운영 싸움

이번 Gemini API 호출 급증은 AI가 유행을 넘어 “서비스의 부품”이 되어가고 있다는 신호로 읽힙니다. 특히 기업 시장에서는 성능만큼이나 비용, 속도, 보안/권한, 사내 데이터 연동이 승부를 가릅니다.

만약 여러분이 실무에서 Gemini API 도입을 고민 중이라면, 화려한 데모보다 먼저 “우리 업무에서 호출이 폭증하는 지점이 어디인지”를 상상해 보세요. 그 지점이 고객 상담처럼 반복형이라면 ‘빠르고 저렴한 모델’ 중심으로 설계를 잡는 게 유리하고, 반대로 전문 판단이나 복잡한 문서 해석이 핵심이라면 작은 PoC로 한계를 먼저 확인하는 편이 안전합니다.

결국 850억이라는 숫자는 출발점일 뿐입니다. 중요한 건 “그 호출들이 실제로 일을 끝내줬느냐”, 그리고 “그 일을 끝내는 비용이 감당 가능하냐”입니다.

참고

1Google Gemini API calls more than doubled to 85 billion by August - The Information | MarketScreener

2Gemini 3 Flash arrives with reduced costs and latency — a powerful combo for enterprises | VentureBeat

Gemini API 호출 850억 돌파, 5개월 만의 ‘두 배 성장’이 의미하는 것

이 노트는 요약·비평·학습 목적으로 작성되었습니다. 저작권 문의가 있으시면 에서 알려주세요.