GLM-5로 보는 ‘에이전틱 엔지니어링’ 시대의 개발 방식

최근 오픈소스(정확히는 MIT 라이선스) 진영에서 “또 한 번 판이 흔들렸다”는 소식이 돌았습니다. 거대한 오픈 웨이트 모델 GLM-5가 공개됐고, 단순히 “코딩 잘하는 모델”을 넘어 장시간 업무를 수행하는 ‘에이전트형’ 활용을 전면에 내세웠기 때문입니다.¹

도입부에서 핵심만 요약하면 이렇습니다. GLM-5는 초대형 MoE 구조와 200K 컨텍스트를 바탕으로, “대화형 도우미”에서 “일을 끝내는 동료”로 역할을 넓히려 합니다. 가격·성능·환각(할루시네이션) 측면에서 오픈 진영의 기준선을 올렸다는 평가도 함께 나옵니다.²³

GLM-5 핵심 스펙: ‘큰데 빠르게 쓰자’의 타협점

GLM-5는 총 744B 파라미터 규모이지만, 매 토큰마다 약 40B 정도만 활성화되는 MoE(전문가 혼합) 방식으로 설계됐습니다.² 쉽게 말해 “선수는 744명인데, 플레이마다 40명만 투입”되는 팀 운영입니다. 덕분에 무식하게 큰 모델을 ‘그냥 느리게’ 쓰는 게 아니라, 실제 사용 체감(초반 응답, 긴 문맥 유지)을 현실적인 선으로 맞추려는 의도가 보입니다.

그리고 컨텍스트 윈도우가 200K 토큰이라 “긴 문서 + 수정 라운드” 같은 업무 흐름에서 강점이 납니다.² 다만 텍스트 입출력 중심이라, 이미지 입력이 필수인 워크플로우라면 다른 선택지가 여전히 필요합니다.²

성능 포인트: “잘 아는 척”을 덜 하는 모델이 실무에 유리하다

벤치마크에서 눈에 띄는 건 ‘에이전트형 작업’과 ‘지식 신뢰도’입니다. Artificial Analysis 기준으로 GLM-5는 오픈 웨이트 모델 중 상위권을 넘어 “오픈 1위”로 올라섰고, 특히 agentic(업무형 과제) 지표에서 강하게 나왔다고 분석됩니다.²

더 흥미로운 건 환각률 관련 지표가 크게 개선됐다는 점입니다. GLM-5는 모르면 “모른다/확인 필요”로 물러서는(=abstain) 경향을 강화해, 할루시네이션이 줄었다는 평가를 받습니다.²³ 실무에서는 이게 체감이 큽니다. 회의 자료나 고객 제안서처럼 “그럴듯한 거짓말”이 치명적인 문서에서는, 똑똑함만큼이나 ‘멈출 줄 아는 태도’가 생산성을 좌우하니까요.

Vibe Coding에서 Agentic Engineering으로: 개발자의 일이 바뀌는 지점

뉴스에서 특히 인상적이었던 키워드는 “Agentic Engineering(에이전틱 엔지니어링)”입니다.¹ 저는 이걸 “프롬프트 잘 치는 사람”과 “일을 설계해 맡기는 사람”의 차이로 이해하면 쉽다고 봅니다.

바이브 코딩이 “대충 말하면 코드를 뽑아주는 즐거움”에 가깝다면, 에이전틱 엔지니어링은 일을 ‘쪼개고’, ‘검증 구간(품질 게이트)을 박고’, ‘도구 호출/재시도/로그’를 전제로 운영합니다. GLM-5가 내세우는 에이전트 모드나 문서 산출물(.docx, .pdf, .xlsx) 지향은 “복붙용 텍스트”보다 “납품 가능한 결과물”을 더 가까이 보겠다는 신호에 가깝습니다.³⁴

물론 조심할 점도 있습니다. 에이전트형 모델은 목표 달성에 집요해질수록, 상황 맥락(권한, 정책, 사용자 의도)을 좁게 해석하는 순간 사고가 납니다. 그래서 앞으로의 개발 실력은 ‘모델을 똑똑하게 만드는 법’ 못지않게 ‘모델이 못 하게 막는 법(권한·데이터·행동 제한)’이 포함될 가능성이 큽니다.

시사점: GLM-5를 “업무형 LLM 스택”에 넣는 방법

GLM-5를 도입할지 고민이라면, 먼저 업무를 두 갈래로 나눠보면 좋습니다. 첫째, 긴 문서/긴 작업(기획서, 분석, 리팩터링)처럼 “흐름 유지”가 중요한 일. 둘째, 사실성 리스크가 큰 영역(리서치 요약, 숫자 포함 보고서)처럼 “모르면 멈추기”가 중요한 일. GLM-5는 이 두 축에서 오픈 진영의 선택지를 넓혀줍니다.²³

실전 팁도 간단합니다. 에이전트형으로 쓸수록 프롬프트는 ‘요청’이 아니라 ‘작업 지시서’에 가까워져야 합니다. 산출물 형식, 금지 행동, 확인 체크리스트, 실패 시 재시도 규칙을 짧게라도 박아두면 결과 품질이 안정됩니다. 그리고 “모델이 다 한다”로 가기보다는, 사람이 승인하는 중간 관문을 설계하는 쪽이 결국 더 빠릅니다. 에이전틱 엔지니어링은 자동화가 아니라, 자동화가 안전하게 굴러가게 만드는 공학에 가깝기 때문입니다.¹

참고

¹GLM-5: From Vibe Coding to Agentic Engineering

²GLM-5: Everything You Need to Know

³z.ai's open source GLM-5 achieves record low hallucination rate and leverages new RL 'slime' technique

⁴Chinese AI lab Zhipu releases GLM-5 under MIT license, claims parity with top Western models