생성형 AI 도구를 활용하여 작성 및 편집된 노트입니다.
GLM-5로 보는 ‘에이전틱 엔지니어링’ 시대의 개발 방식

최근 오픈소스(정확히는 MIT 라이선스) 진영에서 “또 한 번 판이 흔들렸다”는 소식이 돌았습니다. 거대한 오픈 웨이트 모델 GLM-5가 공개됐고, 단순히 “코딩 잘하는 모델”을 넘어 장시간 업무를 수행하는 ‘에이전트형’ 활용을 전면에 내세웠기 때문입니다.1
도입부에서 핵심만 요약하면 이렇습니다. GLM-5는 초대형 MoE 구조와 200K 컨텍스트를 바탕으로, “대화형 도우미”에서 “일을 끝내는 동료”로 역할을 넓히려 합니다. 가격·성능·환각(할루시네이션) 측면에서 오픈 진영의 기준선을 올렸다는 평가도 함께 나옵니다.23
GLM-5 핵심 스펙: ‘큰데 빠르게 쓰자’의 타협점
GLM-5는 총 744B 파라미터 규모이지만, 매 토큰마다 약 40B 정도만 활성화되는 MoE(전문가 혼합) 방식으로 설계됐습니다.2 쉽게 말해 “선수는 744명인데, 플레이마다 40명만 투입”되는 팀 운영입니다. 덕분에 무식하게 큰 모델을 ‘그냥 느리게’ 쓰는 게 아니라, 실제 사용 체감(초반 응답, 긴 문맥 유지)을 현실적인 선으로 맞추려는 의도가 보입니다.
그리고 컨텍스트 윈도우가 200K 토큰이라 “긴 문서 + 수정 라운드” 같은 업무 흐름에서 강점이 납니다.2 다만 텍스트 입출력 중심이라, 이미지 입력이 필수인 워크플로우라면 다른 선택지가 여전히 필요합니다.2
성능 포인트: “잘 아는 척”을 덜 하는 모델이 실무에 유리하다
벤치마크에서 눈에 띄는 건 ‘에이전트형 작업’과 ‘지식 신뢰도’입니다. Artificial Analysis 기준으로 GLM-5는 오픈 웨이트 모델 중 상위권을 넘어 “오픈 1위”로 올라섰고, 특히 agentic(업무형 과제) 지표에서 강하게 나왔다고 분석됩니다.2
더 흥미로운 건 환각률 관련 지표가 크게 개선됐다는 점입니다. GLM-5는 모르면 “모른다/확인 필요”로 물러서는(=abstain) 경향을 강화해, 할루시네이션이 줄었다는 평가를 받습니다.23 실무에서는 이게 체감이 큽니다. 회의 자료나 고객 제안서처럼 “그럴듯한 거짓말”이 치명적인 문서에서는, 똑똑함만큼이나 ‘멈출 줄 아는 태도’가 생산성을 좌우하니까요.
Vibe Coding에서 Agentic Engineering으로: 개발자의 일이 바뀌는 지점
뉴스에서 특히 인상적이었던 키워드는 “Agentic Engineering(에이전틱 엔지니어링)”입니다.1 저는 이걸 “프롬프트 잘 치는 사람”과 “일을 설계해 맡기는 사람”의 차이로 이해하면 쉽다고 봅니다.
바이브 코딩이 “대충 말하면 코드를 뽑아주는 즐거움”에 가깝다면, 에이전틱 엔지니어링은 일을 ‘쪼개고’, ‘검증 구간(품질 게이트)을 박고’, ‘도구 호출/재시도/로그’를 전제로 운영합니다. GLM-5가 내세우는 에이전트 모드나 문서 산출물(.docx, .pdf, .xlsx) 지향은 “복붙용 텍스트”보다 “납품 가능한 결과물”을 더 가까이 보겠다는 신호에 가깝습니다.34
물론 조심할 점도 있습니다. 에이전트형 모델은 목표 달성에 집요해질수록, 상황 맥락(권한, 정책, 사용자 의도)을 좁게 해석하는 순간 사고가 납니다. 그래서 앞으로의 개발 실력은 ‘모델을 똑똑하게 만드는 법’ 못지않게 ‘모델이 못 하게 막는 법(권한·데이터·행동 제한)’이 포함될 가능성이 큽니다.
시사점: GLM-5를 “업무형 LLM 스택”에 넣는 방법
GLM-5를 도입할지 고민이라면, 먼저 업무를 두 갈래로 나눠보면 좋습니다. 첫째, 긴 문서/긴 작업(기획서, 분석, 리팩터링)처럼 “흐름 유지”가 중요한 일. 둘째, 사실성 리스크가 큰 영역(리서치 요약, 숫자 포함 보고서)처럼 “모르면 멈추기”가 중요한 일. GLM-5는 이 두 축에서 오픈 진영의 선택지를 넓혀줍니다.23
실전 팁도 간단합니다. 에이전트형으로 쓸수록 프롬프트는 ‘요청’이 아니라 ‘작업 지시서’에 가까워져야 합니다. 산출물 형식, 금지 행동, 확인 체크리스트, 실패 시 재시도 규칙을 짧게라도 박아두면 결과 품질이 안정됩니다. 그리고 “모델이 다 한다”로 가기보다는, 사람이 승인하는 중간 관문을 설계하는 쪽이 결국 더 빠릅니다. 에이전틱 엔지니어링은 자동화가 아니라, 자동화가 안전하게 굴러가게 만드는 공학에 가깝기 때문입니다.1
참고
1GLM-5: From Vibe Coding to Agentic Engineering
2GLM-5: Everything You Need to Know
4Chinese AI lab Zhipu releases GLM-5 under MIT license, claims parity with top Western models