LLM 시대의 API와 CLI 구성
-
2026년, 산업계는 대형 언어 모델(LLM) 시대에 도구 설명을 구조화하는 방식에 대해 논의 중이며, 두 가지 주요 전략이 부각되고 있음.
-
첫 번째 전략은 GitHub 리포지토리에서 요청 목록을 표시하는 등 상위 수준의 도구를 제공하여 세밀한 작업을 수행하는 것.
-
두 번째 전략은 새로운 도구 자체를 만들지 않고 모델에게 유용한 쉘 명령을 알려주는 방식으로, 이 방법은 도구 호출을 직접 실행하는 것 대신 CLIs 참조와 함께 exec_bash 호출을 포함하는 혁신적인 점을 보여줌.
-
유닉스 쉘의 최고의 기능인 명령 구성을 활용하여, 모델이 각 단계 후에 다시 명령할 필요 없이 도구 호출의 파이프라인을 형성함으로써 토큰 비용 절감 가능.
-
이러한 파이프라인은 스크립트에 저장하거나 사용자에 의해 맞춤형으로 실행될 수 있으며, 명령 라인은 인간과 기계 모두와 호환 가능한 인터페이스로 기능함.
-
Google 문서 및 Google 그룹에 액세스하기 위해 HTTP API를 활용하여 클라우드 기반 Google Docs를 목록화하고, Markdown으로 읽고, 첨부된 댓글 스레드를 이해하도록 설계됨.
-
Google과 기타 SaaS 벤더는 모든 API를 호출할 수 있는 프로그램을 OpenAPI 명세로 정의하고 있음.
-
Restish라는 도구를 사용하여 OpenAPI 사양을 해석하고, API 엔드포인트와 파라미터에 대한 쉘 자동 완성 기능을 생성함.
-
Restish 사용 시 API 사양 등록이 필요하며, OAuth 2.0 인증은 별도의 스크립트를 통해 사용자 지정한 인증 흐름을 실행하여 토큰을 삽입함.
-
macOS CLI 스크립트의 안전한 토큰 저장 솔루션으로 Keychain을 사용하여 생체 인식/비밀번호 인증을 통해 비밀 정보에 대한 보안을 강화함.
-
사용자 상호작용과 현재 세대의 LLM 상호작용을 결합하여 CLIs를 구성하는 것이 큰 힘을 발휘하며, MCP 서버가 개발되기 전에 서비스에 대해 독립적으로 CLIs를 유지보수할 수 있는 가능성이 강조됨.
-
Google Groups처럼 API 사양을 제공하지 않는 서비스의 경우, 대화 기록을 자동화하기 위해 하버 파일을 통해 데이터를 수집하고 LLM을 활용하여 Python 클라이언트를 생성함.