AI 에이전트 워크플로우와 GPTs 스토어의 방향성에 대한 추측

디토의 GPTs 스토어 팁

AI 에이전트 워크플로우와 GPTs 스토어의 방향성에 대한 추측

Robots Talk Back, AI Security Risks, Political Deepfakes, and more

최근 데빈의 데모 영상 및 GPT5와 AI agent가 여름에 발표될 것이라는 뉴스가 나옴에 따라서,

AI agent에 대한 관심이 더욱 높아지고 있는 것 같습니다. 현재, 이러한 AI 에이전트 도구와 관련된 학술 문헌이 다양하게 한꺼번에 나오고 있다고 합니다. 이에 따라 AI 에이전트 워크플로우가 AI 기술 발전의 중심축으로 자리 잡을 것으로 예상됩니다.

AI 에이전트는 인공지능 기술을 기반으로 한 소프트웨어 프로그램입니다. 기존의 AI와 다르게 AI 에이전트는 에이전트 워크플로우를 통해 작동합니다. 에이전트 워크플로우는 효율적인 결과를 얻기 위해 다양한 작업 단계를 수행하는 방법입니다. 예를 들어, 웹 검색을 통해 정보를 수집하고, 초안을 작성하고 수정하는 등의 과정을 거칩니다. 이를 통해 AI 에이전트는 더욱 정확하고 유용한 결과를 제공할 수 있습니다. AI 에이전트는 특정 작업을 사용자를 대신해 수행할 수 있으며, 사용자의 상황에 맞게 동작하여 필요한 앱을 추천하는 중개자 역할을 할 수도 있습니다.

에이전트는 특정 작업을 사용자를 대신해 행동할 수 있다. 나는 에이전트가 특정 workflow를 가진 기능체라고 생각한다. 이런 일들을 사용자의 상황에 맞게 행동할 수 있다. 아마 사용자는 어떤 앱을 실행해야 할지 생각할 필요가 없을 수 도 있다. 사용자의 맥락에 맞게 알아서 앱을 추천해주는 중개자(universal store)가 존재할 것이기 때문이다.
AI가 컴퓨터를 사용하는 방법을 완전히 바꿀 것이다. - 빌게이츠의 에이전트

특히, Large Language Models(LLMs)의 사용에서는 전통적인 zero-shot 모드(*에세이를 처음부터 끝까지 작성하도록 요청하는 등 단일 요청)보다 에이전트 워크플로우를 통해 훨씬 더 나은 결과를 얻을 수 있다는 것이 입증되었습니다.

예를 들어, GPT-3.5는 단독으로 사용했을 때 48.1%의 정확도를 보이지만, 에이전트 루프로 구성할 경우 최대 95.1%의 정확도를 달성할 수 있습니다.

에이전트 워크플로 예시 :
더 많은 정보를 수집하려면 어떤 웹 검색이 필요한지 결정하세요.
첫 번째 초안을 작성합니다.
근거 없는 주장이나 관련 없는 정보를 찾으려면 첫 번째 초안을 읽어보세요.
발견된 문제점을 고려하여 초안을 수정합니다.

한편, Stanford의 연구팀은 저비용의 LLM을 순차적으로 호출하여 비용을 절감할 수 있는 FrugalGPT 방법을 제안했습니다. 이 방법은 세 개의 LLM을 선택하고 순서대로 배열하여 각 데이터셋마다 올바른 결과를 생성하는 비율을 최대화합니다. 이를 통해, 가장 정확한 LLM과 비교하여 각각 98.3%, 73.3%, 59.2%의 비용을 절감할 수 있음이 입증되었습니다.

이러한 연구 결과는 많은 팀들이 비용과 품질, 그리고 속도의 균형을 위해 단일 모델을 선택하는 현재의 접근 방식에 대한 중요한 대안을 제시합니다. 특히, 모든 질의가 GPT-4 수준의 고성능 모델을 필요로 하는 것은 아니므로, 이제 우리는 적절한 프롬프트에 대해 적합한 모델을 선택할 수 있게 되었습니다.

그리고 이에 따라서 GPT5모델과 AI agent를 공개하겠다는 OpenAI에게도 기대가 커지고 있습니다.

한편, 부정적인 시선에서는 아직까지 Auto agent나 데빈 등이 아직 실제로는 그만큼 성능이 기대에 미치지 못했기에 실망했었다는 이야기가 나왔고

그래서 제 개인적인 추측으로는, 완전한 AI agent를 내어 GPTs 스토어 자체도 필요 없어지는 것은 아닐 것 같고 사용자가 만든 커스텀 GPTs 챗봇들과 연계하여 시너지를 내는 agent를 내지 않을까 추측하고 있습니다.

제 개인적인 예상은 기업용 LLM Enabler | Alli | 올거나이즈 - Allganize 앱 빌더나

뤼튼 스튜디오 프로 베타테스터 신청 처럼 여러가지 기존 GPTs 스토어의 챗봇들을 체인 형태로 실행하는 workflow를 사용자가 만들거나 자동으로 불러와서 수행하는 형태가 되지 않을까 생각하고 있습니다.

즉, 완전히 자율적인 워크플로우를 생산하게 하는 것보다 이미 기존 유저들이 만들어진 챗봇을 연계 실행할 수 있도록 하여, 보완 된 AI agent가 곧 소개될 것으로 예상하며..

...그러니까 결론은 GPTs 스토어 방치하지말고 얼른 수익정책도 내주고 그랬으면 좋겠네요 ㅎㅎ

개인적인 추측인데 다들 어떻게 생각하시는지 댓글로 남겨주세요!