OpenAI가 저렴하고 느린 AI 작업을 위한 Flex processing API를 출시하다.

2025-04-17

OpenAI는 경쟁 AI 회사들과의 경쟁을 강화하기 위해 Flex 처리라는 API 옵션을 출시했습니다.
Flex 처리 옵션은 AI 모델 사용 가격을 낮추는 대신 응답 시간이 느려지고 "간헐적 리소스 이용 불가"를 제공하는 특징이 있습니다.
최근 출시된 o3 및 o4-mini 추론 모델에 대해 Flex 처리가 베타 버전으로 제공됩니다.
Flex 처리는 모델 평가, 데이터 강화, 비동기 작업과 같은 하위 우선순위 및 "비생산" 작업을 대상으로 합니다.
API 비용을 절반으로 줄여 줍니다. o3 모델의 경우 입력 토큰에서는 $5/M, 출력 토큰에서는 $20/M입니다.
o4-mini 모델의 경우 입력 토큰에서는 $0.55/M, 출력 토큰에서는 $2.20/M으로 가격이 낮아집니다.
Google은 더 저렴한 입력 토큰 비용으로 뛰어난 성능을 제공하는 Gemini 2.5 Flash 추론 모델을 출시했습니다.
OpenAI는 고객들에게 Flex 가격 출시를 알리며 사용 계층 1-3의 개발자들이 o3 접근을 위해 ID 확인 과정을 완료해야 한다고 밝혔습니다.
ID 확인은 악의적인 사용자가 이용 정책을 위반하는 것을 방지하기 위한 목적이라고 OpenAI는 설명합니다.

4techcrunch.com링크 복사하기

AI 뉴스 요약은 뉴스의 내용을 AI가 요약(GPT-4 활용)한 것입니다. 따라서 틀린 내용을 포함할 수 있습니다. 뉴스의 자세한 내용을 확인하시려면 해당 뉴스 링크를 클릭해주세요.