OpenAI가 저렴하고 느린 AI 작업을 위한 Flex processing API를 출시하다.
- OpenAI는 경쟁 AI 회사들과의 경쟁을 강화하기 위해 Flex 처리라는 API 옵션을 출시했습니다.
- Flex 처리 옵션은 AI 모델 사용 가격을 낮추는 대신 응답 시간이 느려지고 "간헐적 리소스 이용 불가"를 제공하는 특징이 있습니다.
- 최근 출시된 o3 및 o4-mini 추론 모델에 대해 Flex 처리가 베타 버전으로 제공됩니다.
- Flex 처리는 모델 평가, 데이터 강화, 비동기 작업과 같은 하위 우선순위 및 "비생산" 작업을 대상으로 합니다.
- API 비용을 절반으로 줄여 줍니다. o3 모델의 경우 입력 토큰에서는 $5/M, 출력 토큰에서는 $20/M입니다.
- o4-mini 모델의 경우 입력 토큰에서는 $0.55/M, 출력 토큰에서는 $2.20/M으로 가격이 낮아집니다.
- Google은 더 저렴한 입력 토큰 비용으로 뛰어난 성능을 제공하는 Gemini 2.5 Flash 추론 모델을 출시했습니다.
- OpenAI는 고객들에게 Flex 가격 출시를 알리며 사용 계층 1-3의 개발자들이 o3 접근을 위해 ID 확인 과정을 완료해야 한다고 밝혔습니다.
- ID 확인은 악의적인 사용자가 이용 정책을 위반하는 것을 방지하기 위한 목적이라고 OpenAI는 설명합니다.
4techcrunch.com링크 복사하기
AI 뉴스 요약은 뉴스의 내용을 AI가 요약(GPT-4 활용)한 것입니다. 따라서 틀린 내용을 포함할 수 있습니다. 뉴스의 자세한 내용을 확인하시려면 해당 뉴스 링크를 클릭해주세요.