오픈AI의 '플렉스 프로세싱': 저렴하면서도 느린 AI 옵션의 매력

2025-04-19 08:12•조회수 49

OpenAI는 최근 경쟁력을 강화하고 사용자들에게 다양한 API 옵션을 제공하기 위해 '플렉스 프로세싱(Flex Processing)'이라는 새로운 API 옵션을 발표했습니다. 이 새로운 옵션은 AI 모델을 사용할 때 더 저렴하게 이용할 수 있지만, 일정한 느린 응답 시간과 자원 가용성 제한이 있을 수 있습니다. 이러한 옵션은 낮은 우선순위 작업에 적합합니다.

Flex Processing이란?

플렉스 프로세싱은 OpenAI API의 새로운 기능으로, 비생산 작업(nucleus production) 또는 비실시간 처리 용도로 사용됩니다. 예를 들어 모델 평가, 데이터 보강, 또는 비동기 작업과 같은 이 작업들은 보다 적은 비용으로 진행될 수 있습니다. 이 옵션을 사용하면 기본 API 가격의 절반으로 절감됩니다.

Flex Processing의 비용

두 가지 AI 모델, o3와 o4-mini에 대해 플렉스 프로세싱이 제공되며, 비용은 다음과 같습니다:

o3 모델

입력 토큰 기준: 1백만 입력 토큰당 $5
출력 토큰 기준: 1백만 출력 토큰당 $20

o4-mini 모델

입력 토큰 기준: 1백만 입력 토큰당 $0.55
출력 토큰 기준: 1백만 출력 토큰당 $2.20

이 비용은 표준 API 설정에서는 각각 $10과 $40이고, $1.10과 $4.40보다 훨씬 저렴합니다.

OpenAI의 경쟁력 강화

Google과 같은 회사들이 비용 효율적인 AI 모델을 출시하면서, OpenAI는 Flex Processing을 출시하며 경쟁력을 높이고 있습니다. Google은 Gemini 2.5 Flash 모델을 통해 보다 낮은 비용과 향상된 성능을 제공하고 있어, OpenAI가 Flex Processing으로의 전환을 통해 경쟁하려는 모습입니다.

사용자 감정 ID 검증 도입

사용자가 OpenAI의 서비스를 사용하는 패턴에 따라 특정 서비스 사용을 위해 ID 검증도 추가되었습니다. 이는 악의적인 사용을 방지하고 OpenAI의 정책을 집행하기 위한 조치입니다.

결론

오픈AI의 플렉스 프로세싱은 AI 서비스를 보다 저렴하게 사용할 수 있는 기회를 제공하며 비생산성 작업에 알맞은 옵션입니다. 이를 통해 AI는 더욱 접근 가능하고 활용할 수 있는 도구로 자리 잡을 수 있습니다.