10월 5일 주요 AI 뉴스

Claude Sonnet 4.5 출시
Anthropic이 Claude Sonnet 4.5를 출시하며 코딩 벤치마크에서 최고 성능 달성
Sweep Bench, Terminal Bench, Computer Use 벤치마크에서 다른 모델들을 능가하는 성과
컨텍스트 불안과 자기 검증 피드백 루프 등 일부 행동 문제 존재
Gemini Robotics 1.5
Google이 물리적 세계에 AI 에이전트를 도입하는 Gemini Robotics 1.5 모델 발표
VLA 모델로 시각 정보를 모터 명령으로 전환하며 행동 전 사고 능력 탑재
Gemini Robotics-ER 1.5는 Google AI Studio API를 통해 개발자에게 제공
Gemini 2.5 Flash 업데이트
Google이 향상된 지시 준수, 간결성, 다중 모드 기능을 갖춘 Gemini 2.5 Flash 발표
SWE-Bench에서 5% 성능 향상과 함께 토큰 사용량 50% 감소로 효율성 개선
선택적 추론 토큰 지원 및 최신 모델 자동 참조 기능 추가
Microsoft 365 Premium
Microsoft가 Office 앱과 AI 기능을 통합한 Microsoft 365 Premium을 월 $19.99에 출시
ChatGPT Plus와 동일한 가격으로 GPT-4o 기능, 1TB 클라우드 저장공간 제공
Copilot Pro는 판매 중단되지만 기존 사용자는 자동 전환되지 않음
삼성-OpenAI 협력
삼성전자와 SK하이닉스가 OpenAI의 Stargate 프로젝트에 반도체 칩 공급
OpenAI는 매월 최대 90만 개의 반도체 웨이퍼 필요로 한국 기업과 생산 확대
한국에 2개 AI 데이터 센터 설립 협의 중이며 해상 데이터 센터도 검토
Google 아칸소 투자
Google이 2027년까지 아칸소에 40억 달러 투자해 첫 데이터 센터 설립
2,500만 달러 에너지 임팩트 펀드와 600MW 태양열 프로젝트 추진
아칸소 주민 대상 Google AI 과정 및 경력 인증서 무료 제공
Replit 성공 스토리
Replit이 2억 5천만 달러 펀딩으로 기업가치 30억 달러 달성
비전문 사용자 대상 AI 기반 코딩 툴 Replit Agent 출시로 전략 전환
연간 매출이 280만 달러에서 1억 5천만 달러로 급증
Gemini 2.5 Flash Image
Google이 이미지 생성, 편집, 결합 기능을 갖춘 Gemini 2.5 Flash Image 모델 출시
10가지 화면 비율 지원 및 자연어 음성 명령으로 이미지 편집 가능
이미지당 $0.039 가격으로 Gemini API 및 Vertex AI를 통해 이용 가능
Tencent 게임 AI
Tencent가 왕자영요 게임을 통해 전략을 설명하고 실행하는 AI 훈련
Think in Games 프레임워크로 게임 플레이와 전략 설명 능력 통합
소형 Qwen3-14B 모델이 90.91% 정확도로 대형 모델 능가
Alibaba Qwen3 출시
알리바바가 30억 활성 파라미터의 소형 멀티모달 모델 Qwen3-VL 출시
GPT-5-Mini 및 Claude 4 Sonnet과 경쟁 가능한 수준의 성능 제공
HuggingFace, ModelScope 등에서 다운로드 및 알리바바 클라우드 API로 이용 가능
LLM 지식 주입 연구
대형 언어 모델의 효율적 도메인 지식 주입 방법에 대한 연구 발표
과도한 지식 주입 시 기억 붕괴 현상 발견 및 임계 붕괴 지점 확인
소형 모델 분석으로 대형 모델의 최적 지식 주입량 예측하는 스케일링 법칙 제안
ProofOfThought
Z3 정리 증명을 사용하는 LLM 기반 추론 시스템 ProofOfThought 공개
고급 파이썬 API와 저급 JSON 기반 인터페이스 두 계층으로 구성
배치 평가 파이프라인 제공 및 다양한 예제로 사용법 제시
ChatGPT 시장 점유율
ChatGPT가 73.8% 시장 점유율로 AI 시장 지배력 유지하나 작년 87.1%에서 감소
Google Gemini가 6.5%에서 13.7%로 점유율 2배 이상 증가하며 빠르게 성장
DeepSeek 3.9%, Perplexity와 Grok 각 2.0%, Claude 1.8% 점유율 기록