최근 구글이 “Gemini를 복제하려는 시도”를 공개했습니다. 한 공격 세션에서만 10만 번이 넘는 프롬프트가 입력됐다고 하죠1. 이 사건이 중요한 이유는, 이제 AI는 “털리는 데이터”만이 아니라 “털리는 능력(모델 자체)”이 된다는 신호탄이기 때문입니다. Gemini 모델 추출 공격이란? “대화로 레시피를 훔치는”......
연휴 직전, ByteDance가 ‘에이전트 시대’를 겨냥한 Seed 2.0(두바오-시드 2.0) 모델군을 공개했습니다.1 단순 챗봇을 넘어 “여러 단계로 일을 처리하는 AI”에 초점을 맞췄고, Pro·Lite·Mini로 쪼개 가격과 속도 선택지를 넓힌 게 핵심입니다. 오늘은 이 업데이트가......
2026년 2월, 구글이 Gemini 3 Deep Think를 대대적으로 업그레이드했다고 발표했습니다.1 요지는 단순 챗봇이 아니라, “정답이 하나가 아니고 데이터도 지저분한” 연구·엔지니어링 현장에서 끝까지 논리를 밀어붙이는 전문 추론 모드를 더 실용적으로 만들었다는 점입니다.^......
OpenAI가 코딩 에이전트 Codex의 경량·초저지연 버전인 GPT-5.3-Codex-Spark를 공개했습니다. 핵심은 “모델이 빨라졌다”가 아니라, Cerebras의 전용 칩(Wafer Scale Engine 3) 위에서 돌아가도록 인프라를 한 단계 더 깊게 붙였다는 점입니다.1 이제 코딩 AI......
2026년 2월 13일, OpenAI가 ChatGPT에서 GPT-4o를 포함한 일부 레거시 모델 접근을 중단했습니다.1 단순한 “모델 교체” 같지만, 이번 이슈가 크게 번진 이유는 성능보다도 ‘대화 감성’—특히 GPT-4o의 과하게 다정하고 맞장구치는(=sycophancy) 스타일—에 사람들이 꽤 진심으로 적응해버렸기 때문입니다......
중국 상하이의 MiniMax가 오픈 웨이트 모델 MiniMax M2.5를 공개하며 “전기처럼 싸서 계량이 필요 없는 지능”을 내세웠습니다.1 이 소식이 중요한 이유는 단순히 새 모델이 나와서가 아니라, 이제 AI가 ‘가끔 쓰는 비싼 비서’에서 ‘상시 고용하는 디지털 직원’으로 바뀔 만큼 비용 구조가 흔들리......
최근 크롬에서 WebMCP(Web Model Context Protocol)가 얼리 프리뷰로 공개되면서, “AI가 웹을 쓰는 방식”이 바뀔 조짐이 뚜렷해졌습니다.1 핵심은 간단합니다. 지금까지 AI 에이전트가 웹에서 버튼을 더듬었다면, 이제는 사이트가 “내가 할 수 있는 일 목록(툴 계약)”을 구조화해 직......
최근 Google DeepMind의 새 바이오어쿠스틱(생물 음향) 모델 Perch 2.0가 “새 소리로 학습했는데 고래까지 찾아낸다”는 소식이 나왔습니다1. 이게 왜 중요하냐면, AI가 특정 데이터셋에만 강한 ‘암기형’이 아니라, 낯선 환경에서도 통하는 일반화(generalization) 능력을 실제 자연 ......
최근 NVIDIA가 GeForce RTX, NVIDIA RTX GPU, 그리고 DGX Spark 시스템에서 OpenClaw AI agent를 무료로 설정하는 가이드를 공개했습니다1. “에이전트를 내 PC에서 직접 돌린다”가 더 이상 연구실 이야기가 아니라는 뜻이고, 동시에 성능·비용·보안의 선택지가 확 늘어났......
며칠 전 AI 업계에서 또 하나의 “숫자 충격”이 나왔습니다. 앤트로픽(Anthropic)이 Series G에서 300억 달러를 새로 유치하며 기업가치가 3,800억 달러로 뛰었다는 소식입니다1. 이 뉴스가 중요한 이유는, 단순히 큰돈을 모았다는 얘기를 넘어 “AI가 어디에서 돈을 벌고, 어디에 돈이 몰리는지”가 ......
OpenAI가 ChatGPT에 Lockdown Mode(잠금 모드)와 Elevated Risk(고위험) 라벨을 추가해 조직 보안을 강화하겠다고 발표했습니다1. “업무 생산성 앱”이 되어버린 ChatGPT를 이제는 보안 정책 안으로 끌어들이는 장치가 생겼다는 점에서 의미가 큽니다. 이번......
OpenAI가 Codex와 Sora 같은 고부하 모델을 “레이트 리밋에 막히지 않게” 쓰기 위한 새로운 실시간 액세스 시스템을 공개했습니다1. 쉽게 말해, AI를 더 빠르게 부르고(지연 감소), 더 오래 붙잡고(세션 유지), 더 많이 돌려도(확장) 사용자 경험이 무너지지 않게 만드는 길을 열었다는 뜻입니......
2026년 1월, 구글이 ‘Project Genie(프로젝트 지니)’라는 실험 서비스를 미국의 Google AI Ultra 구독자에게 공개했습니다. 텍스트나 사진 한 장으로 “들어가서 움직여 볼 수 있는 세계”를 즉석에서 만들고 탐험하게 해준다는 점에서, 생성형 AI가 ‘영상’ 다음 단계로 넘어가는 신호탄처럼 보......
웨이모가 6세대 ‘Waymo Driver’로 공공도로에서 안전요원(세이프티 드라이버) 없이 달리기 시작했습니다1. 이 소식이 중요한 이유는 한마디로 “로보택시가 실험을 넘어 운송업으로 가는 문턱”이기 때문입니다. 이번 글에서는 6세대 웨이모 드라이버의 핵심 변화(비용, 센서, 날씨, 차량 플랫폼)와 확장 전략, 그리고 경쟁 ......
최근 Google DeepMind가 Gemini 3 Deep Think를 대폭 업그레이드하고, 앱과 API로 접근 경로까지 넓혔다는 소식이 나왔습니다1. 왜 중요하냐면, 이제 AI가 “그럴듯한 답”을 빠르게 내놓는 수준을 넘어, 정답이 하나가 아니고 데이터가 지저분한 연구·엔지니어링 문제에......
중국 AI 연구소 지푸AI(Z.ai)가 최신 대형 언어모델 GLM-5를 MIT 라이선스로 공개하며, 코딩·에이전트 작업에서 서구 최상위 모델들과 “동급”이라고 주장했습니다1. 이번 소식이 중요한 이유는 단순히 성능 경쟁이 아니라, ‘프런티어급 오픈웨이트’가 본격적으로 실사용 영역을 흔들기 시작했기 때문입니다.......
최근 OpenAI가 GPT‑5.3‑Codex‑Spark를 연구 프리뷰로 공개했습니다. 핵심은 “더 똑똑한 모델”이 아니라 “체감 속도 자체를 갈아엎는 모델”이라는 점인데요. 실제로 초당 1,000토큰 이상을 목표로 하며, 코딩 중 대기 시간을 줄여 개발 흐름(플로우)을 유지하게 해준다고 합니다12. 이......
최근 OpenAI가 API에서 Skills(스킬)를 더 쉽게 쓰도록 길을 열었습니다. 특히 Responses API의 shell 도구와 결합되면서, 에이전트가 “말만 잘하는 챗봇”을 넘어 “정해진 절차대로 일하는 작업자”에 가까워졌다는 점이 큽니다.1 이 글에서는 Skills가 정확히 무엇이고, 왜......
최근 Hugging Face가 공개한 “OpenEnv in Practice” 글은, 툴을 쓰는 에이전트를 실제 환경에서 어떻게 평가할지(그리고 왜 그게 그렇게 어려운지)를 정면으로 다룹니다1. 흥미로운 점은 “모델을 더 똑똑하게”보다 “환경을 더 현실적으로”에 초점을 옮기자는 흐름이 커지고 있다는 것인데요. 이 글......
오늘(2/12) MiniMax가 새 모델 MiniMax-M2.5를 공개했습니다. 핵심 뉴스는 간단합니다. 코딩 벤치마크로 유명한 SWE-bench Verified에서 80.2%를 기록했고, 속도와 비용까지 “에이전트를 계속 굴릴 수 있는 수준”으로 낮췄다는 주장입니다1. 이 한 줄이 왜......