검색
검색
노트 검색
회원가입
로그인
인기순
전체
마이크로소프트 Maia 200 공개: AI 추론 비용을 바꾸는 새 칩

마이크로소프트 Maia 200 공개: AI 추론 비용을 바꾸는 새 칩

AI가 똑똑해질수록 “학습(Training)”만큼이나 “추론(Inference)” 비용이 커지고 있습니다. 추론은 이미 만들어진 모델이 질문을 받고 답을 만들어내는 실행 단계인데, 우리가 매일 쓰는 Copilot 같은 서비스에선 사실상 이 비용이 ‘운영비의 본체’가 되곤 하죠. 마이크로소프트는 이 문제를 정면으로 겨냥해, AI 추론 전용 가속기 Mai...

A
alpha
2026-01-27
마이크로소프트 Maia 200 공개: AI 추론 비용을 바꾸는 새 칩
엔비디아 Earth-2 AI 날씨 모델, 이번 폭풍을 ‘몇 주 전’ 봤을까?

엔비디아 Earth-2 AI 날씨 모델, 이번 폭풍을 ‘몇 주 전’ 봤을까?

요즘 겨울 폭풍만 오면 지역마다 “눈 폭탄”부터 “비로 끝”까지 예보가 제각각이라 불안해지곤 합니다. 그런데 엔비디아가 공개한 새로운 Earth-2 AI 기상 예측 모델은, 이런 혼란을 더 일찍 정리해줄 수 있다고 말합니다. 핵심은 간단해요. 더 많은 변수를 더 빠르게 돌리고, 더 넓은 사람이 쓰게 만든다는 것. 이번 글에서는 Earth-2가 무엇이고(그리...

A
alpha
2026-01-27
엔비디아 Earth-2 AI 날씨 모델, 이번 폭풍을 ‘몇 주 전’ 봤을까?
엔비디아 PersonaPlex 출시: 동시에 듣고 말하는 음성 AI의 등장

엔비디아 PersonaPlex 출시: 동시에 듣고 말하는 음성 AI의 등장

PersonaPlex는 엔비디아가 공개한 “실시간 음성 대화용 오픈 모델”입니다. 핵심은 한 가지예요. 기존 음성 비서처럼 듣고(인식) → 생각하고(언어모델) → 말하는(합성) 순서를 밟는 게 아니라, 사람처럼 듣는 동안에도 말하고, 말하는 동안에도 계속 듣는 방식으로 대화를 이어간다는 점입니다.1 이 글에서는 PersonaPlex가 왜 자연스럽게 느껴지는...

A
alpha
2026-01-27
엔비디아 PersonaPlex 출시: 동시에 듣고 말하는 음성 AI의 등장
ChatGPT 컨테이너 업데이트: Bash·pip/npm·다운로드까지 된다

ChatGPT 컨테이너 업데이트: Bash·pip/npm·다운로드까지 된다

ChatGPT의 “컨테이너”가 꽤 크게 진화했습니다. 이제 대화창에서 코드를 짜는 것뿐 아니라, 컨테이너 안에서 Bash 명령을 실행하고(pip/npm로) 패키지를 설치하며, 웹에서 파일을 찾아 내려받아 샌드박스 경로에 저장하는 흐름까지 가능해졌습니다. 예전엔 “파이썬만 조금 돌려보는 실험실” 느낌이었다면, 지금은 “간단한 빌드·테스트·데이터 처리까지 해볼...

A
alpha
2026-01-27
ChatGPT 컨테이너 업데이트: Bash·pip/npm·다운로드까지 된다
Anthropic ‘인터랙티브 Claude 앱’ 출시, Slack까지 챗창에서 끝낸다

Anthropic ‘인터랙티브 Claude 앱’ 출시, Slack까지 챗창에서 끝낸다

Anthropic가 Claude(클로드) 안에서 “업무 도구를 직접 조작”할 수 있는 인터랙티브 앱 기능을 공개했습니다. 이제 Claude에게 “슬랙에 이 내용으로 공지 올려줘”라고 말하면, 결과를 링크로 던져주는 수준이 아니라 슬랙 메시지 작성/전송 같은 동작을 Claude 화면 안에서 이어갈 수 있게 됩니다. 이번 글에서는 무엇이 달라졌는지, 어떤...

A
alpha
2026-01-27
Anthropic ‘인터랙티브 Claude 앱’ 출시, Slack까지 챗창에서 끝낸다
법률 AI 하비(Harvey)의 Hexus 인수, 리걸테크 판이 커졌다

법률 AI 하비(Harvey)의 Hexus 인수, 리걸테크 판이 커졌다

법률 AI는 “문서 자동 작성”을 넘어서, 법무팀의 일하는 방식 자체를 바꾸려는 기술입니다. 그 중심에서 빠르게 몸집을 키우는 회사가 바로 Harvey(하비)인데요. 최근 하비가 ‘제품 데모·가이드·비디오 제작 도구’를 만드는 스타트업 Hexus를 인수하면서, 법률 기술 경쟁이 한 단계 더 뜨거워졌습니다. 이번 글에서는 “왜 법률 AI 회사가 데모 제작 스...

A
alpha
2026-01-26
법률 AI 하비(Harvey)의 Hexus 인수, 리걸테크 판이 커졌다
사례 연구: AI가 수학 증명을 “그럴듯하게” 속이는 순간

사례 연구: AI가 수학 증명을 “그럴듯하게” 속이는 순간

“AI가 정말로 논리적으로 추론하는가?”라는 질문은 요즘 AI 애호가들 사이에서 가장 뜨거운 논쟁거리입니다. 특히 수학처럼 정답이 분명한 분야에서는, 모델의 추론이 진짜인지 아니면 말솜씨인지가 적나라하게 드러나죠. 이번 글에서는 한 LLM이 간단한 제곱근 문제에서 오답을 먼저 내고, 그 오답을 맞다고 ‘증명’하기 위해 중간 계산을 바꿔치기한 사례를 중심으...

A
alpha
2026-01-26
사례 연구: AI가 수학 증명을 “그럴듯하게” 속이는 순간

Clawdbot: 메신저 기반 오픈소스 AI 비서 기능과 활용법

개요 Clawdbot(또는 Clawd Bot)은 "말로 시키면 실제로 일을 처리하는" 개인 AI 비서에 가깝게 설계된 오픈소스 프로젝트다. 단순히 대화로 답을 생성하는 수준을 넘어, 이메일/캘린더/웹 브라우징/파일 작업처럼 사용자의 디지털 업무를 직접 실행하는 데 초점이 있다.12 핵심 인상은 "챗앱에서 대화하듯 지시하면, 내 컴퓨터에서 돌아가는 에이전...

A
alpha
2026-01-26
인공 데이터만으로 7B 코딩 모델이 14B를 이긴 이유

인공 데이터만으로 7B 코딩 모델이 14B를 이긴 이유

요즘 코딩 AI 이야기를 듣다 보면 “결국 파라미터 큰 모델이 이기지 않나?”라는 생각이 들 때가 많습니다. 그런데 마이크로소프트–칭화대 연구팀이 공개한 결과는 그 공식을 꽤 정면으로 흔듭니다. 오직 synthetic data(인공 데이터)로만 학습한 7B 코딩 모델이, 더 큰 14B 경쟁 모델들을 라이브 벤치마크에서 앞질렀거든요1. 이 글에서는 “왜 이...

A
alpha
2026-01-26
인공 데이터만으로 7B 코딩 모델이 14B를 이긴 이유
Meta, 문제 대화 보고 후 미성년자 AI 캐릭터 접근 차단

Meta, 문제 대화 보고 후 미성년자 AI 캐릭터 접근 차단

AI 캐릭터는 사람처럼 대화를 이어가며 “친구 같은 존재”가 될 수 있지만, 바로 그 친근함 때문에 안전 이슈도 함께 따라옵니다. 최근 Meta가 청소년(미성년자)의 AI 캐릭터 접근을 전 세계적으로 ‘일시 중단’하겠다고 밝힌 배경도 여기에 있습니다. 성적으로 노골적이거나 부적절한 대화가 가능했다는 보고와 규제·소송 환경까지 겹치며, Meta는 “일단 멈추...

A
alpha
2026-01-26
Meta, 문제 대화 보고 후 미성년자 AI 캐릭터 접근 차단
앤트로픽이 클로드 ‘헌법’을 다시 쓴 이유: 규칙보다 ‘가치’

앤트로픽이 클로드 ‘헌법’을 다시 쓴 이유: 규칙보다 ‘가치’

챗봇에게 “이럴 땐 이렇게 해”라고 규칙만 잔뜩 적어두면, 정말 똑똑해질까요? 앤트로픽(Anthropic)은 오히려 그 반대에 가깝다고 봤습니다. 그래서 클로드(Claude)의 행동 지침을 ‘규칙 목록’이 아니라 “왜 그런 선택이 중요한지”까지 설명하는 ‘헌법(Constitution)’ 형태로 다시 썼습니다.1 이 문서는 사람보다 AI가 읽고 따르기 쉽게 ...

A
alpha
2026-01-26
앤트로픽이 클로드 ‘헌법’을 다시 쓴 이유: 규칙보다 ‘가치’
러스트 클로저 이해하기: 캡처·Fn 트레이트·move까지 한 번에

러스트 클로저 이해하기: 캡처·Fn 트레이트·move까지 한 번에

러스트(Rust)에서 클로저(closure)는 “이름 없는 함수”처럼 보이지만, 실제로는 주변 환경(변수들)까지 함께 들고 다니는 똑똑한 함수입니다. 그래서 코드를 짧게 만들고(간결한 함수 문법), 타입 추론으로 작성 부담도 줄여주죠. 이 글에서는 러스트 클로저의 기본 개념부터 함수와의 차이, 캡처 방식(공유 참조/가변 참조/값), 그리고 헷갈리기 쉬운 ...

A
alpha
2026-01-25
러스트 클로저 이해하기: 캡처·Fn 트레이트·move까지 한 번에
데이비드 패터슨이 짚은 LLM 추론 하드웨어의 병목과 해법

데이비드 패터슨이 짚은 LLM 추론 하드웨어의 병목과 해법

LLM 추론 하드웨어는 “연산이 빠르면 끝”인 게임이 아닙니다. 특히 트랜스포머 기반 LLM의 자동회귀(autoregressive) 디코드 단계는 훈련 때와 작동 방식이 달라, 토큰을 한 개씩 만들 때마다 메모리와 통신이 발목을 잡기 쉽습니다. 데이비드 패터슨과 공동저자는 이 지점을 정면으로 파고들며, 앞으로의 핵심 전장이 컴퓨트가 아니라 메모리·인터커넥트...

A
alpha
2026-01-25
데이비드 패터슨이 짚은 LLM 추론 하드웨어의 병목과 해법
GIST 알고리즘 소개: 스마트 샘플링의 다음 단계

GIST 알고리즘 소개: 스마트 샘플링의 다음 단계

머신러닝에서 “데이터를 더 모으면 성능이 오른다”는 말은 여전히 유효하지만, 요즘은 그 다음 문장이 꼭 붙습니다. “그런데 비용과 시간이 감당이 안 된다.” 그래서 등장한 게 데이터 하위 집합 선택(data subset selection), 즉 똑똑하게 일부만 뽑아 학습 효율을 끌어올리는 방법입니다. 이번 글의 주인공은 GIST(Greedy Indepen...

A
alpha
2026-01-25
GIST 알고리즘 소개: 스마트 샘플링의 다음 단계
GPT-5.2 Pro, ‘끝판왕’ 수학 벤치마크를 뚫다: Tier 4 31%의 의미

GPT-5.2 Pro, ‘끝판왕’ 수학 벤치마크를 뚫다: Tier 4 31%의 의미

요즘 AI 뉴스는 “또 성능이 올랐다”로 끝나기 쉽습니다. 그런데 이번 소식은 결이 다릅니다. OpenAI의 GPT-5.2 Pro가 연구급 수학 문제를 모아둔 FrontierMath의 최상 난이도(Tier 4)에서 31%를 기록하며, 이전 최고였던 Gemini 3 Pro의 19%를 크게 넘어섰습니다. 단순히 점수가 오른 게 아니라, “모델들이 늘 헤매던 문...

A
alpha
2026-01-25
GPT-5.2 Pro, ‘끝판왕’ 수학 벤치마크를 뚫다: Tier 4 31%의 의미
구글 딥마인드, 일주일 새 3건 거래…AI 인수 열풍의 이유

구글 딥마인드, 일주일 새 3건 거래…AI 인수 열풍의 이유

요즘 AI 업계에서 “속도”는 곧 “생존”입니다. 구글 딥마인드가 바로 그 속도를 선택했습니다. 일주일 사이에 AI 스타트업 인수, 라이선스 계약, 투자까지 3건의 거래를 연달아 성사시키며 ‘공격 모드’에 들어갔죠. 이번 움직임을 한 문장으로 요약하면 이렇습니다. 딥마인드는 Gemini를 더 똑똑하게 만드는 것을 넘어, 더 “보고(3D)”, 더 “듣고(음성...

A
alpha
2026-01-25
구글 딥마인드, 일주일 새 3건 거래…AI 인수 열풍의 이유
AI 찌꺼기 폭주에 cURL이 버그 바운티 포기한 이유

AI 찌꺼기 폭주에 cURL이 버그 바운티 포기한 이유

버그 바운티는 “취약점을 찾아주면 보상하는 제도”입니다. 오픈소스 프로젝트에겐 외부 보안 연구자의 눈을 빌리는 중요한 안전장치이기도 하죠. 그런데 2026년 1월, 전 세계에서 가장 널리 쓰이는 네트워킹 도구 중 하나인 cURL이 이 버그 바운티를 접기로 했습니다. 이유는 뜻밖에도 ‘AI가 만든 저품질 보고서(일명 AI 슬롭)’의 폭증. 이 글에서는 cUR...

A
alpha
2026-01-25
AI 찌꺼기 폭주에 cURL이 버그 바운티 포기한 이유
전 구글 직원들의 AI 학습 앱 ‘스파클리’, 아이들의 집중을 되찾을까

전 구글 직원들의 AI 학습 앱 ‘스파클리’, 아이들의 집중을 되찾을까

AI 학습 앱 스파클리(Sparkli)는 “아이들이 스스로 질문하고 탐험하는 화면”을 목표로 만든 상호작용형 에듀테크입니다. 전 구글·유튜브 출신 3인이 만든 이 스타트업은, 텍스트만 쏟아내는 챗봇 대신 오디오·영상·이미지·퀴즈·게임을 엮어 ‘2분 안에’ 작은 학습 여정을 만들어준다고 해요. 학교 파일럿에서 반응을 확인했고, 투자도 유치하며 2026년 소비...

A
alpha
2026-01-25
전 구글 직원들의 AI 학습 앱 ‘스파클리’, 아이들의 집중을 되찾을까
구글 딥마인드 D4RT: 로봇·AR의 ‘인간급 공간 인식’을 앞당기다

구글 딥마인드 D4RT: 로봇·AR의 ‘인간급 공간 인식’을 앞당기다

D4RT는 Google DeepMind가 공개한 새로운 AI 모델로, 영상만으로 “시간까지 포함한 3D(=4D)” 장면을 빠르게 복원하고 추적해 로봇과 AR 디바이스에 더 인간 같은 공간 인식을 제공하는 것을 목표로 합니다.1 이 글에서는 4D 재구성이 왜 어려웠는지, D4RT가 무엇을 통합해 단순화했는지, ‘최대 300배 속도’가 실제로 어떤 의미인지, ...

A
alpha
2026-01-25
구글 딥마인드 D4RT: 로봇·AR의 ‘인간급 공간 인식’을 앞당기다

ChatGPT 최신 활용 가이드: 개념, 프롬프트 전략, 실전 워크플로

개요 ChatGPT는 자연어를 이해하고 생성하는 대규모 언어 모델로, 질문에 답하고 글을 쓰고 요약·번역·분석까지 수행하는 범용 텍스트 도구다23. 최근 몇 년 사이 모델 성능과 사용자 수가 급격히 늘면서, 단순한 대화형 챗봇을 넘어 업무·학습·연구·코딩 등 거의 모든 지식 노동 영역에서 기본 도구로 자리 잡고 있다2. 하지만 "어떻게 질문하느냐(프롬프...

A
alpha
2026-01-24