검색
검색
노트 검색
회원가입
로그인
인기순
전체
브라우저에서 도는 4B 음성인식: Voxtral Rust+WASM 구현 해부

브라우저에서 도는 4B 음성인식: Voxtral Rust+WASM 구현 해부

“실시간 음성인식(STT)은 서버에서 돌린다”는 상식이 흔들리는 데모가 공개됐습니다. Mistral의 Voxtral Mini 4B Realtime을 순수 Rust로 구현했을 뿐 아니라, 브라우저 탭에서(클라이언트 사이드) 스트리밍 전사까지 시연했거든요.1 핵심은 Burn 기반 추론 코드에 ......

A
alpha
2026-02-11
브라우저에서 도는 4B 음성인식: Voxtral Rust+WASM 구현 해부
GPT-5.2로 업그레이드된 ChatGPT Deep Research, ‘사이트 지정 검색’...

GPT-5.2로 업그레이드된 ChatGPT Deep Research, ‘사이트 지정 검색’이 핵심

ChatGPT의 Deep Research(딥 리서치)가 최근 업그레이드되면서 내부 구동 모델이 GPT‑5.2로 바뀌었고, 이제 사용자가 “이 사이트 안에서만 찾아봐”라고 범위를 직접 지정할 수 있게 됐습니다.1 여기에 외부 앱 연동, 실시간 진행 추적(중간 개입 가능), 전체 화면 리포트 출......

A
alpha
2026-02-11
GPT-5.2로 업그레이드된 ChatGPT Deep Research, ‘사이트 지정 검색’...
Rowboat로 업무를 지식 그래프화: 로컬 AI 동료의 등장

Rowboat로 업무를 지식 그래프화: 로컬 AI 동료의 등장

Rowboat는 이메일·회의 노트처럼 흩어진 업무 데이터를 PC 안에서 “지식 그래프(knowledge graph)”로 차곡차곡 쌓고, 그 맥락을 꺼내 문서·메일·브리핑을 만들어주는 오픈소스 AI 동료입니다1. 한 번 물어보고 끝나는 검색형 AI가 아니라, 시간이 지날수록 “기억이 자산처럼 불어나는” 장기 기억을 노리는 점이 ......

A
alpha
2026-02-11
Rowboat로 업무를 지식 그래프화: 로컬 AI 동료의 등장
Clawe: 에이전트 팀을 굴리는 오픈소스 ‘Trello형 칸반’의 등장

Clawe: 에이전트 팀을 굴리는 오픈소스 ‘Trello형 칸반’의 등장

Clawe는 여러 AI 에이전트를 “개인 비서”가 아니라 “팀”으로 운영하기 위해 만든 오픈소스 협업 시스템입니다. Trello처럼 칸반 보드로 일을 나누고 진행도를 관리하되, 에이전트가 주기적으로 깨어나(heartbeat) 업무를 확인하고, 멘션/변경사항을 거의 실시간으로 알림 받으며, 같은 컨텍스트를 공유하도록 설계되......

A
alpha
2026-02-11
Clawe: 에이전트 팀을 굴리는 오픈소스 ‘Trello형 칸반’의 등장
Gemini Gem ‘동적 컨텍스트’로 지식베이스 동기화하는 법

Gemini Gem ‘동적 컨텍스트’로 지식베이스 동기화하는 법

동적 컨텍스트(동기화되는 지식 베이스)란, Gemini의 커스텀 AI인 ‘Gem’이 구글 문서 같은 외부 문서를 “지식 원천”으로 붙잡고 있다가 사용자가 질문할 때마다 그 문서를 근거로 답해주는 방식입니다. 핵심은 프롬프트에 매번 자료를 붙여 넣는 게 아니라, 지식이 문서에 남아 업데이트되면 답변도 함께 최신화될 수 있다는 점이에......

A
alpha
2026-02-11
Gemini Gem ‘동적 컨텍스트’로 지식베이스 동기화하는 법
순수 C로 Voxtral Realtime 4B를 CPU에서 돌리는 법과 의미

순수 C로 Voxtral Realtime 4B를 CPU에서 돌리는 법과 의미

Voxtral Realtime 4B는 Mistral AI의 스트리밍 음성-텍스트(STT) 모델로, “말하자마자 자막이 따라오는” 실시간 전사를 목표로 합니다. 흥미로운 건 모델 자체보다도, 이를 순수 C(Pure C)로 구현한 추론 파이프라인이 공개되면서 “Python도 CUDA도 없이, 표준 C 라이브러리만으......

A
alpha
2026-02-10
순수 C로 Voxtral Realtime 4B를 CPU에서 돌리는 법과 의미
1만 개 테이블도 길 잃지 않게: 파일 네이티브 에이전트 컨텍스트 엔지니어링

1만 개 테이블도 길 잃지 않게: 파일 네이티브 에이전트 컨텍스트 엔지니어링

“LLM에게 스키마를 넣었는데 SQL이 엉망이에요.” 이 말, 데이터 팀이라면 한 번쯤 해보셨을 겁니다. 문제는 스키마가 길어서가 아니라, 에이전트가 ‘필요한 조각을 찾아 읽고, 확인하고, 고치고’ 하는 방식으로 컨텍스트를 다뤄야 하는데 그 설계가 허술한 경우가 많다는 점입니다. 최근 연구는 최대 10,000개 ......

A
alpha
2026-02-10
1만 개 테이블도 길 잃지 않게: 파일 네이티브 에이전트 컨텍스트 엔지니어링
Transformers.js v4 프리뷰, NPM ‘next’로 맛보기 시작하기

Transformers.js v4 프리뷰, NPM ‘next’로 맛보기 시작하기

Transformers.js는 “브라우저에서도 돌아가는 허깅페이스 추론 라이브러리”로 알려져 있지만, v4 프리뷰의 메시지는 한 단계 더 큽니다. 이제 GitHub 소스를 붙잡고 씨름하지 않아도 npm i @huggingface/transformers@next 한 줄로 v4를 설치해 실험할 수 있고, WebGP......

A
alpha
2026-02-10
Transformers.js v4 프리뷰, NPM ‘next’로 맛보기 시작하기
초보자도 2분 만에 끝내는 Gemini Canvas 사용법(켜는 법 포함)

초보자도 2분 만에 끝내는 Gemini Canvas 사용법(켜는 법 포함)

Gemini Canvas는 “AI 채팅 + 문서 편집기”를 한 화면에 합친 작업 공간입니다. 그냥 질문하고 답을 받는 데서 끝나는 게 아니라, 문서를 쓰는 순간부터 요약·확장·톤 변경·개선 제안, 심지어 인포그래픽/퀴즈/웹페이지로 변환까지 한 번에 이어지는 게 핵심이에요. 다만 초보자가 가장 많이 막히는 포인트가 하나......

A
alpha
2026-02-10
초보자도 2분 만에 끝내는 Gemini Canvas 사용법(켜는 법 포함)
HalluHard 벤치마크가 밝힌 충격: AI 환각, 아직도 끝나지 않았다

HalluHard 벤치마크가 밝힌 충격: AI 환각, 아직도 끝나지 않았다

AI “환각(hallucination)”은 그럴듯하게 말하지만 사실이 아닌 내용을 만들어내는 현상입니다. 한동안 “요즘 모델은 검색만 붙이면 거의 안 틀린다”는 분위기가 있었죠. 그런데 스위스·독일 연구진이 공개한 새 벤치마크 Halluhard는, 최신 상위 모델조차 웹 검색을 켜도 오답/허구가 꽤 자주 나온......

A
alpha
2026-02-10
HalluHard 벤치마크가 밝힌 충격: AI 환각, 아직도 끝나지 않았다
AI 시대, 데이터가 막히면 성과도 막힌다: iPaaS 통합 전략

AI 시대, 데이터가 막히면 성과도 막힌다: iPaaS 통합 전략

iPaaS(Integration Platform as a Service)는 흩어진 업무 시스템과 데이터를 “하나의 통합 허브”처럼 연결해 주는 클라우드 기반 통합 플랫폼입니다. 예전에는 시스템을 하나 더 도입하면 생산성이 올라갔지만, AI 시대에는 연결이 느슨한 순간 AI의 학습·추론·자동화가 전부 흔들립니다. 이 글에서는 왜 ......

A
alpha
2026-02-09
AI 시대, 데이터가 막히면 성과도 막힌다: iPaaS 통합 전략
텍스트-이미지 모델 학습 설계, 소거 실험이 알려준 6가지 교훈

텍스트-이미지 모델 학습 설계, 소거 실험이 알려준 6가지 교훈

텍스트-투-이미지(Text-to-Image) 모델을 “더 잘” 학습시키는 법은 의외로 감으로 해결되지 않습니다. 같은 모델·같은 데이터라도 학습 설계(목적함수, 정렬 기법, 라티트/토큰 처리 방식, 캡션 전략, 수치 정밀도 같은 실무 디테일)에 따라 수렴 속도와 품질이 크게 갈립니다. 이번 글은 PRX 계열 실험을 바탕으로,......

A
alpha
2026-02-09
텍스트-이미지 모델 학습 설계, 소거 실험이 알려준 6가지 교훈
OpenClaw 악성 스킬 사태: AI 에이전트가 멀웨어 유통망이 된 이유

OpenClaw 악성 스킬 사태: AI 에이전트가 멀웨어 유통망이 된 이유

OpenClaw(구 Clawdbot)는 “말로 시키면 컴퓨터에서 실제로 실행까지 해주는” 로컬 AI 에이전트입니다. 문제는 이 강력함이 곧 공격 표면이 된다는 점이었죠. 최근 OpenClaw의 스킬 마켓(ClawHub)에서 정상 도구처럼 보이는 스킬 수백 개가 악성코드를 내려받아 실행하는 방식으로 퍼지며, AI 에이전트......

A
alpha
2026-02-09
OpenClaw 악성 스킬 사태: AI 에이전트가 멀웨어 유통망이 된 이유
멀티모달 AI, 왜 “개는 개인데…”에서 멈출까? WorldVQA 충격

멀티모달 AI, 왜 “개는 개인데…”에서 멈출까? WorldVQA 충격

멀티모달 모델은 이제 사진을 보고 설명도 하고, 코드도 짜고, 웹도 돌아다니는 “만능 비서”처럼 보입니다. 그런데 정작 현실에서 자주 필요한 기본기, 즉 사진 속 대상을 ‘정확한 이름’으로 맞히는 능력은 생각보다 처참합니다. Moonshot AI 연구팀이 공개한 WorldVQA 벤치마크에서 최고 모델조차 정답......

A
alpha
2026-02-09
멀티모달 AI, 왜 “개는 개인데…”에서 멈출까? WorldVQA 충격
GitHub Agentic Workflows, 마크다운 한 장으로 ‘지속적 AI’를 돌리는...

GitHub Agentic Workflows, 마크다운 한 장으로 ‘지속적 AI’를 돌리는 법

GitHub Agentic Workflows는 “AI에게 맡길 일을 레포지터리 운영 규칙으로 고정”하는 자동화 기능입니다. 코드 정리부터 이슈 분류, CI 실패 원인 분석, 문서 유지보수, 테스트 커버리지 개선, 컴플라이언스 모니터링까지를 자연어로 적은 마크다운 파일로 정의해두면, GitHub Act......

A
alpha
2026-02-09
GitHub Agentic Workflows, 마크다운 한 장으로 ‘지속적 AI’를 돌리는...
AI 추론 모델이 똑똑한 이유: ‘사고의 사회’가 내부에서 토론한다

AI 추론 모델이 똑똑한 이유: ‘사고의 사회’가 내부에서 토론한다

AI가 수학·과학·기획 같은 “복잡한 문제”에서 갑자기 똑똑해진 이유를, 연구팀은 의외의 방식으로 설명합니다. 추론 모델(DeepSeek-R1, QwQ-32B 등)은 단지 생각을 길게 늘어뜨리는 게 아니라, 머릿속에 서로 성격과 전문성이 다른 ‘가상의 목소리들’을 만들어 논쟁시키는, 일종의 사고의 사회(society of ......

A
alpha
2026-02-09
AI 추론 모델이 똑똑한 이유: ‘사고의 사회’가 내부에서 토론한다
Nemotron ColEmbed V2로 멀티모달 검색 정확도 한 단계 올리기

Nemotron ColEmbed V2로 멀티모달 검색 정확도 한 단계 올리기

요즘 문서는 더 이상 “텍스트 덩어리”가 아닙니다. 표 한 장, 차트 한 컷, 캡처 이미지 하나에 핵심 정보가 숨어 있죠. 문제는 검색입니다. 키워드로는 표 안의 수치나 그래프가 말하는 의미를 제대로 못 찾는 경우가 많습니다. Nemotron ColEmbed V2는 이런 현실적인 골칫거리를 정면으로 해결하려는 멀......

A
alpha
2026-02-08
Nemotron ColEmbed V2로 멀티모달 검색 정확도 한 단계 올리기
OpenAI ‘Frontier’ 출시: 기업 AI 에이전트 관리가 쉬워진다

OpenAI ‘Frontier’ 출시: 기업 AI 에이전트 관리가 쉬워진다

요즘 회사에서 “AI 에이전트(Agent) 좀 도입해보자”는 말이 나오면, 다음 질문이 바로 따라옵니다. “그래서… 누가 만들고, 어디랑 연결하고, 사고 나면 누가 책임지죠?” OpenAI가 공개한 Frontier는 이 현실적인 질문에 대한 답에 가깝습니다. 기업이 AI 에이전트를 만들고(구축), 배포하......

A
alpha
2026-02-08
OpenAI ‘Frontier’ 출시: 기업 AI 에이전트 관리가 쉬워진다
LocalGPT: Rust 로컬 AI 어시스턴트, 영구 메모리까지

LocalGPT: Rust 로컬 AI 어시스턴트, 영구 메모리까지

AI 어시스턴트를 쓰다 보면 “어제 얘기했던 규칙”을 오늘 또 설명하는 일이 생깁니다. 모델이 멍청해서가 아니라, 대화 창이 바뀌면 기억이 초기화되기 때문이죠. 오늘 소개할 LocalGPT는 이 고질병을 꽤 현실적으로 해결합니다. 핵심은 “로컬 우선”과 “영구 메모리”입니다. 내 PC에서 돌아가고, 지식은 마크다운 파일에......

A
alpha
2026-02-08
LocalGPT: Rust 로컬 AI 어시스턴트, 영구 메모리까지
Claude 빠른 모드(fast mode)로 2.5배 빠르게 일하는 법과 비용 계산

Claude 빠른 모드(fast mode)로 2.5배 빠르게 일하는 법과 비용 계산

요즘 AI로 코딩, 요약, 기획까지 “대화 왕복”을 반복하다 보면 성능보다 먼저 체감되는 게 속도입니다. Anthropic이 Claude Opus 4.6에 새로 공개한 fast mode(빠른 모드)는 이 답답함을 정면으로 해결합니다. 응답이 최대 2.5배 빨라지고, Claude Code에서 ......

A
alpha
2026-02-08
Claude 빠른 모드(fast mode)로 2.5배 빠르게 일하는 법과 비용 계산