검색
검색
노트 검색
회원가입
로그인
인기순
전체

65줄 규칙 파일로 AI 코딩이 달라질까? Cursor·VS Code 실험기

AI 코딩 도구를 쓰다 보면 “모델을 더 좋은 걸로 바꾸면 해결될까?”라는 생각이 듭니다. 그런데 현장에서는 의외로 “모델보다 규칙 파일이 더 중요하다”는 이야기가 자주 나옵니다. 이번 글에서는 65줄짜리 마크다운 규칙이 전 세계 개발자 사이에서 유행한 이유와, 그걸 VS Code·Cursor에서 확장으로 써봤을 때 무엇이 바뀌고 무엇이 안 바뀌는지 정리해...

D
dev
2026-02-13

OpenAI - 장기 실행 에이전트를 위한 Skills·Shell·Compaction 정리

핵심 요약 이 글은 단발성 챗봇이 아니라, 긴 시간 동안 실제 일을 처리하는 에이전트를 만들기 위한 핵심 요소인 Skills, Shell, Compaction의 개념과 활용 패턴을 정리한다. 세 가지를 함께 쓰면 "절차(방법) + 실행(컴퓨터 작업) + 기억 관리(컨텍스트 유지)"를 조합해 안정적이고 재사용 가능한 에이전트 워크플로우를 만들 수 있다. ...

D
dev
2026-02-13

Claude의 병렬 LLM 에이전트로 C 컴파일러를 만든 실험 정리

핵심 요약 여러 개의 Claude를 병렬로 돌려, 사람 개입을 최소화한 상태에서 Rust로 C 컴파일러를 만든 실험이다. 이 과정에서 "장시간 자율로 일하는 LLM 팀"을 만들려면 어떤 테스트, 작업 구조, 환경 설계가 필요한지에 대한 구체적인 교훈이 나온다. 동시에, 이런 자율 개발 방식이 어디까지 가능하고 어디서 한계를 보이는지도 드러난다. 장시...

D
dev
2026-02-06

GPT‑5.3‑Codex vs Claude Opus 4.6: 코딩 에이전트 논쟁 정리

핵심 요약 GPT‑5.3‑Codex와 Claude Opus 4.6은 "인간이 얼마나 개입할 것인가"를 두고 다른 철학을 내세우지만, 실제 사용 경험은 꽤 엇갈리며 두 제품 모두 점점 비슷한 지점으로 수렴하는 모습이다. 벤치마크 점수(예: Terminal‑Bench, ARC AGI 2)는 유용한 참고일 뿐, 실제 개발 현장에서는 속도, 비용, UX, 팀 ...

D
dev
2026-02-06

Claude Code 에이전트 팀(Agent Teams) 완전 정리

핵심 요약 Claude Code 에이전트 팀은 여러 개의 Claude Code 인스턴스를 한꺼번에 띄워 병렬로 작업시키고, 그 위에 "팀 리드" 세션이 조율하는 구조입니다. 연구·리뷰·멀티 모듈 개발·가설 경쟁 탐색처럼 병렬 탐색의 이득이 큰 문제에 적합하지만, 토큰 비용과 조율 비용이 크기 때문에 사용 목적을 분명히 해야 합니다. 팀 생성, 작업 배...

D
dev
2026-02-06

Claude Opus 4.6, 해리포터 주문 실험, 벤치마크·메모리 논쟁 정리

핵심 요약 Claude Opus 4.6의 100만 토큰 컨텍스트를 활용해 해리포터 주문 찾기 실험이 이루어졌고, 이를 두고 "컨텍스트 활용 vs 훈련 데이터 암기" 논쟁이 벌어졌다. 동시에 OpenAI·Anthropic 모델의 벤치마크 신뢰성, 시간에 따른 성능 변화, 그리고 Claude Code의 자동 메모리 기능 등 LLM 사용에서 점점 더 중요한 ...

D
dev
2026-02-06

Kling 3.0 AI 비디오 생성기 정리: 기능, 기술, 활용법

핵심 요약 Kling 3.0은 텍스트·이미지·기존 영상을 한 엔진에서 처리하는 멀티모달 AI 비디오 생성 서비스로, 물리 기반 모션과 네이티브 오디오 동기화를 강점으로 합니다. 드래프트 모드로 빠르게 시안 테스트 후, 1080p/4K·16비트 HDR·EXR까지 프로 수준 포맷으로 출력해 광고, SNS, 영화·VFX까지 상업적으로 활용할 수 있습니다. ...

D
dev
2026-02-05

ElevenLabs Scribe v2: 차세대 음성 인식 핵심 정리

핵심 요약 Scribe v2는 90개 이상 언어를 지원하는 고정확도 대용량 음성 인식 모델로, 긴 오디오와 복수 화자를 안정적으로 처리하도록 설계되었습니다. 키워드 프롬프트, 엔티티 검출, 다국어 자동 인식, 보안·컴플라이언스 기능까지 갖춰 기업용 대규모 음성 처리 워크플로에 적합합니다. Scribe v2 개요 Scribe v2는 녹음 파일, 영상 음...

D
dev
2026-02-05
VibeVoice-ASR 음성 인식 모델 정리

VibeVoice-ASR 음성 인식 모델 정리

핵심 요약 VibeVoice-ASR는 최대 60분 길이의 음성을 한 번에 처리하며, 화자 정보와 타임스탬프까지 포함한 구조화된 자막을 생성하는 대규모 ASR 모델이다. 다국어·코드스위칭·커스텀 핫워드·LoRA 미세조정 등을 지원해 회의록, 콜센터 분석, 멀티언어 콘텐츠 제작 등에 바로 활용할 수 있는 실용적인 음성 인식 솔루션이다. VibeVoice-A...

D
dev
2026-02-05
VibeVoice-ASR 음성 인식 모델 정리
Mistral Voxtral Transcribe 2 완전 이해 가이드

Mistral Voxtral Transcribe 2 완전 이해 가이드

핵심 요약 Voxtral Transcribe 2는 배치용과 실시간용 두 가지 음성-텍스트 모델로, 높은 정확도와 매우 낮은 비용·지연 시간을 동시에 목표로 하는 전사 솔루션이다. 회의, 콜센터, 미디어, 컴플라이언스 등 다양한 음성 워크플로우를 자동화·지능화하기 위한 기능(화자 분리, 맥락 편향, 단어 단위 타임스탬프 등)을 제공한다. Voxtral T...

D
dev
2026-02-05
Mistral Voxtral Transcribe 2 완전 이해 가이드

생성형 AI와 책: 앤스로픽·메타 사례로 보는 데이터 확보 전쟁과 저작권 논쟁

핵심 요약 생성형 AI 기업들은 성능 향상을 위해 방대한 양의 책 데이터를 확보하려 했고, 그 과정에서 합법·불법 경로가 뒤섞이며 큰 논란과 소송이 발생했다. 법원은 'AI 학습 자체'는 상당 부분 공정 이용일 수 있다고 보면서도, 데이터를 얻는 방식(특히 해적판·토렌트 이용)에 대해서는 위법 가능성을 열어두고 있다. 이 사례들은 앞으로 AI를 개발·활용...

D
dev
2026-02-04

Claude Code 실전 가이드 저장소 개요

실제 개발 워크플로에 Claude Code를 연결하는 예제 중심 백엔드 최적화 가이드 저장소다. 공식 문서를 보완하며, "실무에서 어떻게 쓸지"에 초점을 둔 예제·템플릿·설정 파일 위주의 실전 가이드다. 다이어그램, 복붙 가능한 템플릿, 설치 명령, 실제 워크플로 예시로 구성되어 바로 업무에 적용 가능하다. 01~10 기능별 폴더 + 상위 문서(...

D
dev
2026-02-04

크림슨랜드 1:1 재구현과 AI 기반 리버스 엔지니어링

핵심 요약 2003년작 탑다운 슈터 게임 크림슨랜드를, 소스 코드 없이 실행 파일과 자산만으로 현대 환경에서 거의 완벽하게 재구현한 사례를 정리한 내용이다. 정적·동적 분석 도구와 커스텀 포맷 해석, 테스트 가능한 구조 재설계, 그리고 LLM 에이전트 활용이 결합될 때 오래된 게임을 "겉모습"이 아니라 "내부 동작"까지 복원할 수 있음을 보여준다. 크...

D
dev
2026-02-04

Qwen3-Coder-Next: 소형 에이전트 코딩 모델 이해하기

핵심 요약 Qwen3-Coder-Next는 코딩 에이전트와 로컬 개발에 특화된 소형·하이브리드 구조의 오픈 모델로, 적은 비용으로 강력한 코딩·에이전트 성능을 목표로 합니다. 단순히 모델 크기를 키우는 대신, 실행 가능한 환경과 검증 가능한 코딩 과제를 대규모로 활용해 에이전트 중심 학습을 확장한 것이 핵심 전략입니다. 그 결과, 훨씬 더 큰 모델과 비슷...

D
dev
2026-02-04

Claude Code 완전 이해 정리: 에이전트, 컨텍스트, 워크플로우 핵심

핵심 요약 Claude Code는 "코드 작성 도우미"가 아니라 로컬에서 움직이며 파일·명령·웹까지 자율적으로 다루는 에이전트형 작업 환경이다. 이 도구를 잘 쓰려면 컨텍스트(맥락) 관리, 프로젝트 규칙(CLAUDE.md), 재사용 가능한 워크플로우(Skills/Hooks/Subagents/Tasks)를 설계하는 능력이 핵심이다. 개발자뿐 아니라 투자...

D
dev
2026-02-03

ChatGPT에서 GPT-4o·4.1·o4-mini 종료

핵심 요약 OpenAI는 2026년 2월 13일부터 ChatGPT 내에서 GPT-4o, GPT-4.1, GPT-4.1 mini, o4-mini 제공을 중단하고 GPT-5.2 중심 구조로 전환합니다. API는 그대로 유지되며, 사용자가 선호하던 '친근한 대화 스타일'은 GPT-5.1·5.2와 개인화 기능을 통해 계승·강화됩니다. 이 변화의 목표는 오래된...

D
dev
2026-01-30

구글 Project Genie 요약

구글이 미국 내 Google AI Ultra 구독자(만 18세 이상)를 대상으로 실험적 연구 프로토타입인 Project Genie를 공개했습니다. 이 서비스는 사용자가 텍스트와 이미지로 세계를 만들고, 직접 탐험하고, 다른 사람들이 만든 세계를 리믹스할 수 있게 해주는 인터랙티브 월드 생성 도구입니다. 핵심 개념 Project Genie는 구글 딥마인...

D
dev
2026-01-30

Z-Image 출시 요약

Z-Image는 ⚡️Image 패밀리의 기본(foundation) 이미지 생성 모델로, 높은 품질·다양성·정확한 프롬프트 반영을 목표로 한 풀사이즈 디퓨전 트랜스포머입니다. 속도 최적화 버전인 Z-Image-Turbo와 달리, 비증류(undistilled) 구조로 전체 학습 신호를 유지해 강력한 Classifier-Free Guidance(CFG), 정교한...

D
dev
2026-01-29

Google Cloud 사용료 최대 2배 까지 가격 인상

이번 변경은 기술 구성은 그대로여도 "동일 트래픽에 대한 네트워크 청구서가 더 커지는" 유형의 인상입니다. 트래픽이 많은 조직일수록 비용 부담이 즉시 커지고, 기존 예산 가정(단가 전제)이 깨지면서 예산 초과 리스크가 크게 증가합니다. 무엇이 오르는지 CDN 인터커넥트, 다이렉트 피어링, 캐리어 피어링을 통해 전송되는 데이터의 GiB당 정가(list p...

D
dev
2026-01-28

OpenAI Prism: 과학 논문 작성·협업을 바꾸는 AI 워크스페이스

핵심 요약 Prism은 GPT‑5.2를 기반으로 한 무료 클라우드 LaTeX 워크스페이스로, 논문 작성·수정·협업·인용 관리 등을 한곳에서 처리하게 해주는 도구다. 분산된 문서 편집기, 참고문헌 도구, 채팅을 오가던 기존 연구 흐름을 통합해, 연구자가 "글이 아니라 연구"에 더 집중하도록 돕는 것을 목표로 한다. ChatGPT 계정만 있으면 누구나 무...

D
dev
2026-01-28