Skip to main content
Views 118

Moltbot 완벽 가이드: 로컬 멀티채널 AI 비서 오픈소스 플랫폼 소개

AI 비서를 웹에서만 쓰다가, 진짜 내 컴퓨터 깊숙이 들어와서 파일도 보고 터미널도 돌리고, 메신저까지 대신 챙겨주는 친구가 있다면 어떨까요.

최근에 Moltbot이라는 오픈소스 프로젝트를 보고, 아 이건 그냥 또 하나의 챗봇이 아니라 내 환경 전체를 관통하는 AI 게이트웨이구나 싶어서 꽤 오랫동안 들여다봤습니다.

Moltbot은 로컬이나 개인 서버에 직접 설치해서 쓰는 개인용 AI 비서 플랫폼입니다.
핵심은 두 가지예요.

  • 내 데이터와 환경을 내가 직접 컨트롤할 수 있다는 점

  • 여러 메신저와 기기, LLM들을 하나로 묶는 AI 게이트웨이라는 점

아래에서는 Moltbot이 뭘 할 수 있는지, 기존 ChatGPT 같은 SaaS형 챗봇과 뭐가 다른지, 실제로 어떻게 써볼 수 있는지 정리해봅니다. 중간중간 제가 보면서 느낀 포인트도 같이 적어볼게요.


🦞 Moltbot, 대체 뭐 하는 AI냐

Moltbot을 한 줄로 말하면 로컬에서 돌아가는 멀티채널 AI 비서 게이트웨이입니다.

일반적으로 우리가 쓰는 AI 비서는 이런 식이죠.

  • 브라우저 열고 특정 사이트 접속

  • 질문 던지고 답변 받음

브라우저 탭을 닫는 순간, 그 AI는 내 삶에서 사라집니다.
내 메신저, 내 파일, 내 캘린더랑은 느슨하게만 연결돼 있거나, 아예 따로 놀죠.

Moltbot이 노리는 지점은 완전히 다릅니다.

  • 실행 위치: 내 로컬 컴퓨터, 집 서버, 개인 VPS

  • 접속 채널: WhatsApp, Telegram, Slack, Discord, iMessage, Signal, Teams, WebChat 등

  • 두뇌: Claude, GPT, 로컬 LLM(Ollama 등)을 상황에 맞게 연결

즉, AI는 어디에나 있지만, 그 중심은 내가 가진 장비라는 점이 핵심입니다.

이 관점에서 Moltbot은 단순한 챗봇이 아니라 AI 라우터에 가까운 느낌입니다.
여러 메신저에서 들어오는 메시지를 받고, 적절한 LLM과 스킬을 붙여서 처리하고, 다시 그 채널로 결과를 돌려보내는 구조죠.

공식 설명이 궁금하면 여기에서 한 번 훑어보세요.


⚖️ SaaS형 챗봇 vs Moltbot: 철학부터 다르다

제가 Moltbot을 보면서 가장 마음에 들었던 포인트는 아키텍처 철학이었습니다.

일반적인 SaaS형 AI 서비스는 이런 구조입니다.

  • 모든 연산과 데이터 처리가 서비스 제공자 서버에서 수행

  • 우리가 할 수 있는 건 그들이 열어둔 웹/앱 인터페이스 안에서 대화하는 것

  • 파일, 계정, 작업 범위 모두 플랫폼이 허용한 수준까지만

반면 Moltbot은 완전히 반대로 가죠.

  • 실행 주체: 사용자 본인

  • 위치: 로컬 PC, NAS, 라즈베리파이, VPS 등 아무 데나

  • 권한: 로컬 파일, 네트워크 장비, OS 레벨 제어까지

즉, 기존 AI가 텍스트 생성 도구에 가깝다면, Moltbot은 내 컴퓨터를 대신 조작하는 대리인에 가까운 겁니다.

개인적으로 이 구조가 마음에 드는 이유는 두 가지입니다.

첫째, 데이터 주권.
내 일정, 문서, 로그, 서버 정보 같은 것들을 외부 서비스에 전부 올려두는 게 은근히 찝찝했는데, Moltbot은 기본적으로 내 장비 안에 데이터가 머물게 설계되어 있습니다. 물론 연결하는 LLM API에는 일부 정보가 나가겠지만, 그 범위를 내가 설계할 수 있다는 게 중요하다고 느꼈습니다.

둘째, 접근 채널 통합.
일하면서 Slack으로 AI를 쓰다가, 퇴근길엔 텔레그램, 집에선 iMessage… 이런 식으로 채널을 바꾸면 보통 맥락이 끊기죠. Moltbot은 하나의 게이트웨이를 중심으로 여러 채널이 붙기 때문에 같은 AI가 나를 계속 따라다니는 느낌을 줍니다.

예를 들어 이런 식이 가능해집니다.

  • 회사에서 Slack으로
    오늘 회의록 정리해줘, 관련 파일은 이 채널에 올려둘게

  • 퇴근길 텔레그램에서
    아까 회의록 요약한 거, 결론만 다시 음성으로 읽어줘

  • 집 소파에서 iMessage로
    내일 오전 일정까지 캘린더에 반영해줘

이 전체 경험이 하나의 AI 비서를 통해 이어지는 거죠.


🧠 게이트웨이 구조: AI가 드나드는 관문 하나 두기

Moltbot 시스템의 심장부는 Gateway입니다.
Node.js 기반 서버 앱으로, 모든 채널과 노드, LLM 호출이 여기로 모입니다.

구조를 간단히 정리하면 이렇습니다.

  • 여러 메신저 채널: WhatsApp / Telegram / Slack / Discord / Google Chat / Signal / iMessage / Teams / Matrix / Zalo / WebChat 등

  • 게이트웨이: 로컬에서 실행되는 Node.js 서버

  • 클라이언트들: macOS 앱, iOS/Android 앱, WebChat, CLI 등

  • 두뇌: Claude, GPT, 로컬 LLM, 기타 백엔드 모델들

게이트웨이는 단순 API 프록시가 아니라 컨트롤 플레인 역할을 합니다.

  • 어느 채널에서 온 요청인지 파악하고

  • 누가 보낸 메시지인지 인증하고

  • 어떤 모델/스킬을 써야 할지 결정하고

  • 결과를 어디로, 어떤 형식으로 돌려보낼지 관리

여기서 중요한 포인트 하나.
아무나 이 게이트웨이에 접근할 수 있으면 그냥 보안 구멍이죠.

그래서 Moltbot은 페어링 시스템을 씁니다.

  • 설치 시 페어링 코드가 만들어짐

  • 내가 원하는 메신저 계정에서 이 코드를 이용해 연결

  • 인증된 사용자만 명령을 내릴 수 있음

AI에게 내 파일 시스템과 터미널을 맡길 거라면, 이 정도 인증 장치는 필수라고 느꼈습니다.

게이트웨이 구조에 대한 자세한 개념 설명은 문서에서 잘 풀어놨어요.


📱 기기 확장: macOS, iOS, Android가 전부 눈과 손이 된다

Moltbot이 재미있는 이유는 단순히 서버 하나 띄우고 끝이 아니라는 점입니다.
게이트웨이를 중심으로 노드(Node)앱(App)들이 달라붙는 구조를 갖고 있어요.

macOS 앱: 메뉴바에 상주하는 컨트롤 센터

macOS 앱은 그냥 채팅창이 아니라 거의 리모컨 + 음성 비서 느낌입니다.

  • 메뉴바 상주

  • 음성으로 불러내는 Voice Wake

  • Talk Mode 오버레이로 화면 보면서 대화

  • 로컬이든 원격이든 게이트웨이 제어 가능

실제로 상상해보면, 코딩하다가 손 떼지 않고 음성으로
오늘 만든 코드 요약해서 노션에 정리해줘
라고 얘기하고, 화면 한쪽에 토막 UI로 진행상황만 띄워 보는 느낌이죠.

macOS 앱 관련 문서는 여기 참고해볼 만합니다.

모바일 노드: iOS / Android가 센서 팩처럼

모바일 앱은 말 그대로 노드입니다.
이 노드들이 게이트웨이에 붙으면서, 스마트폰의 기능들이 AI의 눈과 귀가 됩니다.

  • 카메라

  • 화면 녹화

  • 위치 정보

같은 것들을 AI가 사용할 수 있게 되죠. 같은 네트워크에 있으면 Bonjour로 자동 페어링되는 것도 흥미롭습니다.

예를 들면 이런 상상이 가능합니다.

  • 집 밖에서
    폰 카메라로 전기 계량기나 계기판을 찍고
    Moltbot에게 읽어서 기록해두라고 시키기

  • 출근길에
    현재 위치 기준으로 회사까지 예상 도착 시간 계산해서 캘린더 업데이트

문서:

macOS Node Mode: 진짜로 컴퓨터를 조작하게 하기

게이트웨이만 돌리면 아직은 텍스트 중심 비서에 가깝습니다.
하지만 데스크톱을 노드로 등록하면 이야기가 달라집니다.

  • 파일 읽기/쓰기

  • 시스템 알림 띄우기

  • 화면 캡처

  • 쉘 명령 실행

심지어 system.run 같은 명령으로 터미널 작업을 자동화할 수 있기 때문에, 이쯤 되면 진짜 시스템 오퍼레이터에 가까워집니다.

개발자 입장에서 이걸 어떻게 쓰면 좋을까 상상해보면, 예를 들어

  • 매시간 로그 디렉토리 스캔해서 에러 패턴 정리

  • 서버 리소스 상태 체크하고 이상 시 메시지 보내기

  • 코드 저장소 특정 브랜치 빌드 스크립트 돌린 뒤 결과 요약

같은 작업들을 ChatOps 스타일로 만들 수 있을 것 같더군요.


💬 메신저 하나로는 부족하다: 멀티 채널 Inbox

Moltbot이 지원하는 채널 목록을 보고 솔직히 놀랐습니다.

  • WhatsApp

  • Telegram

  • Slack

  • Discord

  • Google Chat

  • Signal

  • iMessage

  • BlueBubbles

  • Microsoft Teams

  • Matrix

  • Zalo / Zalo Personal

  • WebChat

채널 문서는 여기에서 한 번 싹 모아서 볼 수 있습니다.

중요한 건 단순 텍스트만이 아니라는 점입니다. Moltbot은 멀티모달을 전제로 설계되어 있어요.

  • 음성 메모: 받아서 텍스트로 변환, 처리 후 다시 음성으로 응답

  • 이미지: 분석, 설명, 태깅, 문서 스캔 등

  • 문서(PDF 등): 요약, 특정 내용 찾기, 태그 붙이기

예를 들어 이런 시나리오가 자연스럽습니다.

  • 운전 중 텔레그램으로
    오늘 회의록 파일 보냈으니, 중요한 결정사항만 3줄로 요약해서 팀 슬랙 채널에 올려줘

  • Moltbot은
    PDF 분석 → 요약 생성 → Slack API로 팀 채널에 메시지 전송

개인적으로 이런 통합이 진짜 일상에 가까워진 느낌이라 좋았습니다.
이제는 굳이 AI 사이트에 접속해서 파일 업로드하고 기다리는 패턴이 점점 낡아 보이기도 하고요.


🛠 행동하는 AI: 스킬과 도구 시스템이 진짜 핵심

Moltbot의 진짜 매력은 스킬(Skills) 시스템에 있습니다.
LLM 하나에 프롬프트만 잘 던진다고 되는 시대는 이미 넘어가고, 이젠 도구를 잘 붙여서 실제 행동까지 연결해야 하잖아요.

Moltbot의 스킬은 TypeScript로 직접 작성할 수 있고, 기본으로 제공되는 것들도 꽤 많습니다.

시스템 제어 스킬

  • 로컬 파일 읽기 / 쓰기

  • 쉘 명령 실행

  • 시스템 알림

  • 화면 캡처

개발자 입장에선 이걸 조합해 간단한 원격 서버 관리 봇도 만들 수 있습니다.
예를 들면

  • 서버 디스크 용량 90% 이상이면 경고

  • 특정 로그에 에러 문자열 등장 시 슬랙으로 알림

  • 긴 배치 작업 끝나면 결과 요약해서 텔레그램으로 알려주기

웹 브라우징과 자동화

단순 HTTP 요청이 아니라 Puppeteer 기반 브라우저 제어도 가능합니다.
이 말은 곧,

  • 실제 브라우저 세션을 띄우고

  • 클릭, 입력, 스크롤, 파일 업로드

  • 스크린샷 찍기

  • 로그인 상태 유지

같은 게 전부 가능하다는 뜻입니다.

개인적으로 이 부분은 크롬 확장 기반 웹 자동화와 비교해서,
AI의 의사결정과 직접 연결된다는 점이 매력적이었습니다.

관련된 Puppeteer 문서는 여기.

캘린더, 노션, 이슈 트래커 같은 생산성 도구

Moltbot은 구글 캘린더, Linear, Notion 같은 도구와도 연동할 수 있습니다.

사용 예를 상상해보면,

  • 슬랙에서
    내일 오후 3시에 팀 회의 일정 잡아줘. 제목은 백엔드 성능 개선 회의

  • Moltbot이
    Google Calendar API 이용 → 일정 생성 → 링크 다시 슬랙에 공유

이런 식으로 API를 직접 다루는 수고 없이, 대화로 워크플로우를 만들 수 있는 거죠.

Live Canvas와 A2UI: AI가 즉석에서 UI를 만든다

여기서 조금 더 흥미로운 개념이 Live CanvasA2UI (Agent to UI) 입니다.

머릿속에 이런 그림을 떠올리면 쉬워요.

  • 텍스트로 설명하기엔 복잡한 정보가 있을 때

  • AI가 자체적으로 HTML/JS 기반 작은 웹뷰를 만들어

  • 차트, 테이블, 폼 같은 UI를 바로 렌더링

사용자는 그 UI에 클릭이나 입력으로 응답하고,
AI는 다시 그 결과를 활용해 다음 행동을 이어가는 구조입니다.

개인적으로 이 방향이 꽤 설레는 지점이었어요.
지금까지는 우리가 UI를 설계해서 AI를 붙였다면, 앞으로는 AI가 먼저 UI를 제안하고 생성하는 케이스가 늘어날 것 같아서요.


⏰ 자율 에이전트 모드: Cron과 메모리

Moltbot은 요청을 받아서 답만 하는 소극적인 챗봇이 아닙니다.
내장된 기능만 봐도 반자율 에이전트에 가까워요.

Cron 스케줄러

  • 매일, 매주, 매시간 등 특정 시간에

  • 지정된 스킬/작업을 실행

  • 결과를 특정 채널로 전송

예를 들면,

  • 매일 아침 7시에
    주요 IT 뉴스 헤드라인 5개 요약해서 텔레그램으로 보내줘

  • 매시간
    서버 헬스 체크하고 이상 있으면 슬랙 알림

이런 걸 전부 Moltbot 내에서 관리할 수 있습니다.
개인적으로 이 부분은 홈 서버 돌리는 분들에게 특히 매력적일 거라고 생각했습니다.

Persistent Memory: 시간이 흐를수록 똑똑해지는 비서

또 하나 중요한 게 Persistent Memory, 즉 영구 메모리입니다.

  • 과거 대화 내용

  • 사용자 선호도

  • 저장된 정보, 설정값

등을 기록해두고, 필요할 때 다시 꺼내 쓸 수 있습니다.

기존 LLM 기반 서비스들은 대화방 단위로만 기억이 유지되거나,
대부분 세션 중심이라 시간이 지나면 관계가 끊겼죠.

Moltbot은 아예 내 삶을 함께 축적하는 비서로 가려는 느낌이랄까요.
시간이 지날수록 내가 주로 관심 있는 주제, 싫어하는 표현, 자주 하는 작업 패턴을 학습해서 점점 맞춰줄 수 있습니다.


🔐 운영과 보안: 직접 운영하는 만큼 더 중요해진 부분

Moltbot은 내가 직접 돌리는 시스템이라, 운영과 보안도 꽤 신경을 쓴 느낌이었습니다.

배포 방식

  • Docker: 의존성 신경쓰기 싫으면 이게 제일 편합니다.

  • Nix: 선언적 설정 관리, 재현 가능한 인프라 구성이 필요한 사람들에겐 꽤 반가운 옵션.

  • Homebrew: macOS 유저라면 가장 편한 설치 방법 중 하나.

Docker 기반 배포는 특히 초보자에게도 진입장벽을 낮춰줍니다.

원격 접속

로컬 게이트웨이를 외부에서 쓰려면 터널링이 필요하죠.
Moltbot은 여기서도 조금 신경을 쓰고 있습니다.

  • Tailscale Serve / Funnel 지원

  • 토큰/비밀번호 인증 기반 SSH 터널링

개인적으로 Tailscale이랑 궁합이 잘 맞을 것 같다는 생각이 들었고,
집에 라즈베리파이 같은 거 두고 Moltbot을 항상 켜두고, 밖에서는 폰으로 쓰는 구도가 그려졌습니다.

안정성

  • 모델 API 호출 실패 시 자동 재시도

  • 특정 모델 장애 시 다른 모델로 자동 전환

  • 사용량 추적, 비용 모니터링

이런 것들은 운영해본 사람만 아는 고통을 줄여주는 장치라, 보고 좀 반가웠습니다.
특히 여러 LLM 프로바이더를 섞어 쓴다면 필수에 가까운 기능이죠.


🚀 직접 설치해보고 싶은 사람을 위한 스타트 가이드

Moltbot은 Node.js 22 이상이 필요합니다. 이 부분은 꼭 체크해야 합니다.

가장 기본적인 설치 흐름은 이런 느낌입니다.

# Node.js 22 이상 필요
npm install -g clawdbot@latest

# 설치 마법사 실행 (Gateway, 채널, 스킬 설정 포함)
clawdbot onboard --install-daemon

여기까지 하면 대화형 설치 마법사가 뜹니다.

  • 사용할 LLM 제공자 선택 (Anthropic, OpenAI, 로컬 모델 등)

  • API 키 입력

  • 연결할 메신저 채널 선택 및 설정

그 다음 게이트웨이를 실행하고 간단히 메시지 전송 테스트를 해볼 수 있습니다.

# 게이트웨이 실행
clawdbot gateway --port 18789 --verbose

# 메시지 전송 테스트
clawdbot message send --to +1234567890 --message Hello from Moltbot

여기서부터는 각자 환경에 맞게 확장하면 됩니다.

  • 항상 켜둘 서버가 있다면 Docker로 배포

  • 집 NAS나 홈 서버에 띄우고 싶다면 Tailscale이랑 연동

  • Mac을 메인으로 쓰면 Homebrew + macOS 앱 조합


📜 라이선스: 상업용까지 걱정 없이 쓸 수 있을까

Moltbot은 MIT 라이선스입니다.

  • 개인 프로젝트

  • 회사 내부 자동화 도구

  • 상용 SaaS에 내장하는 형태

까지 자유롭게 사용, 수정, 재배포가 가능합니다.

다만 주의할 점 하나.
Moltbot은 프레임워크이고, 실제 두뇌 역할을 하는 LLM들은 각자 별도의 이용 약관과 과금 정책을 가지고 있습니다.

예를 들어,

  • Anthropic Claude API

  • OpenAI GPT API

  • 기타 상용 LLM 서비스

등을 연결한다면 반드시 각각의 약관을 확인해야 합니다.
이건 이미 LLM을 써본 분들은 익숙하실 부분이죠.

라이선스 전문은 여기에서 확인할 수 있습니다.


🔍 개인적으로 느낀 포인트와, 누가 쓰면 좋을지

Moltbot을 처음 봤을 때 든 생각은 이거였습니다.

이건 그냥 챗봇이 아니라,
내 디지털 환경 전체를 관통하는 AI 미들웨어다.

조금 더 정리해보면 이렇습니다.

  1. 개발자 / DevOps / 홈서버 애호가

    • 서버 상태 모니터링, 로그 분석, 배치 작업 자동화

    • Slack/Telegram 기반 ChatOps 환경 구축

    • 집에 NAS나 라즈베리파이 굴리는 사람이라면 특히 어울립니다.

  2. 메신저를 여러 개 쓰는 고인물 유저

    • 카카오톡만 쓰는 환경이면 체감을 못 할 수 있는데,

    • WhatsApp, Telegram, Slack, Discord 등을 섞어 쓰는 사람에겐 통합된 AI 비서가 꽤 큰 가치를 줍니다.

  3. AI로 반복 업무를 줄이고 싶은 파워 유저

    • 회의록 요약 → 캘린더 업데이트 → 노션 정리 → 팀 채널 공유

    • 이런 일련의 연속 작업을 하나의 대화형 워크플로우로 만들고 싶다면 꽤 괜찮은 도구입니다.

개인적으로 가장 마음에 들었던 지점은
AI를 내 환경으로 끌어오는 방향을 택했다는 점입니다.

  • SaaS형 AI: 내가 그들의 플랫폼으로 들어가는 구조

  • Moltbot: AI가 내 플랫폼/환경 안으로 들어오는 구조

장기적으로 보면 후자가 훨씬 건강한 생태계라고 생각합니다.
데이터 주권, 확장성, 커스터마이징, 프라이버시 측면에서요.

물론 현실적으로는

  • 초기 설정 난이도

  • Node.js와 서버 환경에 대한 최소한의 이해 필요

  • LLM API 키 관리, 비용 관리

같은 허들이 있긴 합니다.
그래도 이미 GitHub Actions, Docker, 홈서버 정도는 다뤄본 분들이라면 충분히 접근 가능한 수준이라고 느꼈습니다.


✅ 마무리

개인적으로는 앞으로 이런 로컬 중심, 멀티채널, 에이전트형 프레임워크들이 점점 많아질 거라고 보고 있고, Moltbot은 그 중에서도 꽤 방향성이 선명한 프로젝트라고 느꼈습니다.

관심이 간다면, 한 번쯤 직접 깔아서 내 삶이나 업무에서 어떤 반복 작업을 넘길 수 있을지 천천히 실험해보셔도 좋을 것 같아요.