30분 후에 무엇이 만들어지나
이 튜토리얼이 끝나면 다음이 동작하는 워크플로우를 갖게 됩니다:
- 주제를 입력하면
- 리서처 에이전트 (Claude) 가 웹에서 자료 수집
- 작성 에이전트 (GPT-4.1) 가 600자 한국어 글 작성
- 검증 에이전트 (Gemini) 가 사실 확인
- 인용 포함 최종 글을 반환
세 에이전트가 서로 다른 모델에서 동작합니다. 이게 핵심입니다 — 단일 모델로는 비용도 품질도 떨어집니다. 이종 에이전트가 강한 이유 참조.
사전 준비
- 마블로 계정 (Free 가능. 멀티 에이전트는 Pro 19,000원/월 이상)
- API 키: Anthropic Claude, OpenAI GPT, Google Gemini
- 30분
1단계 — 보드 만들기 (90초)
마블로에서 "보드" 는 하나의 워크플로우입니다.
- 마블로 로그인 → 새 보드
- 이름:
한국어-글쓰기-파이프라인 - 설명:
리서치·작성·검증 3-에이전트 한국어 워크플로우
끝. 90초.
2단계 — 리서처 에이전트 추가 (5분)
리서처는 사실을 수집합니다. Claude를 씁니다 — 긴 컨텍스트 추론이 가장 강합니다.
- 에이전트 추가 클릭
- 역할(Role):
researcher - 모델:
Claude Opus 4.7 - 시스템 프롬프트:
당신은 리서치 에이전트입니다. 주제가 주어지면 웹에서 가장 권위 있는
출처를 찾아 구조화된 발견사항을 산출하세요.
출력 형식:
- 주제 요약 (2-3문장)
- 5-8개 핵심 주장, 각각 인용 URL 포함
- 출처들 사이에서 의견이 갈리는 2-3개 지점
산문이 아닌 구조화된 발견사항만 출력하세요.
- MCP 도구 추가:
web_search(마블로 기본 제공) - 저장
3단계 — 작성 에이전트 추가 (5분)
작성자는 구조화된 발견사항을 글로 만듭니다. GPT-4.1을 씁니다 — 속도와 유창성에서 강합니다.
- 에이전트 추가
- 역할:
writer - 모델:
GPT-4.1 - 시스템 프롬프트:
당신은 한국어 작성 에이전트입니다. 구조화된 리서치 결과를 받아 600자
한국어 글을 작성합니다.
규칙:
- 제공된 발견사항의 사실만 사용
- 인라인 인용: [출처: URL]
- 결론부터 시작, 배경은 뒤에
- 한 문단에 하나의 아이디어
- "할 수도", "어쩌면" 같은 헷지 표현 금지 (출처가 불확실한 경우만 예외)
- 존댓말 ('-습니다')
- 입력:
researcher의 출력을 받음 - 저장
4단계 — 검증 에이전트 추가 (5분)
검증자는 작성자가 만든 글을 원본 자료와 대조합니다. 결정적으로, 다른 벤더 (Gemini)를 씁니다 — 같은 모델이 작성·검증하면 같은 사각지대를 공유합니다.
- 에이전트 추가
- 역할:
fact_checker - 모델:
Gemini Pro - 시스템 프롬프트:
당신은 사실 검증 에이전트입니다. 두 가지를 받습니다:
1. 원본 리서치 발견사항 (구조화)
2. 작성된 한국어 글
글에 있는 모든 사실 주장에 대해, 발견사항에 그 근거가 있는지 확인하세요.
출력:
- "검증됨" 주장 (발견사항으로 뒷받침됨)
- "근거없음" 주장 (발견사항에 없음 — 삭제 권장)
- "인용누락" 주장 (발견사항에 있지만 인라인 인용 빠짐)
엄격하게 검증하세요. 숫자·날짜·출처 인용이 발견사항과 정확히 일치하지
않으면 플래그하세요.
- 입력:
researcher와writer양쪽에서 받음 - 저장
5단계 — 그래프 연결 (3분)
마블로의 그래프 뷰에서 드래그로 연결:
[입력] → researcher → writer → fact_checker → [출력]
↘____________↗
(리서처 결과가 검증자에게도 흐름)
두 번째 연결 (researcher → fact_checker) 이 독립적 검증을 만듭니다. 검증자가 원본 자료와 작성된 글 양쪽을 보고 차이를 잡아냅니다.
6단계 — 테스트 실행 (5분)
- 테스트 실행 클릭
- 입력:
"한국 AI 에이전트 시장 2026 현황" - 트레이스 뷰에서 각 에이전트 실행 관찰
예상 출력:
researcher: 발견사항 7개 수집, 인용 URL 4개
writer: 612자 한국어 초안 작성
fact_checker:
- 검증됨 7개
- 근거없음 0개
- 인용누락 1개 (주장 #4의 인용 누락)
검증자가 인용 누락을 잡았습니다. 이게 이종 셋업의 가치 — 단일 모델이면 이걸 놓쳤을 가능성이 높습니다.
7단계 — 배포 (2분)
- 배포 클릭
- 웹훅 URL이 발급됩니다
POST로{ "topic": "주제" }전송- 응답:
{ "article": "...", "trace_id": "..." }
끝. 프로덕션 엔드포인트입니다. 버전 관리·트레이스·에이전트별 비용 추적 자동.
무슨 일이 일어났나
- 세 벤더 (Anthropic·OpenAI·Google) 를 한 워크플로우에서 사용 — 이종 (heterogeneous)
- 각 에이전트가 역할에 맞는 모델에서 실행
- 검증자가 작성자와 독립적 (다른 벤더)
- 비용이 에이전트별로 자동 기록
- 모든 프로덕션 요청을 엔드투엔드로 추적 가능
테스트 실행 1회 비용: 약 50원. 단일 모델 동등 비용은 약 120원. 월 1만 회 실행 시 차이가 70만원.
초보자 흔한 실수
실수 1 — 세 에이전트 모두 같은 모델 비용·품질 트레이드오프가 사라집니다. 첫날부터 이종으로.
실수 2 — 두 번째 연결 (researcher → fact_checker) 누락 없으면 검증자가 근거 자료가 없는 상태에서 일관성만 확인합니다. 사실 검증이 안 됩니다.
실수 3 — 모호한 시스템 프롬프트 리서처의 구조화된 출력 형식이 있어야 작성자가 깔끔하게 파싱합니다. 프롬프트의 구체성이 전체 체인에서 효과를 냅니다.
실수 4 — 테스트 실행 건너뛰기 마블로 테스트 뷰가 트레이스를 보여줍니다. 배포 전 1회 실행으로 버그 80%를 잡습니다.
다음에 확장할 패턴
세 에이전트 패턴이 기초입니다. 자주 추가하는 확장:
- 편집자 에이전트 — 톤·스타일 최종 다듬기
- 번역 에이전트 — 다국어 출력 (한국어 ↔ 영어)
- MCP 도구 — 최종 글을 우리 CMS·노션·티스토리에 게시
- 검증 결과 기반 분기 — "근거없음" 주장이 있으면 작성자에게 루프백
각 확장이 그래프에 노드 하나 추가입니다. 패턴이 확장됩니다.
막히면
직접 워크스루를 원하시면 30분 무료 세션 을 신청하실 수 있습니다. 마블로 팀이 귀사의 실제 워크플로우를 함께 설계합니다.
관련 글
마지막 업데이트: 2026-05-19. 마블로 UI는 자주 개선되지만 워크플로우 패턴은 안정적입니다.