LangGraph와 CrewAI 중 무엇을 선택해야 하나요?

상태 전이와 분기가 복잡한 워크플로에는 LangGraph가 적합합니다. 역할 기반 팀 협업과 빠른 PoC에는 CrewAI가 유리합니다. 프로덕션에서 엄격한 상태 관리가 필요하면 LangGraph를 우선하세요.

MCP와 A2A의 차이는 무엇인가요?

MCP는 Agent가 외부 도구·리소스에 수직 연결하는 프로토콜입니다. A2A는 Agent끼리 수평으로 태스크를 위임·협업하는 프로토콜입니다. 2026년 프로덕션 표준은 둘을 병용하는 구성입니다.

프로덕션에서 Agent는 몇 개까지 늘려야 하나요?

3~8개가 실용적 상한입니다. 그 이상이면 컨텍스트 오염, 디버깅 난이도, Token 비용 급증이 발생합니다. 필요 시 Agent를 통합하고 MCP 도구 호출로 역량을 확장하세요.

2026 멀티에이전트 AI 아키텍처: 프로덕션 오케스트레이션 완전 가이드

2026년 현재, 단일 LLM Agent만으로 복합 업무 파이프라인을 안정 운영하기 어려운 사례가 급증하고 있습니다. Google Agent Bake-Off에서 멀티 Agent 구성이 단독 대비 최대 6배 성공률, AdaptOrch 연구에서 적응형 오케스트레이션이 12~23% 품질 향상을 기록했습니다. 본 가이드는 MAS 핵심 개념·6대 설계 패턴·LangGraph/CrewAI/AutoGen 선형·MCP+A2A·프로덕션 관측성·함정 회피·결정 트리·2026 트렌드를 비교표와 7단계로 압축 정리합니다.

1. 단일 Agent로는 부족한 이유

PoC 단계의 단일 Agent는 인상적이지만, 프로덕션 워크로드에 올리면 4가지 구조적 한계가 드러납니다.

컨텍스트 병목: 긴 대화 이력·대량 tool 출력이 단일 컨텍스트 윈도를 압박합니다. 128K 토큰이어도 10단계 조사 태스크에서 중간 결과 유실이 빈번합니다.
전문 역량 희석: 하나의 System Prompt에 코드 리뷰·법무 검토·데이터 분석을 몰아넣으면 모든 영역이 얕아집니다. 역할 분리가 품질의 핵심입니다.
직렬 처리 비효율: 독립 3태스크를 1 Agent가 순차 처리하면 병렬 가능 구간까지 대기 시간이 발생합니다. 팬아웃/팬인 패턴으로 40~60% 레이턴시 단축이 가능합니다.
단일 장애점: 1 Agent의 hallucination·tool call 실패가 전체를 멈춥니다. Supervisor-Worker 구성에서는 Worker 단위 리트라이·교체가 가능합니다.

Google Agent Bake-Off(2025) 멀티 Agent 팀이 복합 태스크에서 단독 대비 최대 6배 성공률, AdaptOrch(2025) 동적 토폴로지 전환으로 12~23% 품질 향상 — 핵심은 Agent 수 증가가 아니라 적절한 분할·오케스트레이션입니다.

2. MAS 핵심 개념·3가지 제어 모드

MAS(Multi-Agent System)는 다수의 자율 Agent가 공유 상태·통신 프로토콜·오케스트레이션 계층 아래 협업해 단독으로는 달성 불가능한 목표를 수행하는 시스템입니다. 설계 4원칙:

역할 전문화: Agent당 1개 명확한 책임, System Prompt·도구셋도 이에 한정.
도구 분리: Agent A는 DB 읽기만, Agent B는 쓰기만 — 권한 경계 명확화.
상태 분리: 세션 키·Checkpointer ID·MCP 연결을 Agent 단위로 분리해 컨텍스트 오염 방지.
교체 가능성: Worker Agent는 모델·프로바이더 교체 가능, Supervisor 라우팅 계약은 불변 유지.

제어 모드	특징	적합 시나리오
중앙집중형	1 Orchestrator가 전 태스크 분배·집약	감사 요건 엄격한 금융·의료 플로우
분산형	Agent끼리 직접 협상·위임	창의적 브레인스토밍·탐색적 연구
계층형	Supervisor → Worker → Sub-worker 다층	대규모 코드 생성·다단계 조사 파이프라인

3. 6대 오케스트레이션 설계 패턴

3.1 순차 파이프라인

Agent A → B → C 고정 순서. LangGraph add_edge("researcher", "writer"). 조사 → 초안 → 교정 워크플로에 최적.

3.2 병렬 팬아웃/팬인

Supervisor가 3 Worker에 동시 태스크 분배 후 집약. LangGraph Send API 또는 AutoGen GroupChat. 웹 검색·DB 조회·코드 분석 병렬 실행 시 40~60% 레이턴시 절감.

3.3 계층형 Supervisor-Worker

Supervisor가 태스크 분해·Worker 선정·품질 검사 담당. CrewAI Process.hierarchical 또는 LangGraph conditional edge.

from langgraph.graph import StateGraph, END

def supervisor_node(state):
    if state["needs_code"]:
        return "coder"
    return "researcher"

graph = StateGraph(AgentState)
graph.add_node("supervisor", supervisor_node)
graph.add_node("coder", coder_agent)
graph.add_node("researcher", researcher_agent)
graph.add_conditional_edges("supervisor", supervisor_node)

3.4 Swarm 군집 협업

OpenAI Swarm·AutoGen dynamic group chat 모델. Agent가 P2P 메시지 교환·합의 형성까지 반복. 창의 태스크에 유리하나 프로덕션에서는 정지 조건·최대 라운드(예: 15) 필수.

3.5 블랙보드 아키텍처

공유 메모리(Redis, PostgreSQL JSONB)에 중간 결과 기록, 다수 Agent가 비동기 읽기/쓰기. 야간 배치·장시간 분석 파이프라인에 적합.

3.6 하이브리드

실제 프로덕션 80%는 혼합. Supervisor가 병렬 Worker를 팬아웃하고 결과를 파이프라인 후단 Writer에 전달. LangGraph Subgraph로 서브플로우 모듈화.

4. LangGraph vs CrewAI vs AutoGen 선형 매트릭스

평가 축	LangGraph	CrewAI	AutoGen
상태 관리	Checkpointer 영속화 표준	Task 단위, 커스텀 Memory	Conversation 이력 기반
분기·루프	StateGraph 명시적 제어	Process 유형 제한	GroupChat 동적 참여
학습 곡선	중~고 (그래프 사고 필요)	저 (YAML + Role 정의)	중 (대화 모델 이해)
프로덕션 적합도	★★★★★	★★★☆☆	★★★★☆
PoC 속도	★★★☆☆	★★★★★	★★★★☆
MCP 통합	공식 adapter	커스텀 Tool 래퍼	Function calling 경유

선형 기준: 복잡 상태 전이+프로덕션 SLA → LangGraph. 역할 기반 빠른 PoC → CrewAI. 인간 참여형 대화·코드 실행 루프 → AutoGen v0.4+.

5. MCP + A2A: 수직 도구·수평 Agent 협업

2026 표준 = 「MCP로 아래(도구), A2A로 옆(Agent)」 2계층. 혼동 금지.

MCP: Agent → 외부 도구·DB·API 수직 연결. JSON-RPC 2.0 tools/list, tools/call 통일. MCP 프로토콜 선형 가이드 참조.
A2A: Agent 간 수평 협업. Google Agent Card(역량·엔드포인트 기술)+JSON-RPC 위임. Orchestrator→Worker 태스크 전달.

{
  "name": "code-reviewer-agent",
  "description": "PR diff 보안·품질 리뷰",
  "url": "https://agent.internal/a2a/v1",
  "capabilities": ["streaming", "pushNotifications"],
  "skills": [{ "id": "security-scan", "name": "Security Scan" }]
}

MCP만으로 Agent 간 위임 불가. A2A만으로 DB 연결 불가. 둘 다 병용이 정답 아키텍처.

6. 프로덕션 엔지니어링: 상태·HITL·서킷브레이커·Token 예산

Demo가 돌아도 프로덕션에서 멈추는 원인 대부분은 오케스트레이션 운영 설계 부재. 7단계 랜딩:

유스케이스 분해: 3~8 전문 Agent로 분할, 입·출력 스키마 JSON Schema 고정.
패턴 선정: §3에서 Sequential/Fan-out/Hierarchical 선택, LangGraph StateGraph 코드화.
MCP 연결: Agent당 최소 MCP Server stdio/HTTP. 권한 Agent 단위 분리.
A2A 위임 계약: Agent Card 공개, 태스크 ID·타임아웃·리트라이 정책 JSON-RPC 페이로드 포함.
상태 영속화: LangGraph SqliteSaver 또는 Redis Checkpointer. 프로세스 재시작 후 재개 가능.
Human-in-the-Loop: DB 쓰기·외부 API 과금·메일 발송 전 interrupt_before 승인 게이트.
서킷브레이커·Token 예산: Worker당 최대 3회 리트라이, 세션당 Token 상한(예: 50K input/20K output) middleware 강제.

비용 기준(2026.06): GPT-4.1 계열 5 Agent×10라운드 조사 태스크 $0.80~$2.40/회, DeepSeek V3 $0.05~$0.20/회. Token 예산 없으면 월 청구 예측 불가.

7. 관측성: MAST 장애 분포·분산 트레이스

MAST(CMU, 2024) 프로덕션 장애 분석 — 멀티 Agent 실패 원인 분포:

명세·지시 모호: ~42%
Tool/API 호출 오류: ~28%
Agent 간 협업 실패: ~18%
기타(모델 품질 등): ~12%

지표	알림 임계값	도구
E2E 레이턴시 P95	> 60초	OpenTelemetry + Grafana
Tool call 실패율	> 5%/5분	LangSmith / Langfuse
Token 소비/태스크	예산 120% 초과	커스텀 middleware
LLM-as-a-Judge 품질	< 3.5/5.0	정기 배치 평가
Agent 루프 감지	동일 상태 5회+	StateGraph 사이클 카운터

각 Agent 호출에 trace_id 부여, OpenTelemetry span으로 Supervisor→Worker→MCP tool call 인과관계 시각화. 장애 시 30초 내 「어느 Agent의 어느 tool call이 실패했는지」 특정 — 프로덕션 최소 기준.

8. 흔한 함정: Demo→프로덕션 간극

컨텍스트 오염: 전 Agent가 동일 세션 ID 공유 → Worker A 중간 출력이 Worker B 판단 왜곡. Agent 단위 분리 필수.
무한 루프: Swarm 패턴 정지 조건 미설정 → Agent끼리 「알겠습니다」 영구 교환. 최대 라운드·동일 상태 감지 필수.
과도한 Agent 증식: 10개+ Agent는 디버깅 비용 지수 증가. 3~8개 상한, 부족 역량은 MCP 도구로 보완.
Demo→프로덕션 간극: 로컬 Jupyter 그래프는 Checkpointer·인증·레이트 리밋 없이 24시간 버티지 못함. §6 7단계 전부 통과 후 배포.

9. 선형 결정 트리

태스크 직렬 vs 병렬? → 직렬=Sequential, 독립 구간=Fan-out/Fan-in.
동적 라우팅 필요? → Yes=LangGraph conditional edges 또는 Hierarchical Supervisor.
인간 승인 필요? → Yes=LangGraph interrupt+HITL UI 또는 AutoGen UserProxy.
PoC 기한 1주 이내? → Yes=CrewAI 시작, 프로덕션 전환 시 LangGraph 이식.
외부 도구 연동 주력? → MCP Server 우선 구축 (MCP Server 개발 가이드).
Agent 간 위임 필요? → Yes=A2A Agent Card 설계. No=Supervisor 내부 라우팅으로 충분할 수 있음.
24/7 상시 가동? → Yes=§10 원격 Mac 구성.

10. 2026 트렌드·원격 Mac 24/7 운영

2026 하반기 필수 4트렌드:

연합형 오케스트레이션: 조직 간 Agent Card 레지스트리 공개, 사내·사외 Agent 안전 위임 — 엔터프라이즈 표준으로 급부상.
멀티모달 Agent: 이미지·음성·영상 입력 Worker 팬아웃 — CV·설계 리뷰에서 급증.
적응형 토폴로지: AdaptOrch처럼 실행 중 Agent 수·라우팅 동적 변경 — 연구→프로덕션 이행 단계.
EU AI Act 컴플라이언스: 고위험 AI는 HITL 로그·설명 가능성·데이터 거버넌스 기록 2026.08+ 의무. Checkpointer·감사 로그 선제 설계.

멀티 Agent 오케스트레이션은 LangGraph 그래프·MCP Server군·벡터 DB·OpenTelemetry Collector를 동일 호스트 24/7 가동 전제로 설계하는 게 현실적입니다. 노트북·스팟 VM에서는 Checkpointer 상태 유실, MCP stdio 고아 프로세스, 야간 배치 중단이 빈번합니다.

6패턴·3프레임워크·MCP+A2A 2계층은 로컬 Mac에서도 검증 가능. 그러나 프로덕션 SLA(P95 < 60초, 가용성 99.5%) 충족에는 launchd 상주·통합 메모리 32GB+·SFTP 동기화 설정 관리가 필수입니다.

SFTPMAC 원격 Mac 임대는 Apple Silicon 통합 메모리로 5~8 Agent+복수 MCP Server를 단일 노드에 탑재, macOS 권한 모델로 allowedPaths 도구 sandbox를 구현합니다. OpenClaw 게이트웨이·CI 산출물과 동일 Mac에서 MAS 운영 시 설정 변경→프로덕션 반영까지 SFTP 1동기화로 완결. 멀티 Agent를 「주말 Demo」가 아닌 끊김 없는 프로덕션 파이프라인으로 — 24/7 원격 Mac이 최고 ROI 선택입니다.