Опубликовано 12 июня 2026 г.

Сравнение фреймворков для AI-агентов в 2026: DSPy vs Claude Agent SDK vs OpenAI Agents SDK vs CrewAI vs AutoGen vs LangGraph vs Google ADK

Я собрал одного агента на всех семи. Честная матрица: эргономика, мульти-агентность, MCP, вендор-лок — и какой выбрать под твою задачу.

ai-agentsframeworkmodel-comparisonlanggraphcrewaipython

Если ты выбираешь фреймворк для AI-агента в июне 2026, вот короткий ответ. Нужен цикл, который ты полностью контролируешь, с чекпоинтами и human-in-the-loop? LangGraph. Строишь на Claude с файловыми инструментами и MCP? Claude Agent SDK. Хочешь самый маленький и читаемый API, чтобы зашипить сегодня? OpenAI Agents SDK. Собрать команду агентов по ролям за вечер? CrewAI. Оптимизируешь промпт-пайплайн вместо ручного тюнинга? DSPy. Глубоко в Microsoft/Azure или делаешь research-style мульти-агентов? AutoGen. Всё на Google Cloud и Gemini? Google ADK.

Я собрал одного и того же небольшого агента — ответить на вопрос, вызвать два инструмента, передать управление второму агенту — на всех семи. Ниже матрица, минимальный сниппет на каждом и то, о чём не предупреждают: где каждый ломается. А в конце неудобный вывод: в 2026 выбор фреймворка значит меньше, чем слой над ним — обучение, песочница и наблюдаемость. Код актуален на 12 июня 2026; проверяй версии перед стартом — поле переписывается каждый месяц.

Почему это вообще вопрос

Два года назад «фреймворк для агентов» означал LangChain или ничего. В 2026 их десятки, но в проде реально живут семь: DSPy (Stanford), Claude Agent SDK (Anthropic), OpenAI Agents SDK (OpenAI), CrewAI, AutoGen (Microsoft), LangGraph (LangChain) и Google ADK (Google).

Они не взаимозаменяемы. Они стоят на разной высоте. DSPy — это компилятор для LLM-программ. LangGraph — конечный автомат, который ты рисуешь. CrewAI — метафора команды. SDK от Claude и OpenAI — тонкие циклы вокруг моделей одного провайдера. AutoGen и ADK — платформы с мульти-агентным рантаймом внутри. Выберешь не ту высоту — и будешь либо воевать с фреймворком, либо переписывать его половину.

Самая частая ошибка: команда хватает тяжёлую мульти-агентную платформу там, где хватило бы одного агента с тремя инструментами — и тратит спринт на отладку маршрутизации сообщений вместо релиза. Так что до матрицы запомни: большинство «агентов» в проде — это одна модель, один цикл, горстка инструментов. Выбирай сначала под это.

Матрица

Фреймворк	Эргономика	Мульти-агентность	MCP / стриминг	Прод-фичи	Вендор-лок	Лучше всего для
DSPy	Декларативно; пишешь сигнатуры	Через модули (вручную)	Инструменты да; MCP через адаптеры	Оптимизаторы, eval-driven, кэш	Низкий (provider-agnostic)	Оптимизация промпт/агент-пайплайнов
Claude Agent SDK	Крошечный, мнениевый, async	Сабагенты	Нативный MCP и стриминг	Контекст, права доступа, сессии	Высокий (Claude/Anthropic)	Прод-агенты на Claude и кодинг
OpenAI Agents SDK	Самый маленький и читаемый	Handoffs (из коробки)	MCP да; стриминг да	Guardrails, сессии, встроенный трейсинг	Средний (лучше на OpenAI)	Быстрый запуск одиночных и handoff-агентов
CrewAI	Метафора role/goal/backstory	Crews + Flows	MCP через инструменты; стриминг базовый	Flows для детерминизма, память, телеметрия	Средний (свой фреймворк)	Команды по ролям, быстрый прототип
AutoGen	Многословный; actor/event-модель	Главная сила	MCP через ext; стриминг да	Async-рантайм, распределённость, Studio UI	Средний→стек Microsoft	Research и сложный мульти-агентный чат
LangGraph	Явный граф; больше бойлерплейта	Supervisor/граф	MCP-адаптер; стриминг да	Чекпоинты, durable exec, human-in-the-loop	Низкий–средний (OSS)	Stateful-воркфлоу под полным контролем
Google ADK	Чистый, code-first	Иерархия агентов	MCP да; двусторонний стриминг	Vertex Agent Engine, eval, деплой	Высокий (Google Cloud)	Gemini + прод на Google Cloud

TL;DR: «лучшего фреймворка» нет. Есть правильная высота под твою задачу и правильный радиус поражения под терпимость команды к вендор-локу.

Семь фреймворков своими словами (и где каждый ломается)

Каждый сниппет — канонический минимальный агент: модель, инструменты, поехали. Это про форму API, а не готовое приложение; пинь версию, API дрейфует.

DSPy — ты компилируешь промпты, а не пишешь их

DSPy относится к LLM-программе как к чему-то, что ты оптимизируешь, а не тюнишь руками. Ты объявляешь сигнатуру (question -> answer), берёшь модуль (ReAct для инструментов), и оптимизатор подстраивает промпты под метрику.

# pip install dspy
import dspy
 
dspy.configure(lm=dspy.LM("openai/gpt-5.1"))
 
def calculate(expression: str) -> str:
    """Посчитать простую арифметику."""
    return str(eval(expression, {"__builtins__": {}}))  # в проде — песочница
 
agent = dspy.ReAct("question -> answer", tools=[calculate])
print(agent(question="What is 4871 * 209?").answer)

Где ломается: магия оптимизатора требует метрики и датасета. Нет eval-сета — нет профита, и ты просто пользуешься неудобным шаблоном промпта. Плохой выбор для разового агента и лучший — для пайплайна, который ты прогонишь миллион раз.

Claude Agent SDK — прод-цикл со всем в комплекте

SDK от Anthropic (переименованный и обобщённый наследник Claude Code SDK) оборачивает цикл агента поддержкой MCP, файловыми инструментами, правами доступа, сабагентами и автоматической компакцией контекста. Python и TypeScript.

# pip install claude-agent-sdk
import asyncio
from claude_agent_sdk import query, ClaudeAgentOptions
 
async def main():
    options = ClaudeAgentOptions(model="claude-opus-4-8")
    async for message in query(prompt="Который час в Киеве?", options=options):
        print(message)
 
asyncio.run(main())

Где ломается: великолепен на Claude и стена везде, кроме него — это самый высокий вендор-лок в подборке. Если «переедем на модель подешевле в следующем квартале» есть в роадмапе, это реальная цена.

OpenAI Agents SDK — самый маленький API, который делает дело

Лёгкий наследник Swarm. Три примитива: агенты, handoffs, guardrails, плюс сессии и встроенный трейсинг. Беру его, когда хочу читаемый код сегодня.

# pip install openai-agents
from agents import Agent, Runner, function_tool
 
@function_tool
def get_weather(city: str) -> str:
    return f"В {city} ясно, 24°C."
 
agent = Agent(name="Assistant", instructions="Отвечай коротко.", tools=[get_weather])
result = Runner.run_sync(agent, "Какая погода в Лиссабоне?")
print(result.final_output)

Где ломается: работает с другими провайдерами через litellm, но эргономика и трейсинг заточены под OpenAI. Обещание «лёгкости» значит и то, что всё сверх handoffs ты допишешь руками — ни графа, ни durable-состояния.

CrewAI — агенты как команда с ролями

Метафора CrewAI — команда: у каждого агента есть role, goal и backstory; задачи идут последовательно или иерархически. Для детерминизма добавили Flows. Теперь он самостоятельный (без LangChain под капотом).

# pip install crewai
from crewai import Agent, Task, Crew
 
researcher = Agent(role="Researcher", goal="Найти ответ",
                   backstory="Дотошный аналитик.")
task = Task(description="Который час в Киеве?",
            agent=researcher, expected_output="Ответ одной строкой.")
print(Crew(agents=[researcher], tasks=[task]).kickoff())

Где ломается: role/backstory отлично смотрятся в демо и хрупки в управлении потоком. Как только нужно «если X, то маршрутизируй в Y», ты тянешься к Flows — а в этот момент LangGraph честнее.

AutoGen — мульти-агентный рантайм

AutoGen v0.4+ от Microsoft — переписан с нуля: async, событийная модель, actor-модель под высокоуровневым API AgentChat. Он сходится с Semantic Kernel в общий Microsoft Agent Framework, так что проверь, какая точка входа актуальна, до старта.

# pip install autogen-agentchat autogen-ext[openai]
import asyncio
from autogen_agentchat.agents import AssistantAgent
from autogen_ext.models.openai import OpenAIChatCompletionClient
 
async def main():
    client = OpenAIChatCompletionClient(model="gpt-5.1")
    agent = AssistantAgent("assistant", model_client=client)
    print(await agent.run(task="Сколько будет 23 * 47?"))
 
asyncio.run(main())

Где ломается: за мощь платишь — он самый многословный тут, API сильно лихорадило на миграциях v0.2→v0.4→Agent Framework, и куча туториалов в сети всё ещё про старый API. Заложи время на «какую версию я вообще читаю».

LangGraph — рисуешь конечный автомат

LangGraph моделирует агента как граф узлов и рёбер с явным состоянием, чекпоинтами, durable-исполнением и first-class human-in-the-loop. Префаб create_react_agent прячет граф, пока он тебе не понадобится.

# pip install langgraph "langchain[anthropic]"
from langgraph.prebuilt import create_react_agent
 
def get_weather(city: str) -> str:
    """Погода в городе."""
    return f"В {city} ясно."
 
agent = create_react_agent(model="anthropic:claude-sonnet-4-6", tools=[get_weather])
out = agent.invoke({"messages": [{"role": "user", "content": "Погода в Киеве?"}]})
print(out["messages"][-1].content)

Где ломается: префаб простой; настоящий API графа многословный и с кривой обучения. Плюс ты наследуешь всю поверхность LangChain и его привычку переносить вещи между пакетами. Зато выигрыш — пауза, возобновление, инспекция и правка состояния на ходу — несравним, когда он реально нужен.

Google ADK — прод-кит для Gemini

Agent Development Kit — code-first фреймворк за Vertex AI Agent Engine. В теории model-agnostic, на практике Gemini-first: иерархические мульти-агенты, двусторонний стриминг, оценка и путь деплоя в Google Cloud.

# pip install google-adk
from google.adk.agents import Agent
 
def get_weather(city: str) -> dict:
    """Вернуть погоду по городу."""
    return {"status": "ok", "report": f"В {city} ясно."}
 
root_agent = Agent(name="weather_agent", model="gemini-3-pro",
                   instruction="Отвечай на вопросы о погоде.", tools=[get_weather])

Где ломается: гладкий путь идёт через Vertex. Вне Google Cloud ты теряешь деплой/eval — а это половина смысла, и доки исходят из Gemini. Отлично внутри экосистемы, странный выбор снаружи.

Два новичка, за которыми стоит следить

PraisonAI — low-code/быстрая полоса. YAML-воркфлоу, SDK на Python и JS, MCP по stdio/WebSocket/SSE/Streamable HTTP и вирусное заявление «в 1209 раз быстрее LangGraph» при поднятии агента. Цифру из заголовка считай маркетингом (мерили старт, а не throughput задач), но эргономика для простых мульти-агентных задач реально шустрая.
AgentScope — open-source-новичок родом из Китая: agent-oriented programming, визуальный билдер, MCP плюс встроенные память и RAG. Стоит глянуть, если хочешь batteries-included OSS-платформу, не привязанную к американскому облаку.

Я бы пока не ставил на них прод-систему, но оба — честный сигнал, куда движется эргономика: быстрее старт, меньше кода, MCP везде.

Что реально важно: фреймворки коммодитизируются

Вот что удивило после релизов на всех семи: выбор фреймворка становится наименее интересным решением. Минимальные сниппеты выше почти одинаковы — опиши инструменты, опиши агента, гоняй цикл. Эта сходимость и есть улика. Когда у всех «hello agent» выглядит одинаково, фреймворк — коммодити, а ценность переезжает на слой над ним:

Обучение/оптимизация. Agent Lightning от Microsoft обучает любого агента — LangChain, AutoGen, CrewAI, OpenAI SDK — через reinforcement learning почти без правок кода. Активом становится поведение агента, а не фреймворк, в который он вшит.
Безопасность/песочница. AVM (Agent Virtual Machine) и подобное изолируют любой фреймворк на уровне ОС. Агент, который вызывает инструменты, — это поверхность для remote-code-execution; фреймворк это не чинит, чинит слой изоляции. (Серверную сторону смотри в моём чек-листе безопасности self-hosted AI.)
Наблюдаемость. Трейсинг, eval'ы, учёт токенов и стоимости, реплей. В SDK от OpenAI трейсинг встроен; остальные прикручивают LangSmith, Langfuse, Phoenix или Weave. В проде именно это держит тебя на плаву в 3 ночи — об этом в мониторинге прод-агентов.

Один контрарианский тред этой весной сформулировал точно: большинство фреймворков гонятся за расширением контекстного окна, когда настоящая проблема — качество контекста. Следующий проект может выиграть не тот фреймворк, что даёт впихнуть 400 000 токенов, а тот, что помогает скормить модели правильные 4 000.

Так что выбери фреймворк — да. Но реальный инженерный бюджет трать на слой над ним.

Частые грабли (и как я их чинил)

Грабли: тянешь мульти-агентную платформу под задачу для одного агента. Фикс: начни с одного агента и инструментов. Добавляй агентов, только когда один доказуемо не тянет задачу. Большинство «мульти-агентных» демо — театр.
Грабли: копипастишь туториалы под старую мажорную версию (AutoGen и LangChain — рецидивисты). Фикс: смотри версию в импортах, а не дату публикации статьи. Пинь её в requirements.txt.
Грабли: недооцениваешь вендор-лок. Фикс: до старта ответь: «сколько стоит сменить модель/облако через полгода?» Claude Agent SDK и Google ADK делают такой переезд дорогим — иногда оправданно, бесплатно никогда.
Грабли: веришь вирусному бенчмарку («в 1209 раз быстрее!»). Фикс: читай, что мерили. Время старта ≠ throughput задач ≠ стоимость на задачу.
Грабли: нет песочницы вокруг вызова инструментов. Фикс: каждый инструмент, который агент может вызвать, — поверхность атаки. Валидируй ввод, сбрасывай привилегии, изолируй на уровне ОС.

Так какой же выбрать?

Честный шорткат для решения:

Хочу сначала понять агентов → никакой. Собери цикл на чистом Python, потом возвращайся.
Прод-приложение на Claude → Claude Agent SDK.
Зашипить читаемое за неделю → OpenAI Agents SDK.
Сложный stateful-поток под контролем → LangGraph.
Команда по ролям, быстрый прототип → CrewAI.
Оптимизация высоконагруженного пайплайна → DSPy.
Глубоко в Microsoft или research → AutoGen.
Всё на Google Cloud + Gemini → Google ADK.

А потом оберни выбранное в слой, который реально держит его живым: песочница, наблюдаемость и способ улучшать поведение со временем.

Что дальше

Возьми один фреймворк из шорт-листа, перенеси в него один свой лучший инструмент и зашипь одного агента реальному пользователю. За неделю прод-трафика ты узнаешь больше, чем за месяц сравнения README. Когда агенту понадобится напарник — это сигнал смотреть на мульти-агентность и на архитектурные компромиссы этого шага.

Источники

Документация DSPy — сигнатуры, модуль ReAct и оптимизаторы для сниппета DSPy и тезиса «компилируй, а не тюнь». https://dspy.ai Получено 12 июня 2026.
Claude Agent SDK (доки Anthropic) — query/ClaudeAgentOptions, поддержка MCP и сабагентов из раздела про Claude. https://platform.claude.com/docs/en/api/agent-sdk/overview Получено 12 июня 2026.
OpenAI Agents SDK — агенты, handoffs, guardrails и встроенный трейсинг из раздела про OpenAI. https://openai.github.io/openai-agents-python/ Получено 12 июня 2026.
Документация CrewAI — модель role/goal/backstory и Flows для сниппета и заметки «где ломается». https://docs.crewai.com Получено 12 июня 2026.
AutoGen / Microsoft Agent Framework — actor-модель v0.4, API AgentChat и сходимость с Semantic Kernel. https://microsoft.github.io/autogen/ Получено 12 июня 2026.
Документация LangGraph — create_react_agent, чекпоинты, durable-исполнение и human-in-the-loop. https://langchain-ai.github.io/langgraph/ Получено 12 июня 2026.
Google Agent Development Kit (ADK) — code-first агенты, иерархия и путь деплоя в Vertex Agent Engine. https://google.github.io/adk-docs/ Получено 12 июня 2026.
Microsoft Agent Lightning — RL-обучение для любого фреймворка, из раздела про коммодитизацию. https://github.com/microsoft/agent-lightning Получено 12 июня 2026.

Нужно выбрать и построить архитектуру агента — а не просто демо? Начать проект — я делаю AI-агентов, MCP-серверы и системы агентных платежей, которые работают на твоём сервере и на том фреймворке, что реально подходит под задачу.