Опубликовано 12 июня 2026 г.
Сравнение фреймворков для AI-агентов в 2026: DSPy vs Claude Agent SDK vs OpenAI Agents SDK vs CrewAI vs AutoGen vs LangGraph vs Google ADK
Я собрал одного агента на всех семи. Честная матрица: эргономика, мульти-агентность, MCP, вендор-лок — и какой выбрать под твою задачу.
Если ты выбираешь фреймворк для AI-агента в июне 2026, вот короткий ответ. Нужен цикл, который ты полностью контролируешь, с чекпоинтами и human-in-the-loop? LangGraph. Строишь на Claude с файловыми инструментами и MCP? Claude Agent SDK. Хочешь самый маленький и читаемый API, чтобы зашипить сегодня? OpenAI Agents SDK. Собрать команду агентов по ролям за вечер? CrewAI. Оптимизируешь промпт-пайплайн вместо ручного тюнинга? DSPy. Глубоко в Microsoft/Azure или делаешь research-style мульти-агентов? AutoGen. Всё на Google Cloud и Gemini? Google ADK.
Я собрал одного и того же небольшого агента — ответить на вопрос, вызвать два инструмента, передать управление второму агенту — на всех семи. Ниже матрица, минимальный сниппет на каждом и то, о чём не предупреждают: где каждый ломается. А в конце неудобный вывод: в 2026 выбор фреймворка значит меньше, чем слой над ним — обучение, песочница и наблюдаемость. Код актуален на 12 июня 2026; проверяй версии перед стартом — поле переписывается каждый месяц.
Почему это вообще вопрос
Два года назад «фреймворк для агентов» означал LangChain или ничего. В 2026 их десятки, но в проде реально живут семь: DSPy (Stanford), Claude Agent SDK (Anthropic), OpenAI Agents SDK (OpenAI), CrewAI, AutoGen (Microsoft), LangGraph (LangChain) и Google ADK (Google).
Они не взаимозаменяемы. Они стоят на разной высоте. DSPy — это компилятор для LLM-программ. LangGraph — конечный автомат, который ты рисуешь. CrewAI — метафора команды. SDK от Claude и OpenAI — тонкие циклы вокруг моделей одного провайдера. AutoGen и ADK — платформы с мульти-агентным рантаймом внутри. Выберешь не ту высоту — и будешь либо воевать с фреймворком, либо переписывать его половину.
Самая частая ошибка: команда хватает тяжёлую мульти-агентную платформу там, где хватило бы одного агента с тремя инструментами — и тратит спринт на отладку маршрутизации сообщений вместо релиза. Так что до матрицы запомни: большинство «агентов» в проде — это одна модель, один цикл, горстка инструментов. Выбирай сначала под это.
Матрица
| Фреймворк | Эргономика | Мульти-агентность | MCP / стриминг | Прод-фичи | Вендор-лок | Лучше всего для |
|---|---|---|---|---|---|---|
| DSPy | Декларативно; пишешь сигнатуры | Через модули (вручную) | Инструменты да; MCP через адаптеры | Оптимизаторы, eval-driven, кэш | Низкий (provider-agnostic) | Оптимизация промпт/агент-пайплайнов |
| Claude Agent SDK | Крошечный, мнениевый, async | Сабагенты | Нативный MCP и стриминг | Контекст, права доступа, сессии | Высокий (Claude/Anthropic) | Прод-агенты на Claude и кодинг |
| OpenAI Agents SDK | Самый маленький и читаемый | Handoffs (из коробки) | MCP да; стриминг да | Guardrails, сессии, встроенный трейсинг | Средний (лучше на OpenAI) | Быстрый запуск одиночных и handoff-агентов |
| CrewAI | Метафора role/goal/backstory | Crews + Flows | MCP через инструменты; стриминг базовый | Flows для детерминизма, память, телеметрия | Средний (свой фреймворк) | Команды по ролям, быстрый прототип |
| AutoGen | Многословный; actor/event-модель | Главная сила | MCP через ext; стриминг да | Async-рантайм, распределённость, Studio UI | Средний→стек Microsoft | Research и сложный мульти-агентный чат |
| LangGraph | Явный граф; больше бойлерплейта | Supervisor/граф | MCP-адаптер; стриминг да | Чекпоинты, durable exec, human-in-the-loop | Низкий–средний (OSS) | Stateful-воркфлоу под полным контролем |
| Google ADK | Чистый, code-first | Иерархия агентов | MCP да; двусторонний стриминг | Vertex Agent Engine, eval, деплой | Высокий (Google Cloud) | Gemini + прод на Google Cloud |
TL;DR: «лучшего фреймворка» нет. Есть правильная высота под твою задачу и правильный радиус поражения под терпимость команды к вендор-локу.
Семь фреймворков своими словами (и где каждый ломается)
Каждый сниппет — канонический минимальный агент: модель, инструменты, поехали. Это про форму API, а не готовое приложение; пинь версию, API дрейфует.
DSPy — ты компилируешь промпты, а не пишешь их
DSPy относится к LLM-программе как к чему-то, что ты оптимизируешь, а не тюнишь руками. Ты объявляешь сигнатуру (question -> answer), берёшь модуль (ReAct для инструментов), и оптимизатор подстраивает промпты под метрику.
# pip install dspy
import dspy
dspy.configure(lm=dspy.LM("openai/gpt-5.1"))
def calculate(expression: str) -> str:
"""Посчитать простую арифметику."""
return str(eval(expression, {"__builtins__": {}})) # в проде — песочница
agent = dspy.ReAct("question -> answer", tools=[calculate])
print(agent(question="What is 4871 * 209?").answer)Где ломается: магия оптимизатора требует метрики и датасета. Нет eval-сета — нет профита, и ты просто пользуешься неудобным шаблоном промпта. Плохой выбор для разового агента и лучший — для пайплайна, который ты прогонишь миллион раз.
Claude Agent SDK — прод-цикл со всем в комплекте
SDK от Anthropic (переименованный и обобщённый наследник Claude Code SDK) оборачивает цикл агента поддержкой MCP, файловыми инструментами, правами доступа, сабагентами и автоматической компакцией контекста. Python и TypeScript.
# pip install claude-agent-sdk
import asyncio
from claude_agent_sdk import query, ClaudeAgentOptions
async def main():
options = ClaudeAgentOptions(model="claude-opus-4-8")
async for message in query(prompt="Который час в Киеве?", options=options):
print(message)
asyncio.run(main())Где ломается: великолепен на Claude и стена везде, кроме него — это самый высокий вендор-лок в подборке. Если «переедем на модель подешевле в следующем квартале» есть в роадмапе, это реальная цена.
OpenAI Agents SDK — самый маленький API, который делает дело
Лёгкий наследник Swarm. Три примитива: агенты, handoffs, guardrails, плюс сессии и встроенный трейсинг. Беру его, когда хочу читаемый код сегодня.
# pip install openai-agents
from agents import Agent, Runner, function_tool
@function_tool
def get_weather(city: str) -> str:
return f"В {city} ясно, 24°C."
agent = Agent(name="Assistant", instructions="Отвечай коротко.", tools=[get_weather])
result = Runner.run_sync(agent, "Какая погода в Лиссабоне?")
print(result.final_output)Где ломается: работает с другими провайдерами через litellm, но эргономика и трейсинг заточены под OpenAI. Обещание «лёгкости» значит и то, что всё сверх handoffs ты допишешь руками — ни графа, ни durable-состояния.
CrewAI — агенты как команда с ролями
Метафора CrewAI — команда: у каждого агента есть role, goal и backstory; задачи идут последовательно или иерархически. Для детерминизма добавили Flows. Теперь он самостоятельный (без LangChain под капотом).
# pip install crewai
from crewai import Agent, Task, Crew
researcher = Agent(role="Researcher", goal="Найти ответ",
backstory="Дотошный аналитик.")
task = Task(description="Который час в Киеве?",
agent=researcher, expected_output="Ответ одной строкой.")
print(Crew(agents=[researcher], tasks=[task]).kickoff())Где ломается: role/backstory отлично смотрятся в демо и хрупки в управлении потоком. Как только нужно «если X, то маршрутизируй в Y», ты тянешься к Flows — а в этот момент LangGraph честнее.
AutoGen — мульти-агентный рантайм
AutoGen v0.4+ от Microsoft — переписан с нуля: async, событийная модель, actor-модель под высокоуровневым API AgentChat. Он сходится с Semantic Kernel в общий Microsoft Agent Framework, так что проверь, какая точка входа актуальна, до старта.
# pip install autogen-agentchat autogen-ext[openai]
import asyncio
from autogen_agentchat.agents import AssistantAgent
from autogen_ext.models.openai import OpenAIChatCompletionClient
async def main():
client = OpenAIChatCompletionClient(model="gpt-5.1")
agent = AssistantAgent("assistant", model_client=client)
print(await agent.run(task="Сколько будет 23 * 47?"))
asyncio.run(main())Где ломается: за мощь платишь — он самый многословный тут, API сильно лихорадило на миграциях v0.2→v0.4→Agent Framework, и куча туториалов в сети всё ещё про старый API. Заложи время на «какую версию я вообще читаю».
LangGraph — рисуешь конечный автомат
LangGraph моделирует агента как граф узлов и рёбер с явным состоянием, чекпоинтами, durable-исполнением и first-class human-in-the-loop. Префаб create_react_agent прячет граф, пока он тебе не понадобится.
# pip install langgraph "langchain[anthropic]"
from langgraph.prebuilt import create_react_agent
def get_weather(city: str) -> str:
"""Погода в городе."""
return f"В {city} ясно."
agent = create_react_agent(model="anthropic:claude-sonnet-4-6", tools=[get_weather])
out = agent.invoke({"messages": [{"role": "user", "content": "Погода в Киеве?"}]})
print(out["messages"][-1].content)Где ломается: префаб простой; настоящий API графа многословный и с кривой обучения. Плюс ты наследуешь всю поверхность LangChain и его привычку переносить вещи между пакетами. Зато выигрыш — пауза, возобновление, инспекция и правка состояния на ходу — несравним, когда он реально нужен.
Google ADK — прод-кит для Gemini
Agent Development Kit — code-first фреймворк за Vertex AI Agent Engine. В теории model-agnostic, на практике Gemini-first: иерархические мульти-агенты, двусторонний стриминг, оценка и путь деплоя в Google Cloud.
# pip install google-adk
from google.adk.agents import Agent
def get_weather(city: str) -> dict:
"""Вернуть погоду по городу."""
return {"status": "ok", "report": f"В {city} ясно."}
root_agent = Agent(name="weather_agent", model="gemini-3-pro",
instruction="Отвечай на вопросы о погоде.", tools=[get_weather])Где ломается: гладкий путь идёт через Vertex. Вне Google Cloud ты теряешь деплой/eval — а это половина смысла, и доки исходят из Gemini. Отлично внутри экосистемы, странный выбор снаружи.
Два новичка, за которыми стоит следить
- PraisonAI — low-code/быстрая полоса. YAML-воркфлоу, SDK на Python и JS, MCP по stdio/WebSocket/SSE/Streamable HTTP и вирусное заявление «в 1209 раз быстрее LangGraph» при поднятии агента. Цифру из заголовка считай маркетингом (мерили старт, а не throughput задач), но эргономика для простых мульти-агентных задач реально шустрая.
- AgentScope — open-source-новичок родом из Китая: agent-oriented programming, визуальный билдер, MCP плюс встроенные память и RAG. Стоит глянуть, если хочешь batteries-included OSS-платформу, не привязанную к американскому облаку.
Я бы пока не ставил на них прод-систему, но оба — честный сигнал, куда движется эргономика: быстрее старт, меньше кода, MCP везде.
Что реально важно: фреймворки коммодитизируются
Вот что удивило после релизов на всех семи: выбор фреймворка становится наименее интересным решением. Минимальные сниппеты выше почти одинаковы — опиши инструменты, опиши агента, гоняй цикл. Эта сходимость и есть улика. Когда у всех «hello agent» выглядит одинаково, фреймворк — коммодити, а ценность переезжает на слой над ним:
- Обучение/оптимизация. Agent Lightning от Microsoft обучает любого агента — LangChain, AutoGen, CrewAI, OpenAI SDK — через reinforcement learning почти без правок кода. Активом становится поведение агента, а не фреймворк, в который он вшит.
- Безопасность/песочница. AVM (Agent Virtual Machine) и подобное изолируют любой фреймворк на уровне ОС. Агент, который вызывает инструменты, — это поверхность для remote-code-execution; фреймворк это не чинит, чинит слой изоляции. (Серверную сторону смотри в моём чек-листе безопасности self-hosted AI.)
- Наблюдаемость. Трейсинг, eval'ы, учёт токенов и стоимости, реплей. В SDK от OpenAI трейсинг встроен; остальные прикручивают LangSmith, Langfuse, Phoenix или Weave. В проде именно это держит тебя на плаву в 3 ночи — об этом в мониторинге прод-агентов.
Один контрарианский тред этой весной сформулировал точно: большинство фреймворков гонятся за расширением контекстного окна, когда настоящая проблема — качество контекста. Следующий проект может выиграть не тот фреймворк, что даёт впихнуть 400 000 токенов, а тот, что помогает скормить модели правильные 4 000.
Так что выбери фреймворк — да. Но реальный инженерный бюджет трать на слой над ним.
Частые грабли (и как я их чинил)
- Грабли: тянешь мульти-агентную платформу под задачу для одного агента. Фикс: начни с одного агента и инструментов. Добавляй агентов, только когда один доказуемо не тянет задачу. Большинство «мульти-агентных» демо — театр.
- Грабли: копипастишь туториалы под старую мажорную версию (AutoGen и LangChain — рецидивисты). Фикс: смотри версию в импортах, а не дату публикации статьи. Пинь её в
requirements.txt. - Грабли: недооцениваешь вендор-лок. Фикс: до старта ответь: «сколько стоит сменить модель/облако через полгода?» Claude Agent SDK и Google ADK делают такой переезд дорогим — иногда оправданно, бесплатно никогда.
- Грабли: веришь вирусному бенчмарку («в 1209 раз быстрее!»). Фикс: читай, что мерили. Время старта ≠ throughput задач ≠ стоимость на задачу.
- Грабли: нет песочницы вокруг вызова инструментов. Фикс: каждый инструмент, который агент может вызвать, — поверхность атаки. Валидируй ввод, сбрасывай привилегии, изолируй на уровне ОС.
Так какой же выбрать?
Честный шорткат для решения:
- Хочу сначала понять агентов → никакой. Собери цикл на чистом Python, потом возвращайся.
- Прод-приложение на Claude → Claude Agent SDK.
- Зашипить читаемое за неделю → OpenAI Agents SDK.
- Сложный stateful-поток под контролем → LangGraph.
- Команда по ролям, быстрый прототип → CrewAI.
- Оптимизация высоконагруженного пайплайна → DSPy.
- Глубоко в Microsoft или research → AutoGen.
- Всё на Google Cloud + Gemini → Google ADK.
А потом оберни выбранное в слой, который реально держит его живым: песочница, наблюдаемость и способ улучшать поведение со временем.
Что дальше
Возьми один фреймворк из шорт-листа, перенеси в него один свой лучший инструмент и зашипь одного агента реальному пользователю. За неделю прод-трафика ты узнаешь больше, чем за месяц сравнения README. Когда агенту понадобится напарник — это сигнал смотреть на мульти-агентность и на архитектурные компромиссы этого шага.
Источники
-
Документация DSPy — сигнатуры, модуль
ReActи оптимизаторы для сниппета DSPy и тезиса «компилируй, а не тюнь». https://dspy.ai Получено 12 июня 2026. -
Claude Agent SDK (доки Anthropic) —
query/ClaudeAgentOptions, поддержка MCP и сабагентов из раздела про Claude. https://platform.claude.com/docs/en/api/agent-sdk/overview Получено 12 июня 2026. -
OpenAI Agents SDK — агенты, handoffs, guardrails и встроенный трейсинг из раздела про OpenAI. https://openai.github.io/openai-agents-python/ Получено 12 июня 2026.
-
Документация CrewAI — модель role/goal/backstory и Flows для сниппета и заметки «где ломается». https://docs.crewai.com Получено 12 июня 2026.
-
AutoGen / Microsoft Agent Framework — actor-модель v0.4, API
AgentChatи сходимость с Semantic Kernel. https://microsoft.github.io/autogen/ Получено 12 июня 2026. -
Документация LangGraph —
create_react_agent, чекпоинты, durable-исполнение и human-in-the-loop. https://langchain-ai.github.io/langgraph/ Получено 12 июня 2026. -
Google Agent Development Kit (ADK) — code-first агенты, иерархия и путь деплоя в Vertex Agent Engine. https://google.github.io/adk-docs/ Получено 12 июня 2026.
-
Microsoft Agent Lightning — RL-обучение для любого фреймворка, из раздела про коммодитизацию. https://github.com/microsoft/agent-lightning Получено 12 июня 2026.
Нужно выбрать и построить архитектуру агента — а не просто демо? Начать проект — я делаю AI-агентов, MCP-серверы и системы агентных платежей, которые работают на твоём сервере и на том фреймворке, что реально подходит под задачу.