Опубліковано 12 червня 2026 р.
Порівняння фреймворків для AI-агентів у 2026: DSPy vs Claude Agent SDK vs OpenAI Agents SDK vs CrewAI vs AutoGen vs LangGraph vs Google ADK
Я зібрав одного агента на всіх сімох. Чесна матриця: ергономіка, мульти-агентність, MCP, вендор-лок — і який обрати під твою задачу.
Якщо ти обираєш фреймворк для AI-агента у червні 2026, ось коротка відповідь. Потрібен цикл, який ти повністю контролюєш, із чекпоінтами та human-in-the-loop? LangGraph. Будуєш на Claude з файловими інструментами та MCP? Claude Agent SDK. Хочеш найменший і найчитабельніший API, щоб зашипити сьогодні? OpenAI Agents SDK. Зібрати команду агентів за ролями за вечір? CrewAI. Оптимізуєш промпт-пайплайн замість ручного тюнінгу? DSPy. Глибоко в Microsoft/Azure чи робиш research-style мульти-агентів? AutoGen. Усе на Google Cloud і Gemini? Google ADK.
Я зібрав одного й того самого невеликого агента — відповісти на питання, викликати два інструменти, передати керування другому агентові — на всіх сімох. Нижче матриця, мінімальний сніпет на кожному й те, про що не попереджають: де кожен ламається. А наприкінці незручний висновок: у 2026 вибір фреймворку важить менше, ніж шар над ним — навчання, пісочниця й спостережуваність. Код актуальний на 12 червня 2026; перевіряй версії перед стартом — поле переписується щомісяця.
Чому це взагалі питання
Два роки тому «фреймворк для агентів» означав LangChain або нічого. У 2026 їх десятки, але в проді реально живуть сім: DSPy (Stanford), Claude Agent SDK (Anthropic), OpenAI Agents SDK (OpenAI), CrewAI, AutoGen (Microsoft), LangGraph (LangChain) і Google ADK (Google).
Вони не взаємозамінні. Вони стоять на різній висоті. DSPy — це компілятор для LLM-програм. LangGraph — скінченний автомат, який ти малюєш. CrewAI — метафора команди. SDK від Claude та OpenAI — тонкі цикли навколо моделей одного провайдера. AutoGen і ADK — платформи з мульти-агентним рантаймом усередині. Обереш не ту висоту — і будеш або воювати з фреймворком, або переписувати його половину.
Найчастіша помилка: команда хапає важку мульти-агентну платформу там, де вистачило б одного агента з трьома інструментами — і витрачає спринт на відладку маршрутизації повідомлень замість релізу. Тож до матриці запам'ятай: більшість «агентів» у проді — це одна модель, один цикл, жменя інструментів. Обирай спершу під це.
Матриця
| Фреймворк | Ергономіка | Мульти-агентність | MCP / стримінг | Прод-фічі | Вендор-лок | Найкраще для |
|---|---|---|---|---|---|---|
| DSPy | Декларативно; пишеш сигнатури | Через модулі (вручну) | Інструменти так; MCP через адаптери | Оптимізатори, eval-driven, кеш | Низький (provider-agnostic) | Оптимізація промпт/агент-пайплайнів |
| Claude Agent SDK | Крихітний, думковий, async | Сабагенти | Нативний MCP і стримінг | Контекст, права доступу, сесії | Високий (Claude/Anthropic) | Прод-агенти на Claude і кодинг |
| OpenAI Agents SDK | Найменший і найчитабельніший | Handoffs (з коробки) | MCP так; стримінг так | Guardrails, сесії, вбудований трейсинг | Середній (краще на OpenAI) | Швидкий запуск одиночних і handoff-агентів |
| CrewAI | Метафора role/goal/backstory | Crews + Flows | MCP через інструменти; стримінг базовий | Flows для детермінізму, пам'ять, телеметрія | Середній (свій фреймворк) | Команди за ролями, швидкий прототип |
| AutoGen | Багатослівний; actor/event-модель | Головна сила | MCP через ext; стримінг так | Async-рантайм, розподіленість, Studio UI | Середній→стек Microsoft | Research і складний мульти-агентний чат |
| LangGraph | Явний граф; більше бойлерплейту | Supervisor/граф | MCP-адаптер; стримінг так | Чекпоінти, durable exec, human-in-the-loop | Низький–середній (OSS) | Stateful-воркфлоу під повним контролем |
| Google ADK | Чистий, code-first | Ієрархія агентів | MCP так; двосторонній стримінг | Vertex Agent Engine, eval, деплой | Високий (Google Cloud) | Gemini + прод на Google Cloud |
TL;DR: «найкращого фреймворку» немає. Є правильна висота під твою задачу й правильний радіус ураження під терпимість команди до вендор-локу.
Сім фреймворків своїми словами (і де кожен ламається)
Кожен сніпет — канонічний мінімальний агент: модель, інструменти, поїхали. Це про форму API, а не готовий застосунок; пінь версію, API дрейфує.
DSPy — ти компілюєш промпти, а не пишеш їх
DSPy ставиться до LLM-програми як до чогось, що ти оптимізуєш, а не тюниш руками. Ти оголошуєш сигнатуру (question -> answer), береш модуль (ReAct для інструментів), і оптимізатор підлаштовує промпти під метрику.
# pip install dspy
import dspy
dspy.configure(lm=dspy.LM("openai/gpt-5.1"))
def calculate(expression: str) -> str:
"""Порахувати просту арифметику."""
return str(eval(expression, {"__builtins__": {}})) # у проді — пісочниця
agent = dspy.ReAct("question -> answer", tools=[calculate])
print(agent(question="What is 4871 * 209?").answer)Де ламається: магія оптимізатора потребує метрики й датасету. Немає eval-сету — немає профіту, і ти просто користуєшся незручним шаблоном промпта. Поганий вибір для разового агента й найкращий — для пайплайна, який ти проженеш мільйон разів.
Claude Agent SDK — прод-цикл з усім у комплекті
SDK від Anthropic (перейменований і узагальнений наступник Claude Code SDK) загортає цикл агента підтримкою MCP, файловими інструментами, правами доступу, сабагентами й автоматичною компакцією контексту. Python і TypeScript.
# pip install claude-agent-sdk
import asyncio
from claude_agent_sdk import query, ClaudeAgentOptions
async def main():
options = ClaudeAgentOptions(model="claude-opus-4-8")
async for message in query(prompt="Котра година в Києві?", options=options):
print(message)
asyncio.run(main())Де ламається: чудовий на Claude і стіна скрізь, крім нього — це найвищий вендор-лок у добірці. Якщо «переїдемо на дешевшу модель наступного кварталу» є в роадмапі, це реальна ціна.
OpenAI Agents SDK — найменший API, що робить справу
Легкий наступник Swarm. Три примітиви: агенти, handoffs, guardrails, плюс сесії й вбудований трейсинг. Беру його, коли хочу читабельний код сьогодні.
# pip install openai-agents
from agents import Agent, Runner, function_tool
@function_tool
def get_weather(city: str) -> str:
return f"У {city} ясно, 24°C."
agent = Agent(name="Assistant", instructions="Відповідай коротко.", tools=[get_weather])
result = Runner.run_sync(agent, "Яка погода в Лісабоні?")
print(result.final_output)Де ламається: працює з іншими провайдерами через litellm, але ергономіка й трейсинг заточені під OpenAI. Обіцянка «легкості» означає й те, що все понад handoffs ти допишеш руками — ні графа, ні durable-стану.
CrewAI — агенти як команда з ролями
Метафора CrewAI — команда: у кожного агента є role, goal і backstory; задачі йдуть послідовно або ієрархічно. Для детермінізму додали Flows. Тепер він самостійний (без LangChain під капотом).
# pip install crewai
from crewai import Agent, Task, Crew
researcher = Agent(role="Researcher", goal="Знайти відповідь",
backstory="Прискіпливий аналітик.")
task = Task(description="Котра година в Києві?",
agent=researcher, expected_output="Відповідь одним рядком.")
print(Crew(agents=[researcher], tasks=[task]).kickoff())Де ламається: role/backstory чудово виглядають у демо й крихкі в керуванні потоком. Щойно потрібно «якщо X, то маршрутизуй у Y», ти тягнешся до Flows — а в цей момент LangGraph чесніший.
AutoGen — мульти-агентний рантайм
AutoGen v0.4+ від Microsoft — переписаний з нуля: async, подієва модель, actor-модель під високорівневим API AgentChat. Він сходиться з Semantic Kernel у спільний Microsoft Agent Framework, тож перевір, яка точка входу актуальна, до старту.
# pip install autogen-agentchat autogen-ext[openai]
import asyncio
from autogen_agentchat.agents import AssistantAgent
from autogen_ext.models.openai import OpenAIChatCompletionClient
async def main():
client = OpenAIChatCompletionClient(model="gpt-5.1")
agent = AssistantAgent("assistant", model_client=client)
print(await agent.run(task="Скільки буде 23 * 47?"))
asyncio.run(main())Де ламається: за потужність платиш — він найбагатослівніший тут, API сильно лихоманило на міграціях v0.2→v0.4→Agent Framework, і купа туторіалів у мережі досі про старий API. Заклади час на «яку версію я взагалі читаю».
LangGraph — малюєш скінченний автомат
LangGraph моделює агента як граф вузлів і ребер із явним станом, чекпоінтами, durable-виконанням і first-class human-in-the-loop. Префаб create_react_agent ховає граф, доки він тобі не знадобиться.
# pip install langgraph "langchain[anthropic]"
from langgraph.prebuilt import create_react_agent
def get_weather(city: str) -> str:
"""Погода в місті."""
return f"У {city} ясно."
agent = create_react_agent(model="anthropic:claude-sonnet-4-6", tools=[get_weather])
out = agent.invoke({"messages": [{"role": "user", "content": "Погода в Києві?"}]})
print(out["messages"][-1].content)Де ламається: префаб простий; справжній API графа багатослівний і з кривою навчання. Плюс ти успадковуєш усю поверхню LangChain і його звичку переносити речі між пакетами. Зате виграш — пауза, відновлення, інспекція й правка стану на ходу — незрівнянний, коли він реально потрібен.
Google ADK — прод-кіт для Gemini
Agent Development Kit — code-first фреймворк за Vertex AI Agent Engine. У теорії model-agnostic, на практиці Gemini-first: ієрархічні мульти-агенти, двосторонній стримінг, оцінка й шлях деплою в Google Cloud.
# pip install google-adk
from google.adk.agents import Agent
def get_weather(city: str) -> dict:
"""Повернути погоду за містом."""
return {"status": "ok", "report": f"У {city} ясно."}
root_agent = Agent(name="weather_agent", model="gemini-3-pro",
instruction="Відповідай на питання про погоду.", tools=[get_weather])Де ламається: гладкий шлях іде через Vertex. Поза Google Cloud ти втрачаєш деплой/eval — а це половина сенсу, і доки виходять із Gemini. Чудово всередині екосистеми, дивний вибір ззовні.
Двоє новачків, за якими варто стежити
- PraisonAI — low-code/швидка смуга. YAML-воркфлоу, SDK на Python і JS, MCP по stdio/WebSocket/SSE/Streamable HTTP і вірусне твердження «у 1209 разів швидше за LangGraph» при підйомі агента. Цифру із заголовка вважай маркетингом (міряли старт, а не throughput задач), але ергономіка для простих мульти-агентних задач реально швидка.
- AgentScope — open-source-новачок родом із Китаю: agent-oriented programming, візуальний білдер, MCP плюс вбудовані пам'ять і RAG. Варто глянути, якщо хочеш batteries-included OSS-платформу, не прив'язану до американської хмари.
Я б поки не ставив на них прод-систему, але обидва — чесний сигнал, куди рухається ергономіка: швидше старт, менше коду, MCP скрізь.
Що реально важить: фреймворки коммодитизуються
Ось що здивувало після релізів на всіх сімох: вибір фреймворку стає найменш цікавим рішенням. Мінімальні сніпети вище майже однакові — опиши інструменти, опиши агента, ганяй цикл. Ця збіжність і є доказ. Коли в усіх «hello agent» виглядає однаково, фреймворк — коммодіті, а цінність переїжджає на шар над ним:
- Навчання/оптимізація. Agent Lightning від Microsoft навчає будь-якого агента — LangChain, AutoGen, CrewAI, OpenAI SDK — через reinforcement learning майже без правок коду. Активом стає поведінка агента, а не фреймворк, у який його вшито.
- Безпека/пісочниця. AVM (Agent Virtual Machine) і подібне ізолюють будь-який фреймворк на рівні ОС. Агент, що викликає інструменти, — це поверхня для remote-code-execution; фреймворк це не лагодить, лагодить шар ізоляції. (Серверний бік дивись у моєму чек-листі безпеки self-hosted AI.)
- Спостережуваність. Трейсинг, eval'и, облік токенів і вартості, реплей. У SDK від OpenAI трейсинг вбудований; решта прикручують LangSmith, Langfuse, Phoenix або Weave. У проді саме це тримає тебе на плаву о 3 ночі — про це в моніторингу прод-агентів.
Один контрарний тред цієї весни сформулював точно: більшість фреймворків женуться за розширенням контекстного вікна, коли справжня проблема — якість контексту. Наступний проєкт може виграти не той фреймворк, що дає впхнути 400 000 токенів, а той, що допомагає згодувати моделі правильні 4 000.
Тож обери фреймворк — так. Але реальний інженерний бюджет витрачай на шар над ним.
Часті граблі (і як я їх лагодив)
- Граблі: тягнеш мульти-агентну платформу під задачу для одного агента. Фікс: почни з одного агента й інструментів. Додавай агентів, лише коли один доказово не тягне задачу. Більшість «мульти-агентних» демо — театр.
- Граблі: копіпастиш туторіали під стару мажорну версію (AutoGen і LangChain — рецидивісти). Фікс: дивись версію в імпортах, а не дату публікації статті. Пінь її в
requirements.txt. - Граблі: недооцінюєш вендор-лок. Фікс: до старту дай відповідь: «скільки коштує змінити модель/хмару за пів року?» Claude Agent SDK і Google ADK роблять такий переїзд дорогим — іноді виправдано, безкоштовно ніколи.
- Граблі: віриш вірусному бенчмарку («у 1209 разів швидше!»). Фікс: читай, що міряли. Час старту ≠ throughput задач ≠ вартість на задачу.
- Граблі: немає пісочниці навколо виклику інструментів. Фікс: кожен інструмент, який агент може викликати, — поверхня атаки. Валідуй ввід, скидай привілеї, ізолюй на рівні ОС.
То який же обрати?
Чесний шорткат для рішення:
- Хочу спершу зрозуміти агентів → жодного. Збери цикл на чистому Python, потім повертайся.
- Прод-застосунок на Claude → Claude Agent SDK.
- Зашипити читабельне за тиждень → OpenAI Agents SDK.
- Складний stateful-потік під контролем → LangGraph.
- Команда за ролями, швидкий прототип → CrewAI.
- Оптимізація високонавантаженого пайплайна → DSPy.
- Глибоко в Microsoft або research → AutoGen.
- Усе на Google Cloud + Gemini → Google ADK.
А потім загорни обране в шар, який реально тримає його живим: пісочниця, спостережуваність і спосіб покращувати поведінку з часом.
Що далі
Візьми один фреймворк із шорт-листа, перенеси в нього один свій найкращий інструмент і зашипи одного агента реальному користувачеві. За тиждень прод-трафіку ти дізнаєшся більше, ніж за місяць порівняння README. Коли агентові знадобиться напарник — це сигнал дивитися на мульти-агентність і на архітектурні компроміси цього кроку.
Джерела
-
Документація DSPy — сигнатури, модуль
ReActі оптимізатори для сніпета DSPy й тези «компілюй, а не тюнь». https://dspy.ai Отримано 12 червня 2026. -
Claude Agent SDK (доки Anthropic) —
query/ClaudeAgentOptions, підтримка MCP і сабагентів із розділу про Claude. https://platform.claude.com/docs/en/api/agent-sdk/overview Отримано 12 червня 2026. -
OpenAI Agents SDK — агенти, handoffs, guardrails і вбудований трейсинг із розділу про OpenAI. https://openai.github.io/openai-agents-python/ Отримано 12 червня 2026.
-
Документація CrewAI — модель role/goal/backstory і Flows для сніпета й нотатки «де ламається». https://docs.crewai.com Отримано 12 червня 2026.
-
AutoGen / Microsoft Agent Framework — actor-модель v0.4, API
AgentChatі збіжність із Semantic Kernel. https://microsoft.github.io/autogen/ Отримано 12 червня 2026. -
Документація LangGraph —
create_react_agent, чекпоінти, durable-виконання й human-in-the-loop. https://langchain-ai.github.io/langgraph/ Отримано 12 червня 2026. -
Google Agent Development Kit (ADK) — code-first агенти, ієрархія й шлях деплою в Vertex Agent Engine. https://google.github.io/adk-docs/ Отримано 12 червня 2026.
-
Microsoft Agent Lightning — RL-навчання для будь-якого фреймворку, із розділу про коммодитизацію. https://github.com/microsoft/agent-lightning Отримано 12 червня 2026.
Потрібно обрати й побудувати архітектуру агента — а не просто демо? Почати проєкт — я будую AI-агентів, MCP-сервери та системи агентних платежів, що працюють на твоєму сервері й на тому фреймворку, який реально пасує під задачу.