Семь главных AI трендов: март 2026

AI агенты научились управлять компьютером, переехали на локальные машины, впаялись в кремний и удалили чьи-то письма. Семь трендов, которые определили месяц.

Февраль был шумным: анонсы, демо, громкие заявления. Март прошёл тише, но то, что реально вышло в продакшн, важнее того, что показали на сцене. Тема месяца: AI-модели больше не просто отвечают на вопросы. Они кликают кнопки, пишут код, удаляют письма (об этом ниже) и работают на железе, которое ещё год назад казалось фантастикой.

Семь вещей, на которые стоит обратить внимание.

Годами главным узким местом была интеграция. Если у софта нет API, AI не мог к нему подступиться. Это меняется.

GPT-5.4 от OpenAI вышел с нативным computer use: модель читает экран, двигает виртуальную мышь, печатает на виртуальной клавиатуре. На бенчмарке OSWorld-Verified результат 75%, что выше человеческого базового уровня для рутинных десктопных задач. Anthropic пошли похожим путём с Claude Code, который может собирать, запускать и тестировать приложения прямо из терминала.

Почему это интересно для бизнеса: тебе больше не нужно ждать, пока вендор сделает AI-интеграцию. Есть 15-летняя HR-система без API? Агент заполнит форму так же, как это сделал бы стажёр. Воодушевляет это или слегка настораживает, зависит от того, насколько ты доверяешь стажёру.

У облака была хорошая пробежка, но в марте индустрия начала подтягивать AI ближе к железу.

Perplexity запустила “Personal Computer” - выделенный Mac mini, который крутит AI-агента 24/7 прямо у тебя в офисе. Manus перенёс своего агента из удалённого sandbox на локальную машину, где тот работает с файлами напрямую. NVIDIA NemoClaw позволяет компаниям распределять нагрузку между локальными GPU и облаком, чтобы чувствительные данные не покидали периметр.

Основная причина очевидна: приватность. Но скорость тоже важна. Когда модель работает локально, нет round-trip до дата-центра. Для всего, что работает в реальном времени (поддержка клиентов, трейдинг, производство), эта разница в задержке накапливается.

Больше десяти лет мы запускали AI на GPU общего назначения. Стартап Taalas решил пропустить все слои абстракции и впаять конкретную модель прямо в чип. Результат: 17 000 токенов в секунду, примерно в 74 раза быстрее текущего железа NVIDIA.

NVIDIA тоже не стоит на месте. Nemotron 3 ко-оптимизирует софт и железо и по-прежнему держит большую часть рынка. Но подход Taalas указывает на кое-что интересное: если inference станет достаточно дешёвым, запуск сотен агентов параллельно для решения одной задачи перестанет быть роскошью. Теоретически это было возможно давно. Теперь это может стать экономически оправданным.

Две вещи произошли параллельно, и вместе они меняют экономику AI.

Anthropic расширила контекстное окно до 1 миллиона токенов без повышения цены. Можно скормить целую кодовую базу или стопку контрактов в один промпт. Одно это убирает целую категорию костылей, которые люди строили последние два года.

Тем временем Qwen 3.5 Small от Alibaba (модель на 9 миллиардов параметров) обходит модели в 13 раз крупнее на бенчмарках по рассуждению. Я всё время возвращаюсь к этой мысли: если модель, которая работает на ноутбуке, может показать результат, для которого раньше нужен был дата-центр, кривая стоимости внедрения AI просто сломалась.

Большинство сегодняшних AI систем предсказывают следующее слово. Лекун, получивший премию Тьюринга за работу над глубоким обучением, считает, что у этого подхода есть потолок. В марте он привлёк больше миллиарда долларов для AMI Labs, чтобы строить то, что он называет «World Models», системы, которые учатся причинно-следственным связям так, как это делает ребёнок: не читая текст, а выстраивая внутренние модели того, как устроен физический мир.

Genie 3 от Google DeepMind исследует смежную территорию, генерируя 3D-виртуальные среды для обучения. Архитектура JEPA от Лекуна идёт другим путём: она спроектирована для роботов, которым нужно ориентироваться в непредсказуемых физических пространствах, будь то кухня или складской цех.

Прав ли Лекун? Я честно не знаю. Но миллиард долларов - это серьёзная ставка против текущей парадигмы, и за этим стоит следить.

Одиночный AI-агент делает одну задачу за раз. Мультиагентные системы разбивают задачу на несколько моделей, работающих параллельно. В марте это перестало быть исследовательской диковинкой.

Мультиагентный код-ревью от Anthropic запускает несколько агентов одновременно для проверки кода. Их заявление: в 7,5 раз больше найденных багов по сравнению с людьми или одноагентными системами. Microsoft выпустила Copilot Cowork, который берёт запрос на обычном языке и разбивает его на шаги, выполняемые в Outlook, Teams и Excel. Composer 2 от Cursor обрабатывает правки в нескольких файлах и терминальные команды по всему проекту, и Cursor утверждает, что это сокращает затраты на кодинг вдвое.

Паттерн достаточно очевиден: AI больше не просто твой ассистент, это маленькая команда. Держится ли качество за пределами бенчмарков и демо на запуске - вот вопрос, на который я хотел бы получить ответ, прежде чем делать на это ставку.

Самая пугающая история месяца: агент OpenClaw в Meta, получив доступ к почтовому ящику, случайно стёр сотни писем. Ошибка памяти привела к тому, что агент потерял свои ограничения безопасности. Инцидент (его уже называют «инцидент Summer Yue») привёл к созданию фреймворка CLAW-10 для оценки готовности AI к работе в корпоративной среде, построенного на принципах zero-trust.

Отдельно, бенчмарк ARC-AGI-3 показал, что текущие AI-системы набирают меньше 1% на задачах, требующих обучения новым правилам на лету. Системы становятся быстрее, мощнее, автономнее, но они не становятся умнее в том смысле, в котором умны люди. Этот разрыв сейчас важен как никогда, потому что мы даём агентам реальные права в реальных системах.


Март 2026 в одном предложении: AI перешёл от ответов к действиям. Агенты управляют компьютерами, работают локально, проверяют код командами и иногда ломают вещи в продакшене.

Вот на последнее я бы обратил особое внимание.

До встречи в следующем обзоре.


Скачать инфографику (PDF) - визуальная сводка всех семи трендов, для печати или отправки коллегам.