Я очень угораю с Клод Кода.
Простите, но я сегодня опять про нейросети, а не слонов )
Удивительно, но каждый, кто его распробовал, сидит и ковыряется как с офигенной игрушкой. Так из реального мира мы выбили уже с десяток человек точно.
Это, если что, интерфейс для работы с нейросетками из терминала. И оно же — утилита, которая видит файлы, пишет их, читает, может сама запускать команды, писать и запускать скрипты, гонять тесты и ставить нужные куски из репозиториев.
Короче, как Курсор, только лучше и другой.
Разница в том, что там наконец-то работают длинные задания. Потому что Антропики заточили модели под понимание того, как разбивать работу на куски, как запускать под каждый кусок субагента и так далее. Когда вы даете задачу вроде "Напиши вот такую утилиту", модель не пытается выдать один огромный шмат кода. Она разбивает задачу на план, запускает подзадачи, потом проверяет результат.
В общем, если в Перплексити одна задача завёрнута в UX и так делается, то тут можно построить себе конвейер для любых задач. И каждый параметр под себя.
Основа — агенты. Условно, вы можете описать их как сотрудников, и разложить их по конвейеру производства чего-то. Часть появятся сами от просто длинного промпта на уровне движка.
Они дофига умные. Их можно подключать к проекту с любыми вводными и в любом порядке. Они толерантны к косякам, неправильным вводным, часто замечают сами какие-то ещё проблемы. Более того, агенты очень часто понимают сами, что что-то идёт не так, и сами ищут и читают документацию на ошибку, и сами исправляют. "Поменяй на странице заголовок на такой-то" — "Я поменял, но была опечатка, исправил. Или не надо было?"
Каждый этап можно завернуть в юнит-тесты, в гибкие тесты и т.п. и переделывать после ревизиий, если надо.
Сверху стоит контролирующий агент, который ведёт конвейер. И вот самое смешное — как он чехвостит агентов, которые возвращаются с ошибкой и ищет обходные пути.
В отличие от других схем, именно в Клоде всё очень хорошо заточено на взаимодействия этих агентов и нативность исполнения. Опус — основная модель Антропиков — субъективно хуже Gemini3P, но именно по агентской части просто охренителен.
Если всё это снабдить нормальным диздоком, документацией, архитектурой, роадмапами и прочими артефактами, которые поддерживают целостность проекта и не дают творчески косорезить — получается очень хороший сценарий.
Я ещё дописал схему, которая после проблем обновляет самих агентов, поэтому конвейер постепенно обучается на реальной работе. По сути, там обычный GAN-принцип, генераторы и дискриминаторы. Поскольку агенты у меня написаны на русском, по сути, дискриминатор вызывает редактора, который разбирается в проблеме и обновляет документацию проекта.
Так вот, это всё стало возможным потому, что они наконец-то заточили модели падать и подниматься, а не просто падать. Раньше любая ошибка в цепочке вела к перезапуску.
Они там запилили уже убогий GUI, но я пока играю терминалом, потому что сказать консоли "слышь, я там в папку эту новую ещё 2 файла положил, разбирайся" — бесценно. Ну и программировать на естественном русском оказалось очень весело, последний раз у меня такое было в университете на дискретной математике, когда пофиг, знаешь ли ты C++ или нет, важно уметь выразить матмодель для начала в псевдокоде.
Большую реальную задачу, которую я решал бы месяц в коде, тут получилось сделать за час. Но, правда, добавились приколы типа "Как сжечь весь свой лимит за 8 минут 33 секунды". Там, если что, одна фраза может вызвать штук 100 API-запросов к большой модели (взять исходные данные, обработать, оценить, написать план, уточнить ТЗ, взяться за задачи, написать вспомогательные утилиты, всё это перепроверить, сохранить, исправить, ещё раз сохранить, запустить тесты, охренеть, исправить...) Контекст там, конечно, кэшируется и компактизируется, но всё равно по 50-100 тысяч входящих токенов за запрос — легко.
И ASCII-арт там в терминале прикольный.
Короче, если вы помните MS-DOS, то прям советую.