Семейство GLM
Все уже рассказали, теперь и мне пора 😊
#обзорнейросетей
Только сегодня утром дошли руки протестировать новую нейросеть и агента. И, ребята, это реально стоит внимания.
Я давно говорю, что рынок языковых моделей уже понятен. Есть гиганты, которые заняли свои места. И если честно, у меня ощущение, что новых больших игроков почти не будет. Будущее за агентами и мультимодальными системами.
И вот ту выходит GLM 5 вместе с агентом Super Z.
http://Z.AI/ (Zhipu AI) - китайская компания, разрабатывающая open-source модели семейства GLM.
Я начал тестировать со скепсисом, потому что обещаний много. Вот что он заявляет.
1️⃣ Разработка и программирование:
1. Создание веб приложений, Next.js 15, React, TypeScript;
2. Написание и редактирование кода, любые языки;
3. Отладка и оптимизация, поиск и исправление ошибок;
4. Рефакторинг, улучшение структуры и качества кода.
2️⃣ Работа с документами:
1. Word .docx, создание и редактирование;
2. PDF, извлечение текста, создание, объединение;
3. Excel .xlsx, таблицы, формулы, анализ данных, графики;
4. PowerPoint .pptx, создание презентаций.
3️⃣ AI возможности:
1. Генерация изображений;
2. Распознавание изображений, анализ и описание фото;
3. Текст в речь;
4. Речь в текст;
5. Веб поиск;
6. Генерация видео;
7. Подкасты.
4️⃣ Анализ и исследование:
1. Финансовые данные;
2. Веб исследования;
3. Обработка больших объёмов информации.
5️⃣ Дизайн:
1. UI UX;
2. Фронтенд стилизация, CSS, анимации, адаптив.
Звучит ооочень масштабно, но мне важна практика.🧐
Я сел и начал проверять. Тексты, картинки, презентации. И вот что интересно. Агента мне проще сначала проверить на презентациях. Если он собирает структуру, логику, визуал, значит инструмент рабочий.
GLM 5 собрал мне презентацию в три раза быстрее, чем Genspark. Причем по одному промпту. И бесплатно. Не идеал, но вполне достойный результат для холостого промпта. И у меня ощущение, что если поколдовать с формулировками, он реально может сделать лучше, чем Genspark и точно лучше, чем Гамма ✨
Пока я протестировал не всё. Но уже понятно, что это инструмент, который я буду активно использовать и разбирать дальше. Он ощущается как рабочий агент, а не просто чат. Под капотом у него своя LLM модель.
А вот так выглядит всё семейство http://Z.AI/:
https://chat.z.ai/ большая языковая модель и агент;
https://ocr.z.ai/ извлечение текста, распознавание документов;
https://image.z.ai/ генерация картинок;
https://audio.z.ai/ работа с аудио и генерация голоса.
Так что рекомендую попробовать. Если у вас уже есть свои сценарии и наработки, делитесь. Если нет, тестируйте и пишите, что получилось 🤗
А, да, важно: всё бесплатно 😅🤓