Новые языковые модели Яндекса: YandexGPT 4

Новые языковые модели Яндекса: YandexGPT 4

Яндекс представил YandexGPT 4 — новейшее поколение своих генеративных нейросетей, включающее языковую модель Pro и её облегченную версию Lite. Эти модели предлагают более качественные ответы, а также могут обрабатывать запросы в четыре раза длиннее — до 60 страниц текста. Это открывает возможности для их использования в решении сложных задач, таких как анализ обращений клиентов или автоматизация закупок.

Новые модели доступны через API в Yandex Cloud, а часть функционала пока работает в тестовом режиме. С их помощью можно упорядочивать обращения клиентов, анализировать резюме и решать другие текстовые задачи.

Pro версия подходит для сложных задач, требующих большой вычислительной мощности, например, анализа продаж, а Lite оптимальна для менее ресурсоемких сценариев, где важна скорость отклика.

Протестировать YandexGPT 4 можно в чате на платформе Yandex Cloud, а в дальнейшем модели будут интегрированы в другие сервисы Яндекса, включая голосового помощника Алиса с функцией «Про».

Качество ответов

YandexGPT 4 Pro обеспечивает улучшенное качество ответов: в 70% случаев она превосходит предыдущее поколение, а в задачах на открытые вопросы почти догоняет GPT-4o. Версия Lite по качеству не уступает мощной модели Яндекса прошлого поколения. Это стало возможным благодаря обновленным методам обучения, включая обучение через цепочки пошаговых решений, которые помогают нейросети анализировать и рассуждать.

Рассуждения

YandexGPT 4 обладает развитой способностью к рассуждению (chain-of-thought), благодаря которой модель может разбивать сложные вопросы на последовательные шаги, строя цепочку мыслей для достижения результата. Это не только повышает качество ответов, но и помогает решать задачи, требующие глубокой аналитики. Так, например, нейросеть теперь способна проанализировать клиентскую жалобу, глубже вникнуть в суть проблемы и предложить решение. В будущем API будет поддерживать функцию скрытых рассуждений для любых запросов.

Обработка больших объёмов данных

Новая версия YandexGPT способна обрабатывать запросы в четыре раза длиннее, чем третье поколение, удерживая контекст на протяжении всего диалога. Это позволяет нейросети анализировать и отвечать на сложные вопросы, охватывающие до 60 страниц текста.

Модели лучше работают с внешними источниками, такими как документы компании или статьи (в рамках системы Retrieval Augmented Generation), и доля ошибок сократилась почти вдвое — до 2,1%. При этом средняя скорость ответов новых моделей увеличилась вдвое.

Интеграция с внешними приложениями

YandexGPT 4 также научилась генерировать команды для внешних приложений. Например, модель может сгенерировать запрос к сервису авиабилетов при поиске билета.

Генерация команд станет доступна в Yandex Cloud в ближайшее время, и разработчики смогут использовать модели для автоматизации взаимодействия с приложениями, задав правила и функции, которые YandexGPT 4 будет использовать по мере необходимости.

Фото: Firestock.