Модель умеет работать с аудио, видео, текстами, картинками и в реальном времени анализировать данные из интернета.
Сбер представил обновлённую версию своей нейросетевой платформы — GigaChat 2.0. Это уже не просто чат-бот: теперь это полноценный мультимодальный помощник, способный понимать речь, изображения, видео и большие объемы текста, выдавая актуальные, проверенные данные с привязкой к источникам. Новый GigaChat 2.0 также встроен в голосовые помощники умных колонок Сбер, а одной из первых цифровых платформ, интегрировавших его, стала МАХ от VK.
Что изменилось в GigaChat 2.0
Главное новшество — поддержка мультимодальности. Искусственный интеллект теперь распознаёт голосовые аудиофайлы, понимает изображения, работает с видео по ссылкам (включая YouTube) и анализирует документы объёмом до 200 страниц. Например, пользователь может загрузить договор аренды и получить анализ с учётом актуальных российских законов, расшифровать аудиозапись врачебных рекомендаций или понять суть видеоурока.
Серьёзно улучшились возможности обработки аудио. Модель воспринимает звуковые данные напрямую, без преобразования в текст. Она умеет выделять главные смыслы, отвечать на вопросы по содержанию, распознавать устную речь, акценты, музыку и посторонние звуки. Возможности ограничены размерами файлов: до 60 минут или 30 мегабайт. Правда, на практике пока возникают ограничения форматов и объёмов при работе с аудиофайлами.
Работа с актуальными данными в реальном времени стала ещё одной ключевой особенностью. Теперь GigaChat 2.0 может искать информацию в интернете, отфильтровывать её, выделять главное и выдавать ссылки на проверенные источники. Это позволяет избежать устаревших данных, на которых была обучена модель, и уменьшает риск так называемых «галлюцинаций» — ошибок в выдаче.
GigaChat 2.0 на платформе МАХ от VK
Одним из первых новых партнёров стала платформа МАХ от VK — отечественный аналог WeChat с мессенджером, мини-приложениями, чат-ботами и платежным сервисом. Пользователи могут с помощью GigaChat 2.0 создавать тексты, расшифровывать аудио, кратко пересказывать видео и статьи, получать помощь в профессиональных и повседневных вопросах.
GigaChat 2.0 стал важным шагом в развитии российских AI-сервисов. Благодаря интеграции с умными колонками, платформами и расширению функциональности, он превратился в полноценного универсального ассистента, который понимает и текст, и звук, и видео, и изображение — и умеет не просто отвечать, а анализировать, советовать и даже творить музыку.
Источник: it-world.ru
Сбер представил обновлённую версию своей нейросетевой платформы — GigaChat 2.0. Это уже не просто чат-бот: теперь это полноценный мультимодальный помощник, способный понимать речь, изображения, видео и большие объемы текста, выдавая актуальные, проверенные данные с привязкой к источникам. Новый GigaChat 2.0 также встроен в голосовые помощники умных колонок Сбер, а одной из первых цифровых платформ, интегрировавших его, стала МАХ от VK.
Что изменилось в GigaChat 2.0
Главное новшество — поддержка мультимодальности. Искусственный интеллект теперь распознаёт голосовые аудиофайлы, понимает изображения, работает с видео по ссылкам (включая YouTube) и анализирует документы объёмом до 200 страниц. Например, пользователь может загрузить договор аренды и получить анализ с учётом актуальных российских законов, расшифровать аудиозапись врачебных рекомендаций или понять суть видеоурока.
Серьёзно улучшились возможности обработки аудио. Модель воспринимает звуковые данные напрямую, без преобразования в текст. Она умеет выделять главные смыслы, отвечать на вопросы по содержанию, распознавать устную речь, акценты, музыку и посторонние звуки. Возможности ограничены размерами файлов: до 60 минут или 30 мегабайт. Правда, на практике пока возникают ограничения форматов и объёмов при работе с аудиофайлами.
Работа с актуальными данными в реальном времени стала ещё одной ключевой особенностью. Теперь GigaChat 2.0 может искать информацию в интернете, отфильтровывать её, выделять главное и выдавать ссылки на проверенные источники. Это позволяет избежать устаревших данных, на которых была обучена модель, и уменьшает риск так называемых «галлюцинаций» — ошибок в выдаче.
GigaChat 2.0 на платформе МАХ от VK
Одним из первых новых партнёров стала платформа МАХ от VK — отечественный аналог WeChat с мессенджером, мини-приложениями, чат-ботами и платежным сервисом. Пользователи могут с помощью GigaChat 2.0 создавать тексты, расшифровывать аудио, кратко пересказывать видео и статьи, получать помощь в профессиональных и повседневных вопросах.
GigaChat 2.0 стал важным шагом в развитии российских AI-сервисов. Благодаря интеграции с умными колонками, платформами и расширению функциональности, он превратился в полноценного универсального ассистента, который понимает и текст, и звук, и видео, и изображение — и умеет не просто отвечать, а анализировать, советовать и даже творить музыку.
Источник: it-world.ru