5 июня 3 минуты чтения #Технологии

Что умеют российские нейросети

Иллюстрация материала

Нейросети стали незаменимыми помощниками человека во многих областях. Считается, что эти программы возьмут на себя часть аналитических и творческих задач, упростят труд людей. Полезные зарубежные нейросети известны достаточно широко. А мы расскажем о самых интересных российских разработках.

Языковые модели

Они вычленяют из языка поверхностные смыслы и на их основе генерируют тексты и дают определения. Программа создает предложения, опираясь на законы лингвистики и собственные знания о мире. Обучение нейросети чаще всего происходит на материалах «Википедии», новостных статей, книг, постов в соцсетях.

Пример: GigaChat.

Достоинства

  • Дописывает начатые предложения.
  • Адаптирует текст под разные жанры: рекламные слоганы и объявления, рецепты, предсказания, эссе и другие.
  • Помогает не только журналистам и пиарщикам, но и учащимся. Нейросети языкового типа способны даже писать части серьезных научных работ.

Ограничения

  • Допускает фактические, грамматические и пунктуационные ошибки.
  • Временами создает текст низкого качества: с низким процентом уникальности, плохо поддающийся чтению.

Аналоги: «Балабоба», «Порфирьевич», RuGPT-3, SistemmaGPT, YandexGPT.

Обработка изображений

Программы анализируют и видоизменяют изображения в режиме реального времени, применяя специальные алгоритмы. Система сама распознает специфические объекты на изображениях (людей, животных, автомобили), оценивает качество снимка с точки зрения резкости и шумов, анализирует содержание и обрабатывает, улучшая исходные параметры.

Пример: Digital Horizon.

Достоинства

  • Повышает качество снимков — удаляет шумы, повышает резкость и разрешение, делает цветокоррекцию.
  • При необходимости дорисовывает детали и объекты.

Ограничения

  • Некоторые нейросети этого направления делают фотографию нереалистичной.

Аналог: Kandinsky 2.1.

Создание изображений по описанию

Анализируют текстовый запрос пользователя и генерируют картинки в различных стилях: от аниме и киберпанка до картин Айвазовского и Пикассо. За основу берутся реальные фотографии, живописные полотна и рисунки, когда-то созданные людьми и выложенные в интернет. Нейросеть выводит свою комбинацию данных, взятых со снимка, и добавляет случайные объекты.

Пример: «Яндекс Шедеврум».

Достоинства

  • Позволяет быстро получать уникальные изображения, которые можно использовать в рекламе и при ведении блогов и каналов на популярных площадках.
  • Избавляет пользователя от затрат на фотографа и дизайнера.

Ограничения

  • Большинство нейросетей не умеют рисовать человека в полный рост.
  • Нереалистично рисует руки.
  • Лучше всего создает квадратные картинки, а для большинства задач нужны прямоугольные.

Аналоги: Kandinsky 2.1, RuDall-E.

Преобразование текста в аудио

Для создания звуковой дорожки пользователю нужно ввести текст и запустить систему. Нейросеть сгенерирует несколько аудиофайлов на выбор. В каждом можно менять ударение в словах и буквы, регулировать время и скорость речи.

Принцип работы нейросетей таков: их учат подражать естественным голосам известных людей, авторов видео, блогеров, а затем — воспроизводить готовую речь по определенному тексту. С каждым повторением система все точнее произносит слова и цифры, учитывает знаки препинания.

Пример: SteosVoice.

Достоинства

  • Позволяет записывать аудиокниги, озвучивать игры и видео, создавать аудиоверсии новостей, статей и подкастов.
  • Экономит время и деньги пользователей.
  • Позволяет преобразовывать текст, написанный на разных языках.
  • Можно выбрать мужской или женский голос.

Ограничения

  • Иногда не соблюдает правила интонации и не улавливает манеру произношения, которая задумана автором.
  • Не делает акценты и не расставляет логические ударения.

Аналоги: Yandex SpeechKit, Zvukogram.

Реставрация фото

Благодаря наличию больших баз снимков, которые готовы к обработке, такие нейросети получили возможность реставрировать старые черно-белые фотографии: окрашивать их в натуральные цвета, убирать шумы, размытости и другие дефекты. Алгоритмы выполняют цветокоррекцию и автоматически настраивают качественное освещение.

Пример: Colorize.

Достоинства

  • Восстанавливает старые фотографии с максимальной реалистичностью.
  • Возможности нейросети можно использовать как для восстановления фото из личного архива, так и при работе с изображениями и анимациями. Это особенно актуально для монтажеров, дизайнеров, режиссеров и фотографов.

Ограничения

  • Работает достаточно медленно, по сравнению с другими нейросетями. На восстановление снимка может уйти несколько минут.
  • Не всегда убирает заломы с фото.

Повышение качества видео

Работают на базе двух моделей. Первая генерирует увеличенное изображение, а вторая следит за тем, чтобы эти изображения не отличались от реальной картинки.

Пример: NeuroHD.

Достоинства

  • Улучшает качество видео, которое было снято на непрофессиональную камеру.
  • Позволяет убрать фон и выделенный объект с ролика.

Ограничения

  • Некоторые опции хорошо работают, только если фон в видео однотонный.
  • В динамичных видео будет трудно без следов удалить какой-то объект.

Идентификация голоса

Система обучается на большом количестве аудиофайлов, которые содержат разные образцы голосов, а еще — дикторские особенности, шумы и другие нюансы, влияющие на распознавание речи.

Когда человек произносит фразу, нейросеть записывает речь и анализирует ее характеристики. Результаты сопоставляются с теми образцами голоса, которые были зарегистрированы ранее. Это позволяет подтвердить личность пользователя.

Пример: Speechpro VoiceKey.

Достоинства

  • Риск ошибок сводится к минимуму.
  • Нейросеть повышает эффективность распознавания личности.
  • Система широко используется при ограничении доступа к физическим объектам и информационным ресурсам.

Ограничения

  • Повышается важность защиты речевой информации от утечки по акустическим и виброакустическим каналам.