Языковые модели
Они вычленяют из языка поверхностные смыслы и на их основе генерируют тексты и дают определения. Программа создает предложения, опираясь на законы лингвистики и собственные знания о мире. Обучение нейросети чаще всего происходит на материалах «Википедии», новостных статей, книг, постов в соцсетях.
Пример: GigaChat.
Достоинства
- Дописывает начатые предложения.
- Адаптирует текст под разные жанры: рекламные слоганы и объявления, рецепты, предсказания, эссе и другие.
- Помогает не только журналистам и пиарщикам, но и учащимся. Нейросети языкового типа способны даже писать части серьезных научных работ.
Ограничения
- Допускает фактические, грамматические и пунктуационные ошибки.
- Временами создает текст низкого качества: с низким процентом уникальности, плохо поддающийся чтению.
Аналоги: «Балабоба», «Порфирьевич», RuGPT-3, SistemmaGPT, YandexGPT.

Обработка изображений
Программы анализируют и видоизменяют изображения в режиме реального времени, применяя специальные алгоритмы. Система сама распознает специфические объекты на изображениях (людей, животных, автомобили), оценивает качество снимка с точки зрения резкости и шумов, анализирует содержание и обрабатывает, улучшая исходные параметры.
Пример: Digital Horizon.
Достоинства
- Повышает качество снимков — удаляет шумы, повышает резкость и разрешение, делает цветокоррекцию.
- При необходимости дорисовывает детали и объекты.
Ограничения
- Некоторые нейросети этого направления делают фотографию нереалистичной.
Аналог: Kandinsky 2.1.

Создание изображений по описанию
Анализируют текстовый запрос пользователя и генерируют картинки в различных стилях: от аниме и киберпанка до картин Айвазовского и Пикассо. За основу берутся реальные фотографии, живописные полотна и рисунки, когда-то созданные людьми и выложенные в интернет. Нейросеть выводит свою комбинацию данных, взятых со снимка, и добавляет случайные объекты.
Пример: «Яндекс Шедеврум».
Достоинства
- Позволяет быстро получать уникальные изображения, которые можно использовать в рекламе и при ведении блогов и каналов на популярных площадках.
- Избавляет пользователя от затрат на фотографа и дизайнера.
Ограничения
- Большинство нейросетей не умеют рисовать человека в полный рост.
- Нереалистично рисует руки.
- Лучше всего создает квадратные картинки, а для большинства задач нужны прямоугольные.
Аналоги: Kandinsky 2.1, RuDall-E.

Преобразование текста в аудио
Для создания звуковой дорожки пользователю нужно ввести текст и запустить систему. Нейросеть сгенерирует несколько аудиофайлов на выбор. В каждом можно менять ударение в словах и буквы, регулировать время и скорость речи.
Принцип работы нейросетей таков: их учат подражать естественным голосам известных людей, авторов видео, блогеров, а затем — воспроизводить готовую речь по определенному тексту. С каждым повторением система все точнее произносит слова и цифры, учитывает знаки препинания.
Пример: SteosVoice.
Достоинства
- Позволяет записывать аудиокниги, озвучивать игры и видео, создавать аудиоверсии новостей, статей и подкастов.
- Экономит время и деньги пользователей.
- Позволяет преобразовывать текст, написанный на разных языках.
- Можно выбрать мужской или женский голос.
Ограничения
- Иногда не соблюдает правила интонации и не улавливает манеру произношения, которая задумана автором.
- Не делает акценты и не расставляет логические ударения.
Аналоги: Yandex SpeechKit, Zvukogram.

Реставрация фото
Благодаря наличию больших баз снимков, которые готовы к обработке, такие нейросети получили возможность реставрировать старые черно-белые фотографии: окрашивать их в натуральные цвета, убирать шумы, размытости и другие дефекты. Алгоритмы выполняют цветокоррекцию и автоматически настраивают качественное освещение.
Пример: Colorize.
Достоинства
- Восстанавливает старые фотографии с максимальной реалистичностью.
- Возможности нейросети можно использовать как для восстановления фото из личного архива, так и при работе с изображениями и анимациями. Это особенно актуально для монтажеров, дизайнеров, режиссеров и фотографов.
Ограничения
- Работает достаточно медленно, по сравнению с другими нейросетями. На восстановление снимка может уйти несколько минут.
- Не всегда убирает заломы с фото.

Повышение качества видео
Работают на базе двух моделей. Первая генерирует увеличенное изображение, а вторая следит за тем, чтобы эти изображения не отличались от реальной картинки.
Пример: NeuroHD.
Достоинства
- Улучшает качество видео, которое было снято на непрофессиональную камеру.
- Позволяет убрать фон и выделенный объект с ролика.
Ограничения
- Некоторые опции хорошо работают, только если фон в видео однотонный.
- В динамичных видео будет трудно без следов удалить какой-то объект.

Идентификация голоса
Система обучается на большом количестве аудиофайлов, которые содержат разные образцы голосов, а еще — дикторские особенности, шумы и другие нюансы, влияющие на распознавание речи.
Когда человек произносит фразу, нейросеть записывает речь и анализирует ее характеристики. Результаты сопоставляются с теми образцами голоса, которые были зарегистрированы ранее. Это позволяет подтвердить личность пользователя.
Пример: Speechpro VoiceKey.
Достоинства
- Риск ошибок сводится к минимуму.
- Нейросеть повышает эффективность распознавания личности.
- Система широко используется при ограничении доступа к физическим объектам и информационным ресурсам.
Ограничения
- Повышается важность защиты речевой информации от утечки по акустическим и виброакустическим каналам.
