Технологии удобства: создание информационных видеороликов с помощью ИИ
Инновационными технологиями машинного обучения и системами искусственного интеллекта (ИИ) на базе нейронных сетей сегодня занимаются десятки, если не сотни тысяч организаций по всему миру. Активно в этой сфере работает и ведёт исследования компания Mail.ru Group, разработавшая платформу dictor.mail.ru, которая позволяет в несколько кликов мышью создавать новостные и репортажные видео студийного качества.
Чтобы создать ролик, достаточно загрузить в систему текст новости — и виртуальный ведущий его зачитает. Дикторы выглядят и разговаривают, как живые люди: при чтении новостей они реалистично воспроизводят мимику, эмоционально реагируют и расставляют смысловые акценты. Внешность диктора выбирает пользователь: в Mail.ru Group создали несколько моделей цифровых ведущих, прототипами для которых послужили реальные люди. Также пользователи могут менять дизайн студии — например, оформлять её в корпоративных цветах издания.
В основу платформы «Диктор Mail.ru» положены собственные разработки компании в области искусственного интеллекта. Над синтезом речи на основе нейронных сетей работала команда голосового ассистента Маруси. Для синхронизации виртуальных дикторов с речью в режиме реального времени была задействована система компьютерного зрения Vision от Mail.ru Group, которая обучалась на реальных прототипах и видеозаписях, чтобы точно воспроизводить движение губ и выражение лица. Благодаря глубинному обучению, нейронные сети позволяют дикторам транслировать произвольную речь с подходящей мимикой и эмоциональностью.
В компании Mail.ru Group подчёркивают, что ИИ-платформа для создания видео может быть полезна как крупным изданиям, которые активно экспериментируют с технологиями, так и нишевым медиа, получившим возможность экономить ресурсы на создании качественного мультимедийного контента и выпускать сюжеты в самые короткие сроки.