Штучний інтелект навчився керувати обличчям Обами, наче лялькою

Дослідники з Університету Вашингтону розробили новий алгоритм машинного навчання, яки вирішує одну з найбільш актуальних проблем візуалізації – перетворення будь-якого голосу у повноцінне відео з обличчям, яке промовляє ці слова.

У своїй публікації вчені описують процес створення дуже реалістичного відео президента США Барака Обами, який говорить про тероризм, батьківство, створення робочих місць у щотижневих телезустрічах з громадянами країни.

За словами дослідників, вони не створювали інструмент для виробництва потоку фальшивих новин чи підробок. Навпаки, алгоритм розроблявся частково для того, щоби визначати підробки у відео, навіть у тих, що здаються оригінальними.

“Такі результати ще не були продемонстровані раніше”

– зазначає Іра Кемельмахель-Шлізерман, доцент Центру комп’ютерних наук та інжинірингу ім. Пола Аллена в Університеті Вашингтона –

“Реалістична конверсія аудіо-у-відео має практичні застосування, зокрема поліпшення відео у віртуальних конференціях, а також більш футуристичні: наприклад, можливість вести бесіду з історичною постаттю у віртуальній реальності, створюючи картинку лише за допомогою аудіо. Це своєрідний прорив, який дозволить перейти до наступних кроків.”

Система використовує візуальну форму синхронізації рухів губ. Алгоритм конвертує аудіо файл з мовою окремої людини у реалістичні форми рота, які потім переносяться та графічно поєднуються з головою людини з іншого відео.

Анімація Обами
Схема алгоритму для машинного навчання, який анімував обличчя президента Барака Обами. Джерело: washington.edu

Вчені обрали записи Обами, оскільки алгоритми машинного навчання потребують багато годин відео для обробки. На щастя, записи президента знаходились у вільному доступі.

Оптимізація відео

Перетворення аудіо здатне також вирішити проблему постійних затримок під час з’єднань у відеоконференціях. Аудіо займає набагато менше місця у інтернет-каналі, тому алгоритм потенційно може самостійно відтворити частину відео, якої не вистачає і позбавити нас зависань у Skype.

“Коли ви дивитесь у Skype або Google Hangouts, дуже часто недолуге з’єднання та низька роздільність виявляються досить неприємними, а аудіо залишається досить добрим.”

– зазначає співавтор дослідження Стів Сейтз –

“Тож, якщо ви могли б використати звук для отримання більш якісного відео, це було б приголомшливо.”

Якщо обернути алгоритм після деяких вдосконалень та почати постачати йому інші відеофайли, у перспективі він би зміг також визначати, чи є це відео реальним, чи зміненим.

Моторошна долина

Моторошна долина або неприродна долина – це гіпотеза з галузі робототехніки та комп’ютерної анімації. Вона визначає емоційну реакцію відторгнення у живих людей, які спостерігають за штучним машинним мовленням, яке досягає високої відповідності реальному.

Діаграма відповідності ШІ вигляду та мові живої людини та емоційної реакції.

Іншими словами, якби ви зустріли на вулиці робота, який звернувся до вас “майже” як жива людина, ваш мозок підсвідомого відреагував би на це негативно.

Використавши попередні розробки своїх колег, дослідники з Університету Вашингтона розробили більш прогресивний алгоритм, який робить значний поступ у подоланні проблеми “моторошної долини”. Їм вдалось дуже реалістично поєднати контури рота та графіку обличчя. До того ж, вони ввели затримку, яка дозволила штучному інтелекту (ШІ) прогнозувати та визначати наступний рух особи на відео.

Читайте також: 600 годин серіалів і ти вже знаєш, що буде далі, навіть зі штучним інтелектом.

Наразі алгоритм опрацював лише голос однієї людини: на всіх відео Обама “розмовляє” власним голосом з інших виступів. Дослідники сподіваються, що у майбутньому їм вдасться пришвидшити навчання та зменшити його до кількох годин відео замість чотирнадцяти.

Вчені також запевнили, що за допомогою таких інструментів не можна взяти чужі слова та видати їх з промову Обами.

Якщо ви знайшли помилку, будь ласка, виділіть фрагмент тексту та натисніть Ctrl+Enter.

3 Shares:
Залишити відповідь

Ваша e-mail адреса не оприлюднюватиметься. Обов’язкові поля позначені *

Перегляньте також
Художнє зображення Тяньгун-1
Далі

Китайська космічна станція Тяньгун-1 впаде на Землю раніше, ніж вважалося

Перша китайська орбітальна станція-прототип “Тяньгун-1″, вагою 8,5 тонн, вийшла на критично низьку орбіту та поступово знижується. За словами…
Гідравлічний стрибок
Далі

Встановлено природу гідравлічного стрибка, який спостерігав Леонардо да Вінчі

Після цієї новини буденний процес чищення зубів тепер стане для вас цікавішим, оскільки дослідники з’ясували природу явища, яке…