На заході Microsoft Ignite 2023 компанія відкрила доступ до голосового аватара Azure AI Speech Text-to-Speech Avatar. Сервіс дозволяє створювати реалістичні аватари, які можуть озвучувати написаний контент.
Azure AI Speech Text-to-Speech Avatar дозволяє користувачам створювати відео з аватарами, які розмовляють, завантажуючи зображення людини та надаючи сценарій. Потім інструмент Microsoft навчає модель анімувати аватар, а окрема модель перетворення тексту в мовлення читає сценарій вголос. Застосування, за словами Microsoft, варіюється від створення навчальних відео до розробки віртуальних асистентів і чат-ботів.
Попри потенційні переваги, Microsoft визнає, що інструмент може бути використаний не за призначенням. Щоб запобігти цьому, більшість користувачів Azure спочатку матимуть доступ лише до готових аватарів, а персональні налаштування будуть доступні через процес реєстрації з "обмеженим доступом" для конкретних випадків використання.
Також Microsoft запустила пов'язану з ним функцію під назвою Personal Voice, яка є частиною сервісу нейронного голосу. Personal Voice за лічені секунди відтворює голос користувача на основі однохвилинного мовного зразка, що дозволяє створювати персоналізованих голосових помічників і дикторів на замовлення.
Однак Microsoft вживає заходів обережності з Personal Voice, вимагаючи від користувачів надати "явну згоду" у вигляді записаної заяви перед використанням цієї функції. Наразі доступ до функції обмежений реєстраційною формою, і користувачі повинні погодитися обмежити використання персонального голосу програмами, в яких голос не зчитує створений користувачем або відкритий контент.
Впровадження цього інструменту викликає етичні питання, особливо у світлі нещодавніх дискусій під час страйку профспілки SAG-AFTRA, щодо компенсації за використання згенерованих штучним інтелектом образів. Microsoft поки не роз'яснила свою позицію у цьому питанні.
Джерело: Microsoft