Неуважение к ремеслу: актёры озвучки жалуются, что их просят отдать свой голос искусственному интеллекту

Автор оригинала: Joseph Cox. Перевод: Вячеслав Голованов. Актёров озвучивания всё чаще просят подписать договор об уступке права на их голоса, чтобы клиенты могли использовать искусственный интеллект для создания синтетических версий голоса, которые в конечном итоге смогут заменить самих актёров — причём иногда без дополнительной компенсации. Так утверждают правозащитные организации и актёры, беседовавшие с изданием Motherboard.

Эти договорные обязательства — лишь один из многих вопросов, заботящих актёров в связи с развитием искусственного интеллекта, генерирующего голоса, который, по их словам, угрожает лишить работы целые сегменты индустрии.

Эта новость подчёркивает бурное развитие индустрии искусственного интеллекта, генерирующего голоса, и показывает, насколько снизился барьер входа для любого желающего синтезировать голоса других людей. В январе Motherboard сообщила, как пользователи 4chan воспользовались бета-версией программы компании ElevenLabs, синтезирующей голоса, чтобы сгенерировать голоса знаменитостей, например Эмму Уотсон, читающую фрагменты «Майн Кампф». Последствия для индустрии озвучивания напрямую связаны и с работой ElevenLabs: компания продвигает свои услуги для создания игр, фильмов, аудиокниг и многого другого.

«Это неуважительно по отношению к ремеслу — предполагать, что сгенерированный голос эквивалентен работе реального человека, — сказал Motherboard по электронной почте СунгВон Чо, актёр озвучивания игр и анимации, который также работает под ником ProZD. – Конечно, вы можете заставить его звучать в разных тональностях, как голос, и, возможно, даже заставить его звучать так, как будто он передаёт эмоцию, но в итоге он всё равно будет звучать пусто и фальшиво. Идя по этому пути, люди рискуют стать жертвой заблуждения, что голос за кадром можно полностью заменён искусственным интеллектом, от чего мне просто плохо делается».

Сейчас существует множество компаний, которые предлагают клонировать, генерировать или синтезировать чей-то голос с помощью искусственного интеллекта. Motherboard протестировала несколько продуктов этих компаний, и в целом они работают одинаково. Сначала пользователь может записать свой собственный голос, используя сценарий, предоставленный компанией. После записи определённого количества аудиозаписей, длительностью от 10 до 60 минут, компания создаёт копию голоса пользователя. Затем пользователь может написать произвольный текст, а система прочтёт его вслух с помощью синтетической версии его голоса. Большинство сайтов, протестированных Motherboard, по умолчанию воспроизводят голос на американском английском языке. Стоимость этих услуг часто очень низкая, пользователи могут синтезировать голоса бесплатно или очень дёшево. Например, один из сервисов, протестированных Motherboard, предлагал подписку для профессионалов за 30 долларов в месяц.

Некоторые сайты также позволяют пользователям загружать ранее записанные аудиозаписи, что даёт возможность копировать записи знаменитостей или других людей, а затем синтезировать их без их ведома или согласия.

Фрайда Волф, актриса озвучания, принимавшая участие в создании такой игры, как Apex Legends, сказала Motherboard: «Разработчики игр, анимационные студии и, возможно, даже коммерческие клиенты могут получить возможность выжимать из меня больше путём передачи моего голоса искусственному интеллекту, использовать эти синтезированные работы, а затем никогда не выплачивать мне компенсацию за использование моего «аналога» и даже не сообщать моему агентству, что это было сделано».

Сара Элмалех, актриса озвучивания и режиссёр, работавшая над Fortnite и Halo Infinite, сказала, что, по её мнению, согласие на использование голоса «должно быть постоянным».

«Что сейчас происходит, когда мы соглашаемся на роль, но, оказавшись в кабинке, видим в сценарии какую-то строчку, которая нам не нравится, и выражаем недвусмысленный протест? Что произойдёт, если продюсер не поймёт или не примет серьёзность этого возражения? Обычно мы можем отказаться читать эту строчку, чтобы предотвратить её использование. Эта технология, очевидно, позволяет обойти эту проблему», — сказала она.

Тим Фридландер, президент и основатель Национальной ассоциации актёров озвучания (NAVA), сообщил Motherboard по электронной почте, что пункты в контрактах, которые дают продюсеру право синтезировать голос актёра, сейчас «очень распространены».

«Юридический язык может быть запутанным и неоднозначным, — сказал Фридландер. – Многие актёры озвучивания, возможно, подписали контракт, не подозревая, что в него был добавлен подобный пункт. Мы также находим в контрактах на обычное использование голоса пункты, которые дают право использовать голос актёра для обучения или создания синтетического голоса без какой-либо дополнительной компенсации или одобрения. Некоторым актёрам говорят, что их просто не примут на работу, если не согласятся с этими пунктами».

Чо сказал, что лично он не видел увеличения числа таких оговорок, но «я слышал от своих коллег, что они становятся все более распространёнными».

В ответ на это NAVA опубликовала советы для актёров, столкнувшихся с подобными формулировками в своих контрактах, включая рекомендацию передать контракты представителям профсоюза.

Фридландер сказал, что некоторые разделы индустрии озвучивания также будут потеряны из-за синтетических голосов. Фридландер особенно указал на «актёров озвучивания с дополнительной подработкой, которые работают на основной работе с 9 до 5, а затем пытаются построить карьеру в дубляже. Именно эти рабочие места синтетические голоса устранят в первую очередь, чем нанесут ущерб значительной части индустрии».

На своём сайте компания ElevenLabs заявляет, что она хочет «сделать многоязычную аудиоподдержку по требованию в образовании, потоковом вещании, аудиокнигах, играх, фильмах и даже для разговоров в реальном времени», и что у неё есть инструменты, которые «обеспечивают необходимое качество для озвучивания новостей, информационных бюллетеней, книг и видео».

Мати Станишевский, соучредитель ElevenLabs, сообщил Motherboard по электронной почте, что компания видит будущее, в котором ИИ-компании и актёры озвучивания будут сотрудничать.

«Актёры озвучивания больше не будут ограничены количеством сессий записи, в которых они могут участвовать — вместо этого они смогут лицензировать свои голоса для использования в любом количестве проектов одновременно, обеспечивая дополнительные доходы и потоки роялти. Этот потенциал уже признали сами актёры озвучивания, несколько десятков из которых связались с нами, заявив о заинтересованности в таком партнёрстве», — написал Станишевский.

В ответ на заявление ElevenLabs Волф сказал, что «актёрам не нужна возможность лицензирования или «обеспечения дополнительных потоков дохода», этот бессмысленный жаргон демонстрирует, что ElevenLabs понятия не имеет, как актёры озвучивания зарабатывают себе на жизнь».

Волф добавил: «Мы можем просто спросить у музыкантов, как хорошо у них идут дела с тех пор, как лицензирование потоковых платформ убило «дополнительные потоки доходов и роялти» для музыкальных исполнителей. Словоблудие ElevenLabs похоже на чёрный юмор».

Когда Motherboard попросил Станишевского представить одного из десятков актёров озвучивания, обратившихся в компанию, он указал на Лэнса Блэра, актёра озвучивания, в портфолио которого есть рекламные ролики и видео с конференций.

Блэр сказал: «Несмотря на обоснованные опасения моих коллег, которые я разделяю, я использую эту технологию, чтобы помочь себе услышать себя так, как слышат меня другие, и исследовать различные способы подхода к моим текстам».

Блэр сказал, что он не состоит в профсоюзе. Что касается профсоюзных работников, то SAG-AFTRA, профсоюз актёров в США, сообщил Motherboard, что право имитировать голос исполнителя должно обязательно обсуждаться и утверждаться отдельно.

«Любая формулировка в контракте исполнителя, которая пытается приобрести права на цифровое моделирование или цифровой синтез, является недействительной и не имеет законной силы до тех пор, пока условия не будут согласованы с профсоюзом», — говорится в заявлении SAG-AFTRA.

Фридландер добавил, что «NAVA не выступает против синтетических голосов или анти-ИИ — мы ратуем за актёров озвучания. Мы хотим, чтобы актёры озвучивания активно и на равных участвовали в развитии нашей индустрии и не потеряли своё агентство или возможность получать справедливую компенсацию за свою работу и талант».

Как говорит Чо, он «категорически против этого. Синтез голоса лишает реальное выступление души и спонтанности». Он добавил: «Я могу только надеяться, что синтетические голоса исчезнут совсем, но, по крайней мере, актёрам необходимо предоставить возможность не соглашаться на их использование».

Пожалуйста, оцените статью:
Ваша оценка: None Средняя: 4 (2 votes)
Источник(и):

Хабр