Дорогие читатели, Нашему шестнадцатилетнему, волонтёрскому и некоммерческому проекту для создания новой, современной версии N-N-N.ru, очень нужно посоветоваться касательно платформы нашего сайта – SYMFONY & DRUPAL 8. Платформа не простая, но обещаем – мы не займём много времени, просто нужна консультационная поддержка квалифицированного разраба. Если вы можете помочь, то связаться с нами можно на страницах Facebook.com здесь и здесь.

Речевая технология Baidu научилась имитировать акценты

Фото: EAST NEWS

Baidu улучшила систему преобразования текста в речь Deep Voice — теперь она может имитировать акценты. Также технология может обучиться на сотнях различных голосов всего за полчаса.

Система преобразования текста в речь Deep Voice от Baidu научилась отражать различия в региональных акцентах. Новая версия технологии, Deep Voice 2, может обучиться на сотнях различных голосов за полчаса, при этом будет достигнуто высокое качество звука, пишет Engadget.

Это впечатляющий результат, особенно если учесть, что предыдущая версия алгоритма обучалась около 20 часов. По данным Baidu, в отличие от прошлых систем преобразования текста в речь, Deep Voice 2 распознает сходства между голосами самостоятельно и без указаний. А потому он может учиться у большого количества голосов.

Систему распознавания голоса Deep Voice компания представила в марте этого года. Нейронная сеть Baidu может создавать качественный голос даже на основе небольших образцов записи голоса. В дальнейшем развитие подобных технологий приведет к тому, что цифровые помощники будут разговаривать с нами голосами, которые наиболее привычны нам.

По мнению генерального директора компании Робина Ли, переход от интернет-компаний к ИИ-компаниям позволит трансформировать различные отрасли промышленности, от автомобилестроения и электроники до домашней мебели. В марте Baidu также представила SwiftScribe — веб-приложение, которое расшифровывает речь с помощью искусственного интеллекта.

Пожалуйста, оцените статью:
Ваша оценка: None Средняя: 5 (3 votes)
Источник(и):

hightech.fm