«Яндекс» разрабатывает нейросеть SpeechGPT: как она будет работать

Друзья, с момента основания проекта прошло уже 20 лет и мы рады сообщать вам, что сайт, наконец, переехали на новую платформу.

Какое-то время продолжим трудится на общее благо по адресу https://n-n-n.ru.
На новой платформе мы уделили особое внимание удобству поиска материалов.
Особенно рекомендуем познакомиться с работой рубрикатора.

Спасибо, ждём вас на N-N-N.ru

Компания «Яндекс» разрабатывает новую нейросетевую модель под названием SpeechGPT и ищет специалиста по машинному обучению для своей команды, сообщает «Коммерсантъ» со ссылкой на раздел вакансий компании.

В «Яндексе» подтвердили Forbes, что работают над внедрением мультимодальности в голосовом помощнике «Алиса». В компании отметили, что их продукты уже используют технологии мультимодальности, например, «Алиса» может обрабатывать как текст, так и голос, а поисковый сервис «Нейро» — текст и изображения.

«Мы продолжаем развивать мультимодальность, чтобы предоставлять пользователям наших продуктов еще больше возможностей,» — сообщили в «Яндексе».

Однако, как объяснил «Коммерсанту» сооснователь Just AI Кирилл Петров, «мультимодальный пользовательский опыт» — возможность использования сервиса как голосом, так и текстом — отличается от мультимодальности самой модели.

«Например, в случае с голосовым ассистентом, речь сначала преобразуется в текст одной моделью, этот текст анализируется другой моделью, а третья модель преобразует текст ответа в речь,» — объясняет Петров.

Этот процесс занимает больше времени и приводит к упрощениям. Мультимодальные модели, такие как GPT-4, разработанная OpenAI, обрабатывают весь контент без задержек. По словам Петрова, будущее развития ИИ именно за такими технологиями.

Эксперт в области ИИ и продвинутой аналитики компании Axenix Владимир Кравцев считает, что минимально жизнеспособная версия SpeechGPT (MVP) может быть выпущена в ближайшие месяцы, после чего начнется процесс ее постоянного улучшения. По его мнению, SpeechGPT будет интегрирована в существующие сервисы «Яндекса», связанные с коммуникацией с клиентами и партнерами, постепенно заменяя более простые модели на современные.

Директор по продукту Hybrid Светлана Другова полагает, что новая модель «Яндекса» вряд ли сможет конкурировать по возможностям с мультимодальными моделями Google семейства Gemini или OpenAI, так как их разработка требует миллиардных вложений. Однако, благодаря имеющимся наработкам, затраты «Яндекса» будут значительно ниже, добавляет она.

Пожалуйста, оцените статью:
Ваша оценка: None Средняя: 5 (1 vote)
Источник(и):

ХайТек