Актуальные новости на сегодня
  • Главная
  • В мире
  • В России
  • Ценности
  • Строительство
  • Наука
  • Интернет
  • Шоу бизнес
Безрезультатно
Просмотреть все результаты
Актуальные новости на сегодня
  • Главная
  • В мире
  • В России
  • Ценности
  • Строительство
  • Наука
  • Интернет
  • Шоу бизнес
Безрезультатно
Просмотреть все результаты
Актуальные новости на сегодня
Безрезультатно
Просмотреть все результаты
Главная Интернет

Microsoft создала инструмент для подделки голоса любого человека, включая тон и эмоции

10 января, 2023
в Интернет

Содержание:

  • 1 Новое слово в TTS
  • 2 Пока не для всех
  • 3 Опасная технология
  • 4 Microsoft и искусственный интеллект

Новое слово в TTS

Microsoft создала новую систему синтеза речи (Text-to-speech; TTS). Инструмент позволяет генерировать аудиосообщения, произнесенные голосом любого человека на основе лишь короткого фрагмента его речи.

Система базируется на языковой модели Vall-E, также разработанной Microsoft. Работа, описывающая эксперименты с использованием Vall-E, опубликована на сайте arxiv.org (поддерживается Корнельским университетом в США).

Перед проведением испытаний нейросеть прошла обучение на 60 тыс. часов аудиозаписей речи более чем 7 тыс. уникальный носителей английского языка. Это, как отмечают ученые, в сотни раз более крупный массив данных по сравнению с теми, что использованы при обучении всех прочих ныне существующих моделей.

Microsoft создала инструмент для подделки голоса любого человека, включая тон и эмоции

Схема работы Vall-E

Для выполнения своей функции Vall-E достаточно трехсекундного образца речи, особенности которой необходимо имитировать, а также текстового сообщения, которое будет преобразовано в аудиоформат.

«Результаты экспериментов показывают, что Vall-E значительно превосходит современные системы синтеза речи с точки зрения естественности речи и сходства говорящих, – говорится в документе.

Пока не для всех

Широким массам Vall-E пока не доступна, однако с первыми результатами ее работы может ознакомиться всякий желающий. Примеры, опубликованны исследователями на GitHub. Что касается их качества, то некоторые из них звучат убедительно – особенности голоса говорящего и манера его речи практически идентичны таковым в оригинальной записи. Искусственное происхождение других достаточно легко определить на слух. Вероятно, на конечный результат влияет в том числе и качество «скормленных» нейросети образцов речи. В частности, исследователи использовали реплики из наборов данных LibriSpeech, VCTK, Fisher.

Выложенные примеры также демонстрирует способность инструмента сохранять эмоции говорящего и акустическую среду (особенности помещения или оборудования, с использованием которых производилась запись), представленные в оригинальной аудиозаписи. Так, исследователям с разным успехом удалось заставить Vall-E имитировать злость, сонливость, изумление и отвращение.

Читать также:
Легендарный «Энвижн» прекратил существование

Опасная технология

Группа исследователей, стоящих за Valle-E, в своей работе отмечает опасность разрабатываемой технологии в случае попадания ее в «неправильные руки». С ее помощью в теории мошенники могут обмануть системы идентификации личности или выдать себя, к примеру, за авторитетную публичную фигуру с целью ее дискредитации.

Одним из возможных решений данной проблемы ученые называют создание системы выявления «аудиофейков», то есть сгенерированных Vall-E голосовых сообщений. Исследователи также отмечают, что планируют и в дальнейшем придерживаться принципов ответственного подхода к использованию искусственного интеллекта, разработанного Microsoft.

Microsoft и искусственный интеллект

По сообщению Semafor, корпорация Microsoft намерена инвестировать $10 млрд в организацию OpenAI, которая занимается разработкой и лицензированием технологий на основе искусственного интеллекта. В Microsoft данную информацию комментировать отказались.

В 2019 г. гигант из Редмонда вложил в OpenAI $1 млрд. Компании планировали совместными усилиями совершенствовать облачный сервис Microsoft Azure за счет технологий ИИ.

Помимо прочего, OpenAI разработала систему генерации изображений по текстовому описанию Dall-E и чат-бот ChatGPT на основе языковой модели GPT-3.5.

Прототип ChatGPT был запущен в ноябре 2022 г. и моментально привлек к себе пристальное внимание публики, отметившись подробными и четко сформулированными ответами на вопросы, относящиеся к самым разным областям знаний. Как писал CNews, корпорация Google видит реальную угрозу своему поисковому бизнесу, который приносит ей львиную долю доходов.

В начале января 2023 г. The Information сообщило о том, что Microsoft планирует улучшить собственный поисковый движок Bing за счет технологий, лежащих в основе ChatGPT. По данным источника, новые функции в поисковике появятся до конца марта 2022 г.

Кроме того, в октябре 2022 г. корпорация пообещала интегрировать в Bing возможности Dall-E.

Предыдущая запись

На Солнце произошла вторая по силе вспышка с 2017 года

Следующая запись

Как Киркоров накопил недвижимости на 6 миллиардов?!

ПОХОЖИЕ НОВОСТИ

Практические советы по администрированию серверов на Linux

Практические советы по администрированию серверов на Linux

4 февраля, 2026

Для специалистов, работающих с серверными системами, администрирование Linux-серверов является одной из важнейших задач. Подробное руководство и полезные материалы по данной...

Покупка iPhone: как не ошибиться и получить настоящий Apple

Покупка iPhone: как не ошибиться и получить настоящий Apple

16 января, 2026

iPhone — один из самых популярных смартфонов в мире, но именно поэтому он часто становится целью подделок и мошеннических схем....

Онлайн-шопинг мужской одежды: Ваш гид по миру стиля

Онлайн-шопинг мужской одежды: Ваш гид по миру стиля

30 ноября, 2025

Современный мужчина ценит свое время и комфорт, поэтому онлайн-шопинг мужской одежды становится все более популярным. Возможность выбирать и заказывать стильные...

Как обеспечить бесперебойную и эффективную поддержку интернет-магазина

Как обеспечить бесперебойную и эффективную поддержку интернет-магазина

12 ноября, 2025

При создании и развитии интернет-магазина важным ориентиром становится ресурс, такой как например  cetera.ru, предлагающий инструменты и решения для профессиональной поддержки...

Следующая запись
Как Киркоров накопил недвижимости на 6 миллиардов?!

Как Киркоров накопил недвижимости на 6 миллиардов?!

Власти Британии пока не решили, отправлять ли Украине танки Challenger 2

Власти Британии пока не решили, отправлять ли Украине танки Challenger 2

НОВОЕ НА САЙТЕ

Эксперт заявил, что Пакистан прекратил поставки снарядов ВСУ полтора года назад

Иран угрожает США неприемлемым ущербом и надеется на помощь Китая

17 февраля, 2026
Мазаев рассказал о судьбе наследников

Мазаев рассказал о судьбе наследников

17 февраля, 2026
Преимущества и особенности аутсорсинга персонала для бизнеса

Преимущества и особенности аутсорсинга персонала для бизнеса

17 февраля, 2026
Мухин осудил политически мотивированный приговор одному из карабахских лидеров

Мухин осудил политически мотивированный приговор одному из карабахских лидеров

17 февраля, 2026
Буквы световые: инновационный подход к визуальной коммуникации

Буквы световые: инновационный подход к визуальной коммуникации

16 февраля, 2026
Мини-погрузчики: универсальная техника для эффективной работы на площадке

Мини-погрузчики: универсальная техника для эффективной работы на площадке

16 февраля, 2026

О НАС

Актуальные новости на сегодня. Калейдоскоп событий, собранных нашими корреспондентами с разных уголков земного шара и на разные тематики

ПРИСОЕДИНЯЙСЯ!

РУБРИКАТОР

  • В мире
  • В России
  • Интернет
  • Наука
  • Обо всем
  • Строительство
  • Ценности
  • Шоу бизнес

© 2022 Fresh-recipes.ru. Все права защищены

Безрезультатно
Просмотреть все результаты
  • Fresh-recipes.ru

© 2022 Fresh-recipes.ru. Все права защищены