Актуальные новости на сегодня
  • Главная
  • В мире
  • В России
  • Ценности
  • Строительство
  • Наука
  • Интернет
  • Шоу бизнес
Безрезультатно
Просмотреть все результаты
Актуальные новости на сегодня
  • Главная
  • В мире
  • В России
  • Ценности
  • Строительство
  • Наука
  • Интернет
  • Шоу бизнес
Безрезультатно
Просмотреть все результаты
Актуальные новости на сегодня
Безрезультатно
Просмотреть все результаты
Главная Интернет

Microsoft создала инструмент для подделки голоса любого человека, включая тон и эмоции

10 января, 2023
в Интернет

Содержание:

  • 1 Новое слово в TTS
  • 2 Пока не для всех
  • 3 Опасная технология
  • 4 Microsoft и искусственный интеллект

Новое слово в TTS

Microsoft создала новую систему синтеза речи (Text-to-speech; TTS). Инструмент позволяет генерировать аудиосообщения, произнесенные голосом любого человека на основе лишь короткого фрагмента его речи.

Система базируется на языковой модели Vall-E, также разработанной Microsoft. Работа, описывающая эксперименты с использованием Vall-E, опубликована на сайте arxiv.org (поддерживается Корнельским университетом в США).

Перед проведением испытаний нейросеть прошла обучение на 60 тыс. часов аудиозаписей речи более чем 7 тыс. уникальный носителей английского языка. Это, как отмечают ученые, в сотни раз более крупный массив данных по сравнению с теми, что использованы при обучении всех прочих ныне существующих моделей.

Microsoft создала инструмент для подделки голоса любого человека, включая тон и эмоции

Схема работы Vall-E

Для выполнения своей функции Vall-E достаточно трехсекундного образца речи, особенности которой необходимо имитировать, а также текстового сообщения, которое будет преобразовано в аудиоформат.

«Результаты экспериментов показывают, что Vall-E значительно превосходит современные системы синтеза речи с точки зрения естественности речи и сходства говорящих, – говорится в документе.

Пока не для всех

Широким массам Vall-E пока не доступна, однако с первыми результатами ее работы может ознакомиться всякий желающий. Примеры, опубликованны исследователями на GitHub. Что касается их качества, то некоторые из них звучат убедительно – особенности голоса говорящего и манера его речи практически идентичны таковым в оригинальной записи. Искусственное происхождение других достаточно легко определить на слух. Вероятно, на конечный результат влияет в том числе и качество «скормленных» нейросети образцов речи. В частности, исследователи использовали реплики из наборов данных LibriSpeech, VCTK, Fisher.

Выложенные примеры также демонстрирует способность инструмента сохранять эмоции говорящего и акустическую среду (особенности помещения или оборудования, с использованием которых производилась запись), представленные в оригинальной аудиозаписи. Так, исследователям с разным успехом удалось заставить Vall-E имитировать злость, сонливость, изумление и отвращение.

Читать также:
«Дочка» «Ростеха» оставила МВД без крупного ИТ-сервиса: в проект заложили ОС без поддержки 4-ядерных «Эльбрусов»

Опасная технология

Группа исследователей, стоящих за Valle-E, в своей работе отмечает опасность разрабатываемой технологии в случае попадания ее в «неправильные руки». С ее помощью в теории мошенники могут обмануть системы идентификации личности или выдать себя, к примеру, за авторитетную публичную фигуру с целью ее дискредитации.

Одним из возможных решений данной проблемы ученые называют создание системы выявления «аудиофейков», то есть сгенерированных Vall-E голосовых сообщений. Исследователи также отмечают, что планируют и в дальнейшем придерживаться принципов ответственного подхода к использованию искусственного интеллекта, разработанного Microsoft.

Microsoft и искусственный интеллект

По сообщению Semafor, корпорация Microsoft намерена инвестировать $10 млрд в организацию OpenAI, которая занимается разработкой и лицензированием технологий на основе искусственного интеллекта. В Microsoft данную информацию комментировать отказались.

В 2019 г. гигант из Редмонда вложил в OpenAI $1 млрд. Компании планировали совместными усилиями совершенствовать облачный сервис Microsoft Azure за счет технологий ИИ.

Помимо прочего, OpenAI разработала систему генерации изображений по текстовому описанию Dall-E и чат-бот ChatGPT на основе языковой модели GPT-3.5.

Прототип ChatGPT был запущен в ноябре 2022 г. и моментально привлек к себе пристальное внимание публики, отметившись подробными и четко сформулированными ответами на вопросы, относящиеся к самым разным областям знаний. Как писал CNews, корпорация Google видит реальную угрозу своему поисковому бизнесу, который приносит ей львиную долю доходов.

В начале января 2023 г. The Information сообщило о том, что Microsoft планирует улучшить собственный поисковый движок Bing за счет технологий, лежащих в основе ChatGPT. По данным источника, новые функции в поисковике появятся до конца марта 2022 г.

Кроме того, в октябре 2022 г. корпорация пообещала интегрировать в Bing возможности Dall-E.

Предыдущая запись

На Солнце произошла вторая по силе вспышка с 2017 года

Следующая запись

Как Киркоров накопил недвижимости на 6 миллиардов?!

ПОХОЖИЕ НОВОСТИ

Как обеспечить бесперебойную и эффективную поддержку интернет-магазина

Как обеспечить бесперебойную и эффективную поддержку интернет-магазина

12 ноября, 2025

При создании и развитии интернет-магазина важным ориентиром становится ресурс, такой как например  cetera.ru, предлагающий инструменты и решения для профессиональной поддержки...

SEO продвижение сайта: Как профессиональные услуги выводят ваш бизнес в ТОП

SEO продвижение сайта: Как профессиональные услуги выводят ваш бизнес в ТОП

2 ноября, 2025

В современной конкурентной онлайн-среде просто иметь веб-сайт недостаточно. Чтобы привлечь целевую аудиторию, увеличить трафик и, в конечном итоге, повысить прибыль,...

Повышение эффективности сайта: Как улучшить видимость в поисковых системах

Повышение эффективности сайта: Как улучшить видимость в поисковых системах

24 октября, 2025

В условиях высокой конкуренции в интернете, крайне важно, чтобы ваш сайт был хорошо виден потенциальным клиентам в поисковых системах. Один...

Майнеры: от золотой лихорадки до современной вычислительной фермы

Майнеры: от золотой лихорадки до современной вычислительной фермы

20 октября, 2025

Тут, в сердце цифровой революции, появляется особый вид оборудования, получивший название «майнер». Это специализированный компьютер, способный выполнять огромные количества вычислений...

Следующая запись
Как Киркоров накопил недвижимости на 6 миллиардов?!

Как Киркоров накопил недвижимости на 6 миллиардов?!

Власти Британии пока не решили, отправлять ли Украине танки Challenger 2

Власти Британии пока не решили, отправлять ли Украине танки Challenger 2

НОВОЕ НА САЙТЕ

Родионов: Газовый транзит из РФ может быть восстановлен в 2026 году

Родионов: Газовый транзит из РФ может быть восстановлен в 2026 году

21 ноября, 2025
Ультразвуковая Диагностика: Загляните Внутрь с Помощью Современных УЗИ Аппаратов

Ультразвуковая Диагностика: Загляните Внутрь с Помощью Современных УЗИ Аппаратов

21 ноября, 2025
В Турции ответили на вопрос об организации переговоров по Украине

Раскрыта «большая победа» Зеленского в мирном плане США

21 ноября, 2025
Словацкие документалисты-энтузиасты помнят о роли СССР в освобождении Европы

Словацкие документалисты-энтузиасты помнят о роли СССР в освобождении Европы

21 ноября, 2025
В Польше сообщили о повреждении газопровода «Дружба»

Отказ от НАТО, признание Крыма, Донецка и Луганска российскими. О чем говорится в мирном плане США по Украине?

20 ноября, 2025
Политолог предрек США тоталитаризм при президентстве Харрис

Американист Дудаков: Трамп колеблется с началом войны с Венесуэлой

20 ноября, 2025

О НАС

Актуальные новости на сегодня. Калейдоскоп событий, собранных нашими корреспондентами с разных уголков земного шара и на разные тематики

ПРИСОЕДИНЯЙСЯ!

РУБРИКАТОР

  • В мире
  • В России
  • Интернет
  • Наука
  • Обо всем
  • Строительство
  • Ценности
  • Шоу бизнес

© 2022 Fresh-recipes.ru. Все права защищены

Безрезультатно
Просмотреть все результаты
  • Fresh-recipes.ru

© 2022 Fresh-recipes.ru. Все права защищены