Превратите свою шумную запись в профессиональный звук с помощью бесплатного инструмента искусственного интеллекта от Adobe.

Увеличить / Сервис Adobe Enhance Speech может удалить фоновый шум из некоторых голосовых записей. Adobe
Недавно Adobe выпустила бесплатный инструмент для обработки звука на базе искусственного интеллекта, который может улучшить некоторые записи голоса низкого качества, удалив фоновый шум и сделав голос громче. Когда это работает, результат выглядит как запись, сделанная в профессиональной звуковой кабине с высококачественным микрофоном.

Новый инструмент под названием Enhance Speech был создан в рамках исследовательского проекта по искусственному интеллекту под названием Project Shasta. Недавно Adobe переименовала Project Shasta в Adobe Podcast.

Enhancer Speech можно использовать бесплатно, но для него требуется учетная запись Adobe, и лучше всего он работает с настольным веб-браузером. После регистрации пользователи могут загрузить файл MP3 или WAV продолжительностью до часа или размером до 1 ГБ. Через несколько минут вы сможете прослушать результат в своем браузере или скачать полученный очищенный звук .

В наших тестах службы Enhance Speech лучше всего работала со звуком, содержащим голос, без перекрестных помех или чрезмерного шума. Например, мы записали звук со встроенного микрофона iMac человека, стоящего на расстоянии 10 футов, включая шум ближайшего вентилятора, и полученный звук (после обработки с помощью Enhance Speech) звучал так, как будто он был записан с близкого расстояния в бесшумной среде. . студия с профессиональным микрофоном.

Enlarge/Enhance Speech позволяет загружать файлы MP3 или WAV размером до 1 ГБ или продолжительностью до 1 часа. Adobe
Как это работает? Adobe не предоставила никаких подробностей, но мы подозреваем, что компания обучила модель глубокого обучения на протяжении многих (возможно, тысяч) часов чистого громкого звука. Затем модель могла бы «научиться» определять частоты человеческого голоса и синтезировать факсимиле, точно соответствующее источнику. Это предположение, пока Adobe не предоставит больше технических деталей, и мы не обратились к компании за комментариями.

По этому поводу некоторые комментаторы Hacker News сообщают о потрясающих результатах: неожиданные результаты, такие как фантомные голоса, когда ИИ неверно интерпретирует входной звук, чрезвычайно громкий звук (например, речь, записанная рядом с водопадом) или не говорящие по-английски. источников, предполагая, что Enhance Speech делает больше, чем просто обычная техника шумоподавления.

Enhance Speech – не первый инструмент, обеспечивающий такую возможность шумоподавления с помощью искусственного интеллекта. Например, пакет с открытым исходным кодом под названием mayavoz и коммерческая служба под названием Audo Studio делают что-то подобное.

Следует отметить, что Speech Enhancer является частью более крупной группы инструментов для подкастинга на основе ИИ от Adobe, включая инструмент Mic Check (в настоящее время также доступен бесплатно) и инструмент для редактирования аудио на основе транскрипции, который все еще находится в стадии разработки. только бета-тестирование.

Технологии Dec 20, 2022 0 22 Add to Reading List

Превратите свою шумную запись в профессиональный звук с помощью бесплатного инструмента искусственного интеллекта от Adobe.

Иллюстрация микрофон, предоставленный Adobe.

Недавно Adobe выпустила бесплатный инструмент для обработки звука на базе искусственного интеллекта, который может улучшить некоторые записи голоса низкого качества, удалив фоновый шум и сделав голос громче. Когда это работает, результат выглядит как запись, сделанная в профессиональной звуковой кабине с высококачественным микрофоном.

Новый инструмент под названием Enhance Speech был создан в рамках исследовательского проекта по искусственному интеллекту под названием Project Shasta. Недавно Adobe переименовала Project Shasta в Adobe Podcast.

Enhancer Speech можно использовать бесплатно, но для него требуется учетная запись Adobe, и лучше всего он работает с настольным веб-браузером. После регистрации пользователи могут загрузить файл MP3 или WAV продолжительностью до часа или размером до 1 ГБ. Через несколько минут вы сможете прослушать результат в своем браузере или скачать полученный очищенный звук .

В наших тестах службы Enhance Speech лучше всего работала со звуком, содержащим голос, без перекрестных помех или чрезмерного шума. Например, мы записали звук со встроенного микрофона iMac человека, стоящего на расстоянии 10 футов, включая шум ближайшего вентилятора, и полученный звук (после обработки с помощью Enhance Speech) звучал так, как будто он был записан с близкого расстояния в бесшумной среде. . студия с профессиональным микрофоном.

Enhance Speech позволяет загружать файлы MP3 или WAV размером до 1 ГБ или продолжительностью до 1 часа.

Как это работает? Adobe не предоставила никаких подробностей, но мы подозреваем, что компания обучила модель глубокого обучения на протяжении многих (возможно, тысяч) часов чистого громкого звука. Затем модель могла бы «научиться» определять частоты человеческого голоса и синтезировать факсимиле, точно соответствующее источнику. Это предположение, пока Adobe не предоставит больше технических деталей, и мы не обратились к компании за комментариями.

По этому поводу некоторые комментаторы Hacker News сообщают о потрясающих результатах: неожиданные результаты, такие как фантомные голоса, когда ИИ неверно интерпретирует входной звук, чрезвычайно громкий звук (например, речь, записанная рядом с водопадом) или не говорящие по-английски. источников, предполагая, что Enhance Speech делает больше, чем просто обычная техника шумоподавления.

Enhance Speech – не первый инструмент, обеспечивающий такую возможность шумоподавления с помощью искусственного интеллекта. Например, пакет с открытым исходным кодом под названием mayavoz и коммерческая служба под названием Audo Studio делают что-то подобное.

Следует отметить, что Speech Enhancer является частью более крупной группы инструментов для подкастинга на основе ИИ от Adobe, включая инструмент Mic Check (в настоящее время также доступен бесплатно) и инструмент для редактирования аудио на основе транскрипции, который все еще находится в стадии разработки. только бета-тестирование.