Новая методика позволяет модели лучше учитывать человеческое восприятие звука.
Учёные создали новую модель глубокого обучения, которая обещает значительное улучшение качества аудио в реальных сценариях, используя ранее недооцененный инструмент: восприятие человека, сообщает Total.kz со ссылкой на Ferra.
Модель, обученная на двух наборах данных, включающих записи разговоров с фоновыми шумами, превзошла другие стандартные подходы в минимизации наличия шумов в аудиозаписях.
Она использует метод совместного обучения, включающий специализированный модуль языка улучшения речи с предиктивной моделью оценки, антиципирующей оценку среднего мнения человеческого слушателя. Эта новая методика позволяет модели лучше учитывать человеческое восприятие звука, что существенно повышает качество обработки речи.
Учитывая важность улучшения качества звука для слуховых аппаратов, систем распознавания речи и других технологий, эта модель открывает путь к будущим технологиям, которые могут в реальном времени улучшать аудио и обогащать общее восприятие звуковой среды.