Наука
ArXiv: создана нейросеть для расшифровки сигналы собачьего лая и рычания
Автор: Елена Мальцева
11 июня 2024, 08:57
Международная команда ученых из Мичиганского университета в США и Национального института астрофизики, оптики и электроники в Мексике представила инновационный инструмент на основе искусственного интеллекта (ИИ), способный трактовать значения звуков, издаваемых собаками. Результаты этого исследования были опубликованы на портале arXiv, специализирующемся на нерецензируемых научных статьях.
На конференции по компьютерной лингвистике и языковым ресурсам ученые представили данные проекта, в рамках которого собрана информация о лае 74 собак. Возраст животных варьировался от пяти до 84 месяцев, средний возраст составил 35 месяцев. В исследовании участвовали преимущественно чихуахуа, французские пудели и шнауцеры.
Специалисты провели эксперименты с собаками, подвергая их различным стимулам, вызывающим разные типы вокализации. Среди этих стимулов было присутствие незнакомца, игровое взаимодействие, ласковые разговоры владельца, а также имитация нападения на хозяина. Аудиоклипы были разбиты на короткие фрагменты и вручную аннотированы в зависимости от контекста.
Базой для исследования послужила сложная модель искусственного интеллекта Wav2Vec2, изначально разработанная для распознавания человеческой речи. Ученые модифицировали эту модель с помощью собственного набора данных о вокализации собак.
Результаты показали, что модель искусственного интеллекта успешно справляется с распознаванием отдельных собак по их лаю с точностью до 50%, а также способна отличать агрессивные звуки от обычных голосовых сигналов.
Ранее «ЭкоПравда» информировала о том, что собаки лучше тестов обнаруживают ковид.
Больше актуальных новостей и эксклюзивных видео смотрите в телеграм канале "ЭкоПравда". Присоединяйтесь!
Подписывайтесь на ЭкоПравда: