Основной целью эксперимента было желание понять потребности и эмоции собак, чтобы улучшить их взаимодействие с человеком. Для исследования понадобились аудиозаписи вокальных сигналов собак, сделанные в естественной среде.
Ученые выбрали около 70 питомцев разного пола в возрасте от 5 месяцев и до 7 лет. Основных пород было три — чихуахуа, французский пудель и шнауцер. С разрешения владельцев в домашней обстановке животным предлагали различные ситуации и записывали их реакцию: собакам предстояло встретиться с незнакомцем, защитить хозяина при нападении, поучаствовать в игре и отреагировать на ласковые слова.
Затем исследователи обработали весь полученный материал и сделали небольшие звуковые нарезки. Аудиофрагменты рассортировали на 4 группы: агрессивный и обычный лай на незнакомого человека, лай при нападении на хозяина и во время игр.
При помощи языковой модели Wav2Vec2 ученые проанализировали записи. Почти в 60 % случаев нейросеть смогла определить породу собаки по ее лаю. На 50 % аудиофрагментов ИИ идентифицировал конкретную собаку по ее вокальным данным в разных ситуациях. Кроме того, языковая модель успешно распознала типы рычания и связала их с определенным контекстом. Самой сложной задачей для нейросети оказалось выявление пола питомца — здесь точность была заметно ниже.
По словам ученых, результаты эксперимента доказывают, что для расшифровки коммуникации собак подходит ИИ, предназначенный для анализа человеческой речи. В дальнейшем планируется расширить исследование и включить в анализ как можно больше пород, увеличив разнообразие выборки. Подобным методом можно изучать не только коммуникацию домашних животных, но и млекопитающих в дикой природе, чтобы расширить представление о способах их взаимодействия друг с другом.
