Новая ИИ-модель Google позволит людям понимать язык дельфинов

Дельфин в воде. Фото: Unsplash

Компания Google снова удивила мир технологий, представив свою новую разработку под названием DolphinGemma. Эта большая языковая модель предназначена для того, чтобы помочь ученым разобраться в сложных звуковых сигналах дельфинов и, вероятно, понять их "разговоры".

Об этом пишет Neowin.

Проект реализуется совместно с исследователями Технологического института Джорджии и командой Wild Dolphin Project (WDP), которую возглавляет доктор Дениз Херзинг. Организация давно изучает природную среду и поведение дельфинов, прежде всего атлантических пятнистых, фиксируя их социальные структуры, привычки и звуковые сигналы. Многолетний опыт WDP позволил сопоставить определенные типы звуков с конкретным поведением животных:

  • Индивидуальные посвисты — служат своеобразными "именами" и помогают матерям и детенышам находить друг друга.
  • "Сквоки" — часто встречаются во время агрессивных схваток.
  • Щелчки-баззы — обычно раздаются при ухаживаниях или в момент, когда дельфины преследуют акул.

Как работает новая модель

DolphinGemma создана на базе собранных WDP аудиоданных. Благодаря собственному токенизатору SoundStream она "раскладывает" сложные дельфиньи сигналы на меньшие фрагменты и анализирует их по принципу, подобному работе речевых моделей для человеческой речи. Вместо слов или изображений алгоритм обрабатывает исключительно аудио и прогнозирует, какой звук должен прозвучать следующим.

Важно, что DolphinGemma не является громоздким проектом: примерно 400 млн параметров позволяют запускать модель даже непосредственно на смартфонах. Исследователи из WDP используют Google Pixel, поэтому не нуждаются в специализированном оборудовании, которое сложно обслуживать в открытом море.

До появления DolphinGemma в фокусе ученых была система CHAT (Cetacean Hearing Augmentation Telemetry). Она пыталась установить простой "общий словарь" с дельфинами благодаря синтетическим посвистам, которые ассоциировались с определенными объектами — от водорослей до различных игрушек. Новая модель от Google позволяет глубже исследовать вероятные паттерны в "языке" морских млекопитающих.

Другие исследователи смогут воспользоваться DolphinGemma уже летом, чтобы иметь возможность применять модель для анализа акустических баз данных и ускорить изучение интеллектуальных дельфинов.

Напомним, в Gemini Live появились новые функции. Теперь искусственный интеллект от Google может "видеть" экран смартфона пользователя и предоставлять ответы в режиме реального времени.

Также мы писали, что искусственный интеллект представляет угрозу для популярных сервисов электронной почты. Эксперты предупреждают, что на горизонте появляются фишинговые атаки на базе больших языковых моделей.