Новая ИИ-модель Google позволит людям понимать язык дельфинов
Компания Google снова удивила мир технологий, представив свою новую разработку под названием DolphinGemma. Эта большая языковая модель предназначена для того, чтобы помочь ученым разобраться в сложных звуковых сигналах дельфинов и, вероятно, понять их "разговоры".
Об этом пишет Neowin.
Проект реализуется совместно с исследователями Технологического института Джорджии и командой Wild Dolphin Project (WDP), которую возглавляет доктор Дениз Херзинг. Организация давно изучает природную среду и поведение дельфинов, прежде всего атлантических пятнистых, фиксируя их социальные структуры, привычки и звуковые сигналы. Многолетний опыт WDP позволил сопоставить определенные типы звуков с конкретным поведением животных:
- Индивидуальные посвисты — служат своеобразными "именами" и помогают матерям и детенышам находить друг друга.
- "Сквоки" — часто встречаются во время агрессивных схваток.
- Щелчки-баззы — обычно раздаются при ухаживаниях или в момент, когда дельфины преследуют акул.
Как работает новая модель
DolphinGemma создана на базе собранных WDP аудиоданных. Благодаря собственному токенизатору SoundStream она "раскладывает" сложные дельфиньи сигналы на меньшие фрагменты и анализирует их по принципу, подобному работе речевых моделей для человеческой речи. Вместо слов или изображений алгоритм обрабатывает исключительно аудио и прогнозирует, какой звук должен прозвучать следующим.
Важно, что DolphinGemma не является громоздким проектом: примерно 400 млн параметров позволяют запускать модель даже непосредственно на смартфонах. Исследователи из WDP используют Google Pixel, поэтому не нуждаются в специализированном оборудовании, которое сложно обслуживать в открытом море.
До появления DolphinGemma в фокусе ученых была система CHAT (Cetacean Hearing Augmentation Telemetry). Она пыталась установить простой "общий словарь" с дельфинами благодаря синтетическим посвистам, которые ассоциировались с определенными объектами — от водорослей до различных игрушек. Новая модель от Google позволяет глубже исследовать вероятные паттерны в "языке" морских млекопитающих.
Другие исследователи смогут воспользоваться DolphinGemma уже летом, чтобы иметь возможность применять модель для анализа акустических баз данных и ускорить изучение интеллектуальных дельфинов.
Напомним, в Gemini Live появились новые функции. Теперь искусственный интеллект от Google может "видеть" экран смартфона пользователя и предоставлять ответы в режиме реального времени.
Также мы писали, что искусственный интеллект представляет угрозу для популярных сервисов электронной почты. Эксперты предупреждают, что на горизонте появляются фишинговые атаки на базе больших языковых моделей.
Читайте Новини.live!