Школяр виявив 1,5 млн космічних об'єктів, які пропустило NASA

Ілюстративне зображення галактики. Фото: Unsplash

Архів телескопа NEOWISE, що накопичував спостереження неба протягом десяти років, приховував величезний масив даних про змінні космічні об'єкти. Розібратися з ним зміг школяр зі США, який створив алгоритм машинного навчання та виявив 1,5 мільйона потенційно важливих джерел — від змінних зірок до квазарів.

Про це пише Indian Defence Review.

Як школяр узявся за задачу, з якою не справлялися звичайні методи

Протягом десяти років телескоп NEOWISE сканував небо в інфрачервоному діапазоні для пошуку астероїдів поблизу Землі. Разом із цим він збирав інформацію і про все інше, що потрапляло в поле зору: далекі зірки, галактики, квазари та інші об'єкти.

Після завершення місії у 2024 році залишився архів майже з 200 мільярдів окремих виявлень. Астрономи розуміли, що в цих даних можуть бути приховані сигнали від пульсуючих зірок, затемнюваних подвійних систем і далеких активних об'єктів, однак практично обробити такий масштаб вручну було неможливо, а стандартні комп'ютерні підходи виявилися надто повільними.

Саме на цьому тлі до роботи долучився Маттео Паз — підліток із середньої школи Пасадени. Під час літнього стажування в лабораторії Каліфорнійського технологічного інституту він запропонував не обмежуватися невеликою ділянкою неба, а побудувати модель, яка змогла б пройтися по всьому масиву даних.

Створена ним модель отримала назву VARnet. Її архітектура поєднала кілька етапів обробки часових рядів, щоб відфільтровувати помилкові вимірювання, витягувати періодичні сигнали з нерівномірно зібраних кривих блиску та класифікувати джерела за типом змінності.

Особливу складність створював сам характер спостережень NEOWISE. Телескоп не повертався до кожної зорі за суворим графіком, а сканував небо великими колами, через що дані збиралися нерівномірно — блоками з інтервалами у місяці. Саме тому для такого архіву потрібен був підхід, який уміє працювати з непослідовними часовими вимірами.

Після аналізу система розподіляла об'єкти на чотири категорії:

  • незмінні джерела;
  • тимчасові події;
  • власні пульсатори;
  • затемнювані подвійні системи.

У підсумку модель змогла працювати з надзвичайно високою швидкістю — приблизно 53 мікросекунди на одну зорю.

Що саме вдалося знайти в архіві

Коли VARnet запустили на повному масиві даних, алгоритм виявив 1,5 мільйона кандидатів у змінні об'єкти. Кожен із них ще потребує додаткової перевірки та спостережень, але сам масштаб результату показав, скільки важливої інформації роками залишалося фактично прихованим у відкритому архіві.

Частина цих об'єктів, імовірно, виявиться вже відомими джерелами, які просто вперше описали в інфрачервоному діапазоні. Частина може бути хибнопозитивними спрацюваннями. Але серед них також можуть бути справді нові квазари, змінні зорі та інші тимчасові події, яких раніше не каталогізували.

Нові методи аналізу даних допомагають ученим швидше досліджувати складні космічні об'єкти, зокрема атмосфери екзопланет. Це дозволяє ефективніше обробляти великі масиви спостережень і точніше відокремлювати корисні сигнали від шуму.

Дослідження Марса також приносять нові відкриття: марсохід Perseverance вперше зафіксував корунд у породах планети. Такі знахідки допомагають краще зрозуміти геологічну історію Марса та умови його формування.