Почему важны сигнальные и фоновые события? Какие существуют виды экспериментальных ошибок? Для чего нужны псевдоэксперименты? На эти и другие вопросы отвечает кандидат физико-математических наук Лев Дудко.

Новые интересные явления — это практически всегда редкие явления. И для того, чтобы экспериментально измерить и зарегистрировать какое-то редкое явление, нам нужно либо иметь достаточную статистику экспериментальных данных, либо, соответственно, хорошо оптимизировать все этапы анализа, чтобы на доступной экспериментальной статистике измерить что-то более новое и то, что еще не измерено до сих пор.

Статистика экспериментальных данных определяется аппаратной частью ускорителей, детекторов. Это так называемая светимость эксперимента, и ее мы имеем обычно как данность. То есть на основании базы технических возможностей мы получаем максимально большую статистику экспериментальных результатов. Дальше идет этап оптимизации всех составляющих экспериментального анализа, чтобы получить какой-то результат, который бы характеризовал нам редкое и интересное явление, которое мы пытаемся зарегистрировать.

В первую очередь для того, чтобы измерить какое-то новое интересное явление, нам нужно его смоделировать, потому что редко когда идет поиск того, чего мы в принципе не представляем, такие случаи в последнее время достаточно редки. Как правило, мы с теоретической точки зрения знаем о том, какие возможности существуют, какие возможности не противоречат законам сохранения, существующим экспериментальным результатам, и дальше мы пытаемся найти такие условия, чтобы проявились те или иные возможности. Соответственно, точное их моделирование — это очень важная составляющая, причем моделирование с учетом высших порядков, высших радиационных поправок и так далее.

Рекомендуем по этой теме:
12500
Ускорители частиц

Так как все события статистические, у нас, как правило, помимо сигнальных событий, то есть событий того эффекта, который мы хотим исследовать, есть еще и события, которые мы называем фоном, которые как бы мимикрируют тот сигнал, тот эффект, но при этом этого эффекта там нет. И это всегда какой-то баланс между проявлением искомого эффекта и теми событиями фона, которые нам мешают его зарегистрировать. То есть достаточно точное моделирование сигнальных и фоновых событий — это один из ключевых моментов. То есть на основании этого мы можем снизить экспериментальную ошибку и провести более точные измерения.

После того как мы правильно и точно смоделировали сигнальные и фоновые события, мы можем попробовать найти наиболее оптимальные условия, при которых в эксперименте мы можем выделить этот эффект. Это так называемый феноменологический анализ этих смоделированных событий, при которых мы находим области фазового пространства и различные другие условия, которые нам помогут повысить отношение сигнала к шуму и выявить, проявить в экспериментальных данных именно искомый эффект.

Далее идет выделение набора наблюдаемых характеристик, которые наиболее полно отражали бы различия сигнальных и фоновых процессов. Если речь о многих характеристиках — соответственно, бывает и десять, и двадцать, и больше характеристик, — то мы должны их как-то скоррелированно исследовать. И для этого используются многомерные методы анализа, которые скоррелированно анализируют пространство этих наблюдаемых характеристик.

На основании какого-то выхода из этого многомерного анализа мы можем сказать о вероятности в данных событиях проявления этого эффекта или его отсутствия.

Возможны случаи, когда наблюдаемая характеристика только одна. Например, когда мы ищем какие-то резонансы, которые проявляются в виде пика по инвариантной массе. Во всех остальных случаях в настоящее время это, как правило, многомерный анализ. Раньше использовались счетные эксперименты, когда мы могли посчитать количество событий в данных, количество ожидаемых событий для нашего сигнала и количество фоновых событий. И на основании этого соотношения — естественно, все эти числа будут с ошибками — с учетом ошибок мы могли бы дать какое-то статистически достоверное заключение.

В современных анализах, как правило, стараются оптимизировать и используют форму дискриминантов. То есть если используются нейронные сети, например, как многомерный анализ, то строится одномерный дискриминант нейронной сети, в котором сильно проявляются отличия формы для сигнальных событий, фоновых событий. И на основании распределения данных по этому дискриминанту и того, как распределяются смоделированные события для сигнала и фона, мы можем на основании сравнения этих форм дать гораздо более точный результат о том или ином эффекте.

Естественно, очень важная часть в таких исследованиях — это учет экспериментальной ошибки. Это систематическая и статистическая ошибка. Систематическая ошибка делится, как правило, на три вида. То есть это учет неопределенности в нормализации нашей модели — каждое число, которое мы в модели получаем, имеет свою ошибку, и это какая-то общая нормализация тех или иных процессов, то есть, грубо говоря, вероятность тех или иных процессов.

Следующий тип неопределенности — это учет изменения формы, то есть то, что мы неправильно моделируем форму этого дискриминанта или какой-то переменной для того или иного процесса, и эта ошибка учитывается другим образом.

Третья ошибка — это учет нескоррелированного изменения формы, когда изменение формы у нас в одной части распределения совершенно никак не связано с изменением формы в другой части распределения. Для этого уже, как правило, используются псевдоэксперименты и свои способы учета такой систематики. Естественно, необходимо учитывать и статистическую ошибку как в смоделированных событиях, так и в экспериментальных данных.

Существуют специальные методы скоррелированного учета всех этих вещей и вариации форм таких дискриминантов. На основании такой вариации обычно делается заключение. Если это измеряется какой-то эффект, например вероятность какого-то процесса, то смотрится, с какой статистической достоверностью этот эффект зарегистрирован.

Что такое статистическая достоверность? Для измерения это возможность фоновых процессов сфлуктуировать до измеренного значения. То есть если эта вероятность выходит за три стандартных отклонения для фона, например, то это считается наблюдением этого эффекта. Если эта флуктуация выходит за пять стандартных отклонений, то это уже считается открытием такого эффекта. И если недостаточная статистика или эффект не обнаружен, то ставится экспериментальное ограничение на существование этого эффекта. Экспериментальное ограничение обычно характеризуется уровнем достоверности, оно пишется. Используется в настоящее время два стандартных отклонения. То есть если этот эффект в пределах двух стандартных отклонений фона, то говорится о том, что до таких пор этот эффект не зарегистрирован. Например, это может касаться массы возможного нового резонанса, это может касаться какого-то параметра, характеризующего новую физику или какую-то другую характеристику, которая показала бы нам, что такой эффект присутствует в природе. Достоверность получаемых результатов у каких-то редких и новых явлений зависит в первую очередь от возможной статистики в эксперименте и оптимизации анализа.

В будущем каждая из этих составляющих развивается. Естественно, все новые коллайдеры, новые эксперименты позволят исследовать какие-то эффекты на большей статистике, на бо́льших энергиях. И методы анализа, которые применяются, развиваются. То есть если 20 лет назад, например, как правило, это были счетные эксперименты или максимум использовались функции правдоподобия, то сейчас без какого-то многомерного анализа на основе нейронных сетей или деревьев решений уже считается, что это недостаточно оптимальный результат.

Итак, на будущих экспериментах мы можем ожидать, что эффективность и статистика существенно улучшатся, можно будет исследовать те явления и эффекты, которые недоступны нам сейчас.