Большой адронный коллайдер — самый масштабный, дорогой и, возможно, самый сложный эксперимент, который когда-либо поставило человечество. Его концепция проста: мы берем баллон с водородом, подставляем его к вакуумной трубе, разгоняем сначала водород, потом протоны водорода, достигаем скоростей, близких к скоростям света, сталкиваем эти протоны, изучаем результат. Самое интересное начинается потом. Когда столкновение произошло, нам необходимо понять, какие процессы происходили во время столкновения и каким образом это повлияет на наши теории. Для этого мы используем специализированные фотоаппараты — детекторы. На Большом адронном коллайдере четыре больших и несколько маленьких детекторов.

Как выглядит информация, которая записывается на детекторах? У нас есть протонные пучки — сгустки протонов, которые разогнаны в кольце коллайдера. Есть много сгустков с одной стороны, много сгустков с другой стороны, они фокусируются в определенных местах с помощью больших мощных квадрупольных магнитов, и происходит столкновение на встречных курсах.

Каждый сгусток состоит из миллиардов протонов. При пересечении двух встречных сгустков может произойти столкновение протонов. На самом деле сталкиваются не два протона, а две составляющие части протона. Обычно это либо валентные кварки, либо морские кварки и глюоны, которые летают в изобилии вокруг сталкивающихся протонов.

Рекомендуем по этой теме:
12468
Ускорители частиц

Во время пересечения двух сгустков может произойти не одно столкновение, а несколько. А может не произойти ни одного. Необходимо понять, какая информация нам интересна, а какая нет. Для этого мы используем детекторы.

Детекторы немного сложнее, чем простые фотокамеры, но смысл примерно такой же. Чтобы зарегистрировать событие, мы строим детектор, состоящий из нескольких слоев — субдетекторов. Мы пытаемся поставить детектор как можно ближе к центру столкновения, но поставить очень близко нельзя, потому что вылетающие частицы и ошметки сгустков протонов могут повредить детектор. Необходимо начинать детектор достаточно далеко от собственно центра столкновений, но при этом не слишком далеко, чтобы большинство частиц, которые родились в этом центре столкновений, попало в детектор.

Таким образом, у нас есть фотокамера, которая очень сильно приближена к центру столкновений. Она очень большая и состоит из нескольких слоев. Например, несколько десятков метров для экспериментов Большого адронного коллайдера — это стандартная величина. Затем идет планирование эксперимента. Обычно вперед ставятся трекеры, задача которых — зарегистрировать природу частицы и на основании хитов, которые оставила частица в этом детекторе, понять, какая у нее была траектория.

Дальше в зависимости от целей эксперимента ставятся субдетекторы по разным технологиям. Обязательно есть колориметры. Где-то есть мюонная камера, которая регистрирует мюоны в самом конце эксперимента. Есть черенковские детекторы, есть время-проекционные камеры. Все это вместе — единая камера, которая пытается фотографировать каждое столкновение, каждое пересечение сгустков протонов. Фотография берется несколько миллионов раз в секунду, так как количество сгустков очень большое, а пересечения сгустков происходят примерно 40 миллионов раз в секунду.

Дальше нам необходимо принять решение, сохранять эту информацию или нет. Каждый субдетектор имеет свое представление о данных. Трекер представляет частицу в виде набора точек вдоль ее траектории. Черенковский трекер будет представлять пролетающую частицу в виде кольца или эллипса и нескольких точек на этом кольце или эллипсе. Колориметр представляет электрон в виде лепестка вторичных частиц: когда в колориметр попадает электрон, колориметр видит скорее такой лепесток засветки, чем какую-то траекторию. Также для разных субдетекторов характерно разное время обработки информации. Например, черенковские детекторы достаточно медленные, поэтому они не могут принимать участия в базовых характеристиках триггеров.

Дальше нам необходимо принять очень быстрое решение: записывать эту информацию или нет. Мы не можем записывать всю информацию, потому что одно событие — это один или несколько мегабайтов информации, и нельзя записывать 40 миллионов раз по одному мегабайту: это очень трудно. Кроме того, это еще не очень интересно. Многие события являются так называемыми пустыми событиями. То есть некоторые события не содержат никакую информацию о столкновениях (например, все частицы из этого столкновения не попали в детектор или что-то произошло и протоны не столкнулись в данном пересечении двух сгустков).

Чтобы дать вам представление о скорости, с которой необходимо принимать решения, могу привести простой пример. Первичная обработка происходит на компьютерной ферме, которая находится за бетонной стеной от детектора — очень глубоко под землей, практически сто метров под землей. Казалось бы, было бы удобнее для системных администраторов и аналитиков расположить эту компьютерную ферму наверху. Но дело в том, что сигнал от детектора должен будет добраться до поверхности, там должно быть принято решение, после чего сигнал должен вернуться на детектор с командой записывать событие. Время, за которое сигнал доходит до поверхности и возвращается обратно, будет очень важно для скорости принятия решений. Мы не можем расположить компьютерную ферму наверху, потому что это будет слишком долго.

Чтобы принять решение о том, записывать конкретное событие или нет, у нас есть система триггеров. Это система, которая должна принять решение, есть ли там физический процесс, который нам интересен, или нет, и отдать команду на запись события, чтобы это событие могло быть в дальнейшем обработано другими компьютерами. Эти триггеры должны быть очень быстрыми. Время принятия решения очень маленькое. События происходят с частотой 40 мегагерц, и нам необходимо быстро принимать решения.

Во время онлайн-обработки данных мы используем очень быстрые алгоритмы. Иногда эти алгоритмы не самые эффективные, потому что нам нужна не только эффективность, но и скорость. Например, в первом запуске коллайдера, так называемом Run 1, который происходил с 2010 по 2012 год, мы использовали приблизительные оценки для той или иной характеристики, на основе которых принималось триггерное решение.

Что происходит после того, как триггер принял решение? Фотография сохраняется. Потом скопление фотографий сохраняется в единый файл. Эти файлы поступают на обработку в дата-центры в разных местах мира. Через несколько месяцев эти данные будут доступны аналитикам для проведения физического анализа. Обычно до этого момента данные не поступают аналитикам. Конечно, бывают некоторые исключения.

Сейчас задача людей, которые занимаются развитием триггеров, заключается в сокращении времени между набором данных и началом собственно физического анализа. Физический анализ и так длится долго, поэтому необходимо как можно больше сократить первичную часть. Для этого мы внедряем более быстрые предсказания для методов машинного обучения, более точные, а главное, более быстрые вычисления. Сейчас мы уже добились того, что некоторые анализы можно начинать делать сразу после набора данных.