Как построен процесс определения геномной последовательности? Какие существуют методы метаболической реконструкции? И какое значение они приобретают в биоинформатике? Об этом рассказывает доктор биологических наук Михаил Гельфанд.

Метаболическая реконструкция — это когда мы имеем в руках геном бактерии, выписанный в виде последовательности символов, и хотим понять, как эта бактерия живет. На самом деле это применимо не только к бактериям, но для бактерии это реально. Для более сложных существ это пока что хуже получается. Геном бактерии — это последовательность ее ДНК. И сейчас имеются методы, которые позволяют эту последовательность определять довольно легко. Типичный геном — это где-то от полумиллиона до нескольких миллионов нуклеотидов, вот этих элементарных бактериальных кирпичиков.

Ген — это участок генома, который кодирует белок (может быть, что-то другое, но в первом приближении достаточно считать, что белок). Есть статистические разные другие методы, для того чтобы определять эту непрерывную цепочку нуклеотидов и определять на участке соответствующие гены. Это делается стандартными методами, они были сделаны где-то в 90-х годах и с тех пор немножко совершенствуются, но, в общем-то, идеи там уже готовые. А вот дальше начинается этап определения функций этих последовательностей. И самое простое, что можно сделать, — это взять какой-то белок, закодированный в геноме, и сравнить его со всеми белками, функции которых уже известны.