Что уже сделано на пути к созданию искусственного интеллекта? Как отсканировать лицо человека? Какие этапы должно пройти изображение, чтобы стать трехмерным объектом? Об этом рассказывает кандидат физико-математических наук Станислав Протасов.

У человека есть язык и нос, а в качестве аналога среди технических средств существуют газоанализаторы, которые умеют понимать запахи. Или же, если мы говорим о слухе, для примера можно привести речевые анализаторы. Siri в iPhone — это пример электронного уха, которое понимает вашу речь и знает, что вы сказали. В качестве аналога зрению человека, то есть двум глазам и механизму в мозге, который осуществляет анализ данных, можно назвать целую отрасль компьютерной науки — компьютерное зрение.

Рекомендуем по этой теме:
6282
Внутренняя разработка в Computer Science
У вас есть много изображений, снятых каким-то образом, с каким-то отличающимся параметром. Это может быть угол поворота, освещение или что-то еще. И задача искусственно-интеллектуальных систем — восстановить трехмерную картинку, создать модель того объекта, который был снят. Это задача, которую мы с вами решаем на протяжении всего дня: смотрим куда-то и оцениваем расстояние до объекта, его форму, какие-то выступающие части. Наш мозг это делает в фоновом режиме.

Самый развитый и исследуемый подход в построении трехмерных моделей по изображениям — подход стереосопоставлений. У нас есть изображения, снятые с разных ракурсов. И есть физический принцип — принцип параллакса. Если вы перемещаетесь относительно какого-то объекта, то более удаленные детали перемещаются медленнее, чем-то, что находится рядом с вами. Если вы смотрите в окно в поезде, вы видите, что деревья мелькают, а горизонт почти не изменяется. Задача алгоритмов стереосопоставления в том, чтобы находить на изображениях соответствия между точками, установить смещение и по смещению определить расстояние до этой точки.