Проектирование человеко-машинных интерфейсов

Сохранить в закладки
4967
12
Сохранить в закладки

Специалист по Computer Science Алексей Незнанов о том, как меняются пользовательские интерфейсы, что происходит с виртуальной средой и в каком мире мы будем жить к 2025 году

ПостНаука рассказывает о современных технологиях в проекте «Банк знаний», созданном совместно с Корпоративным университетом Сбербанка.

Проектирование человеко-машинного взаимодействия — одна из самых интересных областей как компьютерных наук, так и смежных сфер. Эта область характеризуется сейчас двумя основными свойствами. Первое: она связана с человеком и поэтому волей-неволей находится на стыке искусства и технологии или инженерии, потому что человек все-таки существо достаточно субъективное. Второе: у нас идет активное развитие компьютерной техники, а также очень много других интересных следствий научно-технической революции. Отсюда то, что раньше называлось, например, как говорил Дональд Норман, дизайном привычных вещей (это название его книги, которую сейчас можно прочитать и на русском языке), является основой жизни человека, которая во многом связана сейчас с искусственной средой обитания.

Если раньше мы в основном говорили о безопасности этой среды и у нас была наука эргономика, то сейчас больше говорят о том, что обозначается красивым словом, которое является калькой с английского и обычно произносится как «юзабилити» (usability). При этом специалистов в области проектирования интерфейсов с пользователем почти не волнует то, что есть множество смежных дисциплин, таких как промышленный дизайн, художественный дизайн и так далее. Отмечу, что эргономика до сих пор лежит в основе этой области. Почему? Потому что безопасность должна соблюдаться всегда. Отсюда, когда мы сейчас смотрим на развитие интерфейсов, мы должны понимать, что это постоянно компромисс и поиски его в новых областях. Например, если касаться интерфейсов дополненной реальности, виртуальной реальности и теперь уже смешанной реальности, то там безопасность становится главным вопросом. И когда будут решены уже проблемы безопасности, развитие идет в других областях. При этом, что особенно интересно, это развитие поддерживают как программно-аппаратные средства, так и всевозможные методологии.

Программно-аппаратные средства в основном делятся, с точки зрения юзабилистов, на два больших класса. Первое — то, что мы называем устройствами ввода-вывода. Это исторически сложившееся название, которое говорит о том, что мы раньше рассматривали компьютер именно как вычислительную машину; сейчас же, когда он входит и в большинство социальных процессов, устройства ввода-вывода стали неотъемлемой частью социальной среды. Как только мы говорим про социальную среду, то юзабилисты — это те люди, которые сейчас всегда участвуют в ее построении. Невозможно себе представить, например, сейчас кого-то, у кого нет в кармане сотового телефона. Это часть нашей жизни. Более того, еще раз вспомнив книгу «Дизайн привычных вещей», мы можем сказать, что именно тогда, когда эти вещи становятся привычными, они становятся по-настоящему интересны юзабилисту, для того чтобы глубоко проработать то, что называется сейчас уже не просто интерфейсом, а опытом взаимодействия.

По-английски это более интересно: мы различаем UX (user experience) и UI (user interface). При этом мне, например, не нравится перевод «пользовательский интерфейс». Почему? Потому что слово «интерфейс» имеет изначально два определения. Это внешняя часть системы, с помощью которой система взаимодействует с другой. И тогда можно говорить об интерфейсе человека, интерфейсе компьютера, интерфейсе телефона, интерфейсе какого-то объекта или системы. И второе значение — это интерфейс взаимодействия двух систем. И правильнее говорить в данном случае, как и заявлено в теме, о человеко-машинном интерфейсе или, более узко, о человеко-компьютерном.

Как только мы понимаем, что у нас есть интерфейс одной системы и интерфейс взаимодействия двух систем, то дальше мы всегда вынуждены прибегать к еще одному слову ― протокол. Здесь классический пример — современный вариант управления телевизором, когда у нас возникает интересная цепочка и юзабилист должен это отслеживать: человек взаимодействует с пультом дистанционного управления, а уже пульт дистанционного управления взаимодействует с телевизором. Таким образом, в этой цепочке есть интерфейсы с пользователем и интерфейсы между техническими системами. При этом человеку интересна вся цепочка сразу.

И получается, что сейчас развитие интерфейсов — это развитие в первую очередь новых интерфейсов «машина — машина», а потом включение туда человека. Отсюда классическое разделение на автоматизированные и автоматические системы. Напомню, что автоматические — это те, которые работают без участия человека, а автоматизированные предполагают участие человека в своей работе. Естественно поэтому, что мы говорим об интерфейсах автоматизированных систем, интерфейсах взаимодействия между человеком и техническими компонентами автоматизированных систем.

Что еще более интересно, сейчас автоматизированные системы становятся все более и более приближенными к органам чувств человека. Отсюда очки дополненной реальности, виртуальной реальности и так далее. И конечно, новые поколения интерфейсов, которые вовсю задействуют искусственный интеллект. В первую очередь это голосовые интерфейсы. Сейчас ими могут пользоваться все пользователи мобильных телефонов, все к этому уже привыкли: Siri, Cortana, OK Google и так далее. Но сейчас особо интересная тема — это, конечно, переход к интерфейсам, которые к голосу добавляют и полноценную визуализацию.

Когда мы визуализируем и одновременно учитываем голос, мы работаем с понятием multimedia (мультимедиа, как его обычно произносят). И получается, что мы должны учитывать сразу несколько органов чувств. Отсюда стандартные проблемы синхронизации, согласования и возможности человека оценить, насколько это ему удобно. Какая сейчас основная проблема повсеместного внедрения, например, виртуальной реальности? Мы практически не можем учесть какие-то дополнительные каналы, особенно тактильные, которыми человек пытается воспользоваться, а их нет в опыте взаимодействия.

Сейчас виртуальный опыт взаимодействия — это визуальный канал, аудиоканал, затем как раз обычно канал, использующий пальцы рук, и все. Все остальное — это большая проблема, которая порождает огромное количество исследований, как эти каналы либо отключить у человека, либо задействовать. Понятно, что простых решений здесь в принципе не бывает. Отсюда очень серьезные наработки, которые пытаются приблизить интерфейс все ближе и ближе к головному мозгу. Прорывы здесь в основном связаны с так называемой neuroscience, или нейронауками. При этом нейронауки — это продолжение когнитивных исследований, и сейчас когнитивисты иногда ругаются с нейросетевиками, иногда совместно работают, но очень серьезно подходят к тому, чтобы человек в себя начал встраивать какие-то человеко-машинные интерфейсы. Некоторые говорят, что это очень плохо, некоторые — что хорошо. Но это данность. Отсюда интересные слова типа киборгизации и так далее.

Если же отвлечься от этого тренда, то мы видим, что классические компьютерные интерфейсы, которые используют визуальный канал (мониторы) и тактильный канал (клавиатуру, мышь и так далее), достигли в некотором смысле совершенства при работе в стандартных условиях. Отсюда появился термин «офисное окружение», или small office/home office (SOHO), появились всевозможные промышленные окружения, и они развиваются параллельно.

При этом эти миры практически не пересекаются. И обычный человек почти никогда не знает о существовании большинства этих миров. И когда ему начинаешь рассказывать про какие-то интерфейсы, которые используются в горячем цеху, например, он говорит: «Ух ты!» Почему? Потому что он никак не может перенести опыт взаимодействия в офисе на опыт взаимодействия в этом горячем цеху. Особенно это касается интерфейсов специализированных устройств, например медицинских. Что там главное? Что эргономика намного интереснее, безопасность играет большую роль. Но если вспомнить о современных, например, автоматизированных центрах по проведению операций, в том числе тех, которые работают удаленно (а таких уже достаточно много, и есть несколько очень известных, уже сотни тысяч операций проведены), то там опыт взаимодействия уникален. Отсюда как раз разделение на миры с последующим утверждением стандартов, в первую очередь на эргономику, то есть безопасность, а потом уже развитие всяческой функциональности.

При этом сейчас два главных слова — это конвергенция и интеграция. Конвергенция обозначает, что мы различные формы взаимодействия (например, голосовое или визуальное) и различные сценарии использования (например, переносные или неподвижные устройства) совмещаем в едином опыте взаимодействия. Отсюда у нас давно говорят о среде. И все старые методологии разработки интерфейсов, которые обычно были либо целеориентированными, либо пользователеориентированными, становятся уже ориентированными на создание этой среды. И в этой среде у нас огромное разнообразие — как задач, так и поддерживающих технологических цепочек.

Еще одно деление на миры происходит из-за того, что есть интерфейсы, как говорят, однократного применения. Например, когда вы подходите раз в год оплатить что-то к киоску. Вы можете забыть за год, как вы в предыдущий раз к нему подходили, и можно считать, что каждый раз это новый для вас интерфейс. А другое дело, когда вы работаете каждый день, например, с Microsoft Excel или Word, и тогда у вас интерфейс всячески эксплуатирует ваши привычки. Отсюда еще несколько миров.

Понятно, что самым интересным является тот мир, который задействует большинство пользователей, активно использует их опыт и формирует то, что называется сейчас, во-первых, рабочей средой, а во-вторых, средой развлечений. Отсюда еще разная социализация в этих мирах. Более того, современный тренд — развитие коллаборативных технологий как деятельности, так и отдыха. Отсюда онлайн-игры, отсюда как раз всевозможные Agile-методы в организациях и рабочие группы. И современные интерфейсы обязаны это учитывать, что они и делают. Последние лет десять активно развиваются облачные технологии и поддерживающие их новые интерфейсы с пользователем. Тот, кто видел, например, Microsoft Word 2000, 2003, 2007, 2013, не очень подготовлен к свежим версиям Office 365, где основной акцент сделан на то, что человек может одновременно работать в разных рабочих группах, которые содержат несколько человек, а все эти люди одновременно что-то делают. Это качественно по-новому повышает производительность. Это дает новые возможности. И это именно новое взаимодействие.

Аналогично виртуальные среды сейчас тоже становятся коллаборативными. Более того, что интересно, появились, например, камеры, которые могут снимать то, что видят люди в виртуальной среде. Это позволяет интегрировать теперь виртуальные интерфейсы, интерфейсы дополненной реальности и привычные интерфейсы, которые транслируют нам какие-то медиаобъекты. Конвергенция и интеграция — это такой глобальный тренд.

Как только мы говорим о современных средствах разработки интерфейсов с пользователем, мы сразу говорим в первую очередь о жизненном цикле программного обеспечения. Часть, которую занимает разработка интерфейса, стала очень крупной в жизненном цикле программного обеспечения. При этом инженерия программного обеспечения сейчас очень большое внимание обращает на интерфейсы. И после опыта Apple, которая на этом построила бизнес-модель, это очевидно всем. Поэтому у нас есть огромное количество программного инструментария, поддерживающего разработку. Есть отображение технологических цепочек и среды, в которой человек работает, как социальной среды на эти инструменты. Моделирование, в том числе математическое, и использование искусственного интеллекта в поддержке интерфейсов с пользователем. Это позволяет по-новому подойти к персонализации.

Что имеется в виду? Мы можем теперь не просто индивидуализировать интерфейс и персонализировать его автоматически. То есть интерфейс не скажет: «Настрой меня, вот тебе средство кастомизации». Он скажет: «Я сам под тебя настроюсь и буду для тебя персональным, от тебя это не потребует ничего». Тот, кто уже работал с голосовыми помощниками, прекрасно представляет себе это. За полгода Siri или Cortana очень интересно подстраиваются под вас и могут как бы предугадывать ваши мысли, хотя в этом нет никакой магии. Но любая достаточно развитая технология неотличима от магии. И в этом смысле интерфейсы с пользователями как раз и создают для пользователя эту реальную магию, а все остальное от пользователя скрыто.

Каковы сейчас главные вызовы, стоящие перед этой областью, которые подскажут нам, что мы увидим в ближайшем будущем? Это достаточно очевидно. Во-первых, это создание цифровых аватаров. Это уже достаточно распространенный термин, который говорит о том, что мы должны свое изображение и уровни перцепции переносить в виртуальную среду. Второе — это, конечно, поддержка коллаборативных пространств с учетом цифровых аватаров и, возможно, различных ролей. Дальше нужно избавиться от проблем, присущих современным методам обратной связи, и эта обратная связь должна стать намного более качественной с точки зрения обмана мозга человека. Сейчас именно это мешает внедрению даже интерфейсов дополненной реальности. Как только мы победим основные проблемы обратной связи, мы сможем создавать то, о чем сейчас активно пишут очень много фантастических книг. В фантастике уже даже появился новый жанр — ЛитРПГ. Человек не то чтобы перестает различать игру и реальность или работу и реальность ― он может не перестать их различать, но отдает предпочтение по эффективности деятельности виртуальной среде и не хочет больше работать в реальной.

Драйвером может стать развитие киберфизических систем, которые позволят в смешанной реальности использовать тот факт, что почти все устройства и все окружение человека станут такими, которые компьютеру, либо встроенному в нас, либо являющемуся очками, будут говорить, что они могут и как мы с ними можем взаимодействовать. Отсюда отсутствие необходимости создавать специализированные интерфейсы. Достаточно того интерфейса «человек и средство дополненной реальности», который будет использовать все возможности киберфизических систем. Планируется, что к 2025 году все это станет реальностью и составит основу того, что называется умным городом и умным домом.

Над материалом работали

Читайте также

Внеси свой вклад в дело просвещения!
visa
master-card
illustration