Как устроен искусственный интеллект: всё, что вы хотели знать об ИИ, но боялись спросить

1 февраля 2023

Взяли интервью у Евгения Соколова, доцента факультета компьютерных наук Департамента больших данных и информационного поиска НИУ ВШЭ, — и спросили об устройстве и работе искусственного интеллекта

Сначала познакомимся!

Я учился на факультете вычислительной математики и кибернетики МГУ, поступил туда в 2008 году. Тогда направление ИИ существовало и активно изучалось, просто без хайпа. На факультете уже была кафедра математических методов прогнозирования, там работали молодые сотрудники, которые сейчас стали известными учёными.

Позже работал в компаниях «Биоклиникум», Forecsys, «Озон», с 2014 года — Яндекс. С 2016 преподаю на факультете компьютерных наук НИУ ВШЭ, где веду курсы на майноре «Интеллектуальный анализ данных», разработал и читаю курс по машинному обучению на программе «прикладная математика и информатика».

Что вообще такое искусственный интеллект?

Если говорить именно про искусственный интеллект, то главное здесь — создание систем, которые будут, как и человек, обучаться на основе взаимодействия с примерами из реального мира. Грубо говоря, если отправить нас во Францию без знания языка, рано или поздно мы его освоим, даже не беря в руки учебник, просто погрузившись в среду.

Было много разных идей, как дать компьютеру подобную возможность. Сегодня под искусственным интеллектом понимается конкретный раздел компьютерных наук — машинное обучение, которое занимается извлечением алгоритмов и знаний из данных. Например, есть тексты на русском языке и их профессиональные переводы на английский. Благодаря технологиям машинного обучения компьютер анализирует эти примеры и создаёт алгоритм для перевода текстов. Так работает Яндекс Переводчик.

Какие ИИ существуют?

Сейчас есть два взаимно обусловленных направления в ИИ. Первый — это классическое машинное обучение (Machine Learning, ML), когда существуют табличные данные, например, о клиентах банка. На их основе создаются алгоритмы вроде градиентного бустинга для прогностического анализа. Эти подходы хорошо изучены, они дают не очень сложные алгоритмы, которые надёжно работают, например, в поисковых машинах.
Евгений Соколов, доцент факультета компьютерных наук НИУ ВШЭ

Но бывают задачи более сложные, где на входе и выходе алгоритма есть текст, фото, видео, звук. И там классический подход не очень-то применим. Вот здесь и выходит на сцену глубокое обучение (Deep Learning, DL) — метод, предполагающий самостоятельное выстраивание общих правил в виде нейронной сети на примере данных во время процесса обучения, автоматическое выявление огромного количества правил и характеристик. Например, в задаче определения возраста по фотографии нейросеть сама должна понять на основе данных, что надо искать морщины, седину, текстуру кожи, тем самым обучаясь, выявляя эти характеристики и определяя с их помощью возраст.

Значит, нейросеть — это ИИ?

По сути, нейросеть — это большая формула, в которой могут быть сотни миллиардов и триллионы слагаемых, множителей и так далее. Так что её корректно называть составной частью ИИ. А когда в рекламе нам говорят, что некий банк с помощью искусственного интеллекта научился выявлять мошенников, это значит, что выстроена нейронная сеть или какой-то другой алгоритм на основе машинного обучения, которые работают с большой базой данных и способны находить закономерности.

Почему иногда говорят о «слабом» и «сильном» ИИ? Это не IQ?

Слабый искусственный интеллект — это алгоритм, какая-то программа, которая решает одну конкретную задачу: например, ищет в интернете статьи или по фото определяет возраст человека. Слабый ИИ было бы уместно называть специализированным.
Евгений Соколов, доцент факультета компьютерных наук НИУ ВШЭ

Главный критерий для сильного искусственного интеллекта — возможность самостоятельного обучения новым задачам. Допустим, программа умеет определять возраст по фотографии, а если ей дать другие примеры, она сможет определять место рождения человека. Такой программы пока не существует, сильный ИИ сейчас — это гипотетическая технология. Сегодня, когда речь заходит про сильный искусственный интеллект, скорее пытаются среди решённых задач найти алгоритм, который хотя бы немного выйдет за пределы слабого ИИ. Некоторые исследователи считают, что шаг к сильному ИИ — это мультимодальные алгоритмы, которые умеют работать с разными типами данных, например со звуком, текстом и изображением. Но даже такие алгоритмы решают конкретные задачи, они не способны самообучаться.

Приблизились ли современные ИИ к прохождению теста Тьюринга?

Тест Тьюринга — эмпирический тест, предложенный Аланом Тьюрингом в 1950 году. Интерпретация теста звучит так: если машина отвечает на заданные вопросы так, что человек не в состоянии определить, общается он с другим человеком или с компьютером, тест считается пройденным.

Вполне — если под интеллектом понимать способность условной GPT-нейросети поддерживать беседу с человеком на сложные темы. Возьмём произвольный диалог в мессенджере. Нейронная сеть вполне может его сымитировать: поговорить про погоду, спросить, как дела, ответить на технические вопросы. Сегодня нейросеть способна ввести человека в заблуждение. И этого, в отличие от «Скайнета», действительно стоит бояться. Уже довольно много говорят о том, что с помощью генеративных сетей сейчас имитируют обращения в службу поддержки компаний, тем самым перегружая их.

Где используют этот интеллект?

Сейчас искусственный интеллект и его алгоритмы используют и активно развивают крупные IT-корпорации. Сервисы поиска, стриминга, такси и курьерской доставки без ИИ уже трудно представить. Любой популярный сервис Яндекса использует его: в Поиске машинное обучение нужно, чтобы улучшать выдачу и показывать релевантную рекламу, в Кинопоиске или Яндекс Музыке ML на основе предпочтений пользователя предлагает то, что ему будет интересно посмотреть или послушать. В Яндекс Go машинное обучение прогнозирует спрос, эффективно распределяет курьеров или таксистов по району.

Компаниям, которые изначально были в других секторах, например в медицине, сложнее внедрять ИИ. Это требует полной перестройки всех процессов. Когда врачи по всей стране уже работают по отлаженной схеме, непросто встроить интеллектуальные алгоритмы в процесс постановки диагноза. Конечно, большим корпорациям, даже не из сферы IT, гораздо проще. Пока ИИ — это экспериментальная технология, которая требует дорогостоящих специалистов и серьёзных вычислительных ресурсов. Но постепенно фокус смещается, ресурсы и специалисты становятся доступнее, а значит, и технология получит широкое распространение.

Если искусственный интеллект такой классный, почему его не используют повсюду?

Ключевая проблема — отсутствие данных. Невозможно сделать качественный алгоритм, например, для постановки медицинского диагноза, если у нас нет огромных объёмов информации о пациентах с известными болезнями. И далеко не во всех областях они имеются. Сюда же можно отнести проблему с персональными данными. С одной стороны, они необходимы для обучения моделей ИИ. У всех компаний есть стимул узнавать про нас как можно больше, чтобы зарабатывать на информации. С другой стороны, чем больше компании про нас знают, тем выше риск утечки этих данных и их неправомерного использования. Как сделать так, чтобы IT-сфера не откатилась в прошлое, но при этом наши данные были более защищены и не принадлежали корпорациям, — открытый вопрос.

Второй вызов обусловлен тем, что многие решения на основе ИИ уже сегодня лишают людей работы. Например, какую-то задачу работника службы поддержки можно автоматизировать. Или скоро доведут до ума беспилотные автомобили — и миллионы таксистов окажутся не нужны. Это серьёзная социальная проблема. Неудивительно, что в компаниях ИИ внедряется крайне осторожно: мало кто хочет автоматизировать свою же работу. Но, как это было в истории промышленных революций, новые технологии часто создают и новые рабочие места.

А ещё есть страх, связанный с генеративными моделями, которые сейчас могут писать картины, создавать тексты и так далее. Мы вступаем в эпоху, когда интернет будет легко заполонить абсолютно фейковой информацией, а ориентироваться в этом станет сложнее. Это не затормозит повсеместное внедрение ИИ, но даёт повод волноваться.
Евгений Соколов, доцент факультета компьютерных наук НИУ ВШЭ

Сможет ли ИИ самостоятельно программировать?

О недавней нейросети AlphaCode (система ИИ для генерации кода, разработка Alphabet) много говорилась, но она обучена для конкретной цели. Существуют алгоритмические олимпиадные задачи, где даётся описание и примеры. Задачи эти невысокой сложности. И программа должна по описанию создать код для решения. Но их и пятиклассник решит при должной подготовке. Я бы сказал, что из подобных систем могут получиться помощники для программистов, которые за них будут решать рутинные задачи, оставляя время на что-то более сложное. О замене же программистов алгоритмами пока говорить очень рано.

Куда пойти учиться на разработчика ИИ?

На факультет компьютерных наук в ВШЭ. Я руковожу бакалаврской программой «прикладная математика и информатика», где машинное обучение и ИИ — одни из главных направлений. В программе — курсы по обработке больших данных, анализу текстов и звука, компьютерному зрению. Если уже учились в бакалавриате, в ВШЭ есть магистерские программы и курсы дополнительного образования.