Где проходит граница возможностей искусственного интеллекта

Почему многие люди боятся ИИ, откуда взялся этот страх?

Иван Оселедец: Отчасти это влияние поп-культуры, таких фильмов, как "Терминатор" и других ярких художественных произведений. У меня и моих коллег перед матричными умножениями - так, собственно, и работает нейросеть - страха нет, скорее интересует вопрос почему же она все-таки работает. Действительно интересно все это осознать, понять какими средствами и каким языком описать.

Искусственный интеллект на основе нейросетевых моделей пережил первый пик интереса в 2016 году после матча нейросети AlphaGo и первого игрока мирового рейтинга в игру Го, Ли Седоля. Но тогда кроме специалистов на победу AlphaGo никто не обратил внимания. Что изменилось за 6 лет, почему с 2022 года ИИ постоянно находится на пике общественного интереса?

Иван Оселедец: Ответ на этот вопрос очень прост - ChatGPT. Это действительно прорывная история в первую очередь за счет колоссально выросшего качества общения ИИ с человеком. На самом деле искусственный интеллект используется очень давно, например, в камерах, которые распознают лица с потрясающей точностью или в интернет-торговле. ИИ уже с нами, он уже здесь. Но такой формат взаимодействия с ИИ не производил такого впечатления на людей, как возможность лично пообщаться с ИИ.

Главная идея ChatGPT заключалась в том, чтобы не обучаться на большом количестве произвольных текстов из интернета, а добавить в процесс обучения нейросетевой модели обратную связь от человека. То, что называется RLHF (reinforcement learning human feedback) Оказалось, что качественные данные и обратная связь от человека приводят к существенному скачку в качестве модели.

То есть локомотивом всего хайпа вокруг ИИ стал один яркий продукт?

Иван Оселедец: Да, локомотивом действительно стала новая методика обучения и конкретно ChatGPT, который Open AI выложили в публичный доступ. Как только люди стали пользоваться ChatGPT, это привело, к колоссальному взрыву интереса. Сейчас у многих людей эта штука открыта в ежедневном режиме, каждый для себя (по крайней мере я могу про себя и коллег говорить) находят там широкий спектр применений. Интересно, что хотя это очень мощная технология, на самом деле ее не очень сложно повторить. В последние несколько месяцев появилось нескольких открытых OpenSource моделей чуть меньшего размера. Так что это только начало. В ближайшее там время нас ждет очень много интересного.

Иван Оселедец: Можно считать, что мы уже живем в эпоху более или менее “общего ИИ”. Человечество пересекло эту условную черту. Фото: Пресс-служба AIRI

Как вы относитесь к письму организации Future of Life, которое подписали Илон Маск, сооснователь Apple Стив Возняк и другие известные персоны, относительно приостановки разработок в области ИИ ввиду его потенциальной опасности для людей?

Иван Оселедец: Я, конечно, не поддерживаю идею что надо что-то остановить, прекратить, тем более что некоторые люди, которые подписывали это письмо, например Илон Маск, потом вкладывали деньги в свою компанию по разработке ИИ. Есть и такие экзальтированные исследователи ИИ, как Элиезер Юдковский, который дошел до того, что фактически призывает бомбить дата-центры, где обучают нейросетевые модели.

Все это выглядит очень странно. Действительно, сейчас технологии машинного обучения хорошо работает там, где цена ошибки не высока. Никто не может дать гарантии стопроцентно безошибочной работы ИИ, но мы и для человека не можем дать такой гарантии, а ошибки человека, которые случаются, устраняем путем внесения изменений в регламенты, обучение, в подготовку. Такие же процедуры работают и для искусственного интеллекта. Если, например, мы поставим нейросетевую модель управлять транспортом, и она перестанет корректно работать, надо будет разобраться, почему это произошло и решить проблему так же, как и в случае с обучением человека.

Мне кажется, сейчас надо максимально вкладываться в развитие ИИ. Естественно, если в какой-то момент мы упремся в технологический или иной барьер, тогда и надо будет думать, что делать дальше. Однако, многие задачи, которые раньше считались для ИИ сложно решаемыми, современные большие языковые модели (LLM) решают легко. Это замечательно, значит, надо учиться этими моделями пользоваться, надо учиться с ними взаимодействовать. То, что происходит сейчас с ИИ сравнимо с предыдущими технологическими революциями, но я опять же не вижу в этом ничего страшного или критичного. В мире, будем честны, гораздо больше более серьезных проблем - голод, болезни, стихийные бедствия - чем гипотетический захват власти над миром каким-то супермозгом.

Если ИИ сможет автоматизировать рутинные процессы в этом нет ничего плохого. Люди смогут сфокусироваться на более интересных и творческих вещах.

Что вы думаете относительно социальных последствий массового внедрения ИИ? Насколько оправданы опасения его противников, что ИИ лишит их работы, профессии?

Иван Оселедец: Если ИИ сможет автоматизировать рутинные процессы в этом нет ничего плохого. Люди смогут сфокусироваться на более интересных и творческих вещах. Но пока не все так просто. Возьмем, программирование и написание кода. Уже было несколько случаев, когда нейросеть за 3 минуты писала код. Очень правдоподобно писала, но с такими хитрыми ошибками, что человек потом 3 часа искал этот несчастный баг. Если же учесть, что программистов сейчас не хватает во всем мире, рынок труда перегрет, то в том, что самый простой код будет писать ИИ нет ничего плохого.

Как далеко мы сейчас находимся от того, что называют "общим искусственным интеллектом"? Он в принципе возможен?

Иван Оселедец: На эту тему очень много спекуляций, но если бы год назад я сказал "вряд ли" или "надо подождать", то с появлением ChatGPT многое изменилось. Почему бы те вещи, которые он сейчас делает, не рассматривать как проявление общего искусственного интеллекта, который отвечает на многие вопросы лучше среднестатистического человека, решает разнообразные задачи, выполняет роль помощника. Что тут не соответствует понятию "общего искусственного интеллекта". Кейсы с использованием современного ИИ - это очень многозадачные истории и даже в некоторых случаях достаточно креативные. В этом смысле мы подошли очень близко к общему ИИ. Он неожиданно для многих появился в форме чат-бота, который обрастает различными модальностями, то есть, уже работает не только с текстом, но и с изображениями и видео. Можно считать, что мы уже живем в эпоху более или менее "общего ИИ". Человечество в каком-то смысле пересекло эту условную черту. Конечно, можно спорить относительно определения общего ИИ, но факт остается фактом, поведение современных больших языковых моделей принципиально отличается от того, что мы видели раньше и их действительно можно назвать прототипами общего ИИ.

Каково на ваш взгляд сейчас место России в мировой ИИ-индустрии в науке о данных?

Иван Оселедец: В области Data Science (науки о данных), думаю, мы входим в Топ 15-20 стран. Это достаточно легко измерить количеством публикаций на конференциях. Хотелось бы, конечно, больше так как в этом нет ничего сложного. Data Science наука достаточно своеобразная и нетипичная для нашей академической традиции, так как она не подразумевает каких-то глубоких фундаментальных исследований, а представляет собой набор быстрых и успешных рецептов, которые люди придумывают и используют.

Если говорить с точки зрения развития прикладных технологий у нас все очень неплохо. Я обычно привожу как пример обработку медицинских изображений, где по многим показателям Москва находится в мировых лидерах. Тут опять все сводится к тому, что нужно правильно собрать данные и обучить модели, но тем не менее, такого внедрения этой технологии, как в Москве, нигде в мире практически нет.

Сегодня каждая уважающая себя российская IT-компания или банк имеет у себя отдел, занимающийся машинным обучением. В "Сколтехе" есть свои научные группы, они работают, появляются новые, но я думаю, что нужно раза в четыре-пять больше научных групп, работающих в области ML (машинного обучения). В целом же ситуация с искусственным интеллектом в стране неплохая, туда вкладываются деньги, есть проекты, есть поддержка.

Обучение больших нейросетевых моделей требует значительных вычислительных ресурсов. Насколько реально создавать суперкомпьютеры в текущих условиях в России? Что для этого нужно?

Иван Оселедец: Санкционная история просто повышает стоимость вычислительных ресурсов и их доступность. Но при этом программное обеспечение, которым все пользуются, не очень эффективно. Сейчас вычислительный кластер достигает при стандартной методике обучения не более 50% от своей максимальной производительности. Если же, условно, приблизиться к 100%, можно в 2 раза ускорить обучение на том же самом "железе". Одной из важных задач является разработка новых эффективных вычислительных методов обучения нейросетей, которые позволят снизить время обучения и потребление электроэнергии. Мы ведем над этим активную работу.

Ситуация с вычислительными мощностями она в везде не очень хорошая, а не только в России. На рынке графических чипов, необходимых для обучения нейросетей, есть фактический монополист - компания NVIDIA, и все в мире осознают это, как глобальную проблему. NVIDIA ушла так далеко вперед, что сейчас проще купить у них процессор, чем пытаться разрабатывать свой.

Даже Google для своего последнего вычислительного кластера просто закупила у нее 26 тысяч графических карт, хотя у них есть свой специальный процессор для обучения нейросетей. Наличие такого монополиста не очень хорошо, но при этом надо понимать, сколько стоит разработка каких-то своих решений. Тут тоже есть варианты, что можно сделать, но это все средне- и долгосрочные перспективы. Пока же есть один путь - закупка графических карт и оптимизация алгоритмов. Нужно думать головой, а не просто механически увеличивать размер модели и объем железа необходимого для ее обучения.

Пример с ChatGPT показал простую вещь. Можно не обучать модель на сто миллиардов параметров, а создать и обучить модель в несколько миллиардов параметров. Это сокращение сложности и требуемых для обучения мощностей и электроэнергии в десятки раз. При этом можно получить сравнимое качество модели за счет более оптимальных алгоритмов обучения и грамотно подобранных данных.

Безусловные лидеры внедрения ИИ сейчас сервисы и сфера услуг. Почему ИИ-продукты так медленно внедряются в промышленность сельское хозяйство? Там же очевиден огромный потенциал для ИИ.

Иван Оселедец: В сельском хозяйстве действительно очень большой потенциал для ИИ-решений, связанных с обработкой спутниковых снимков, анализом различных рисков и предиктивной аналитики на основе этих данных. Просто есть высокая инерция, которая тормозит внедрение, плюс такой аспект, как стоимость труда. В тех агрокомплексах, где она невысокая, нет мотивации для оптимизации производственных процессов.

Имеется еще и "человеческий фактор". Специалисты в прикладных областях часто рассматривают датасайентистов как "персональных врагов", которые учат их тому, чем они занимаются много лет. не являясь специалистами в их области.

Если же говорить о промышленности, то ИИ можно использовать практически в любом технологически сложном производства, например, для контроля процесса сварки в режиме реального времени. Причем это все можно делать уже на готовых технологиях, не разрабатывая и не обучая нейросеть с нуля.

Среди претензий, которые предъявляют к разработчикам нейросетей, есть такая, что они не могут объяснить, как нейросеть пришла именно такому ответу, а не к другому. Это проблема?

Иван Оселедец: Да, это большая проблема и для нее пока нет каких-то хороших решений, даже для обычных моделей, которые распознают лица с точностью до 99,999%. Сейчас пытаются те же языковые модели, использовать для генерации объяснений, но какого-то вот разумного работающего подхода для повышения объяснимости работы моделей пока нет. Более того есть много примеров, когда можно злонамеренно модифицировать вход, модифицировать текст, модифицировать картинку и модель вообще начинает что-то другое предсказывать. Это одна из недавно открытых больших проблем. Но бизнес это не очень интересует, они говорят - вот у нас есть нейросеть с точностью работы 99,99% и больше нам ничего не нужно. Человек и то чаще ошибается, а почему эта модель работает хорошо нам неважно. Сейчас в целом доминирует бизнес-подход, когда компании готовы внедрять ИИ для экономической выгоды. Либо, если они боятся и переживают, что цена ошибки будет слишком высока, они не внедряют ИИ, а просто используют его как помощника, как например в медицине.

Модель сама придумывает себе задачки, сама их решает и все это работает, но не очень понятно как. Это требует на самом деле системного объяснения.

А есть понимание барьера для развития ИИ если говорить о нейросетях?

Иван Оселедец: Серьезного барьера пока не видно. Но, наверное, из тех задач, которые на данный момент считаются сложными, это те, где нужен не вероятностный, а один точный и правильный ответ и где нельзя выдавать правдоподобные версии. Усилия разработчиков фокусируются вот на таком классе задач.

Сейчас требуют изучения некоторые методики. Когда модели дают 100 задач, а потом просят ее придумать задачи, похожие на те, которые ее давали. Затем модель дообучается уже на тех задачах, которые она придумала себе сама и ее качество при этом существенно улучшается. То есть, фактически никаких новых данных не дается, а модель сама придумывает себе задачки, сама их решает и все это работает, но не очень понятно как. Это требует на самом деле системного объяснения.