Сайт СФУ
Сибирский форум. Интеллектуальный диалог
ноябрь / 2021 г.

Технооптимисты вышли проветриться

Ивана ЯМЩИКОВА тысячи людей знают как автора подкаста «Проветримся!», где он обсуждает научно-популярные темы. Сам Иван — перспективный учёный, руководит лабораторией естественного языка (совместной Яндекса и Высшей школы экономики в Санкт–Петербурге). В октябре он приезжал в Красноярск, чтобы открыть здесь школу машинного обучения, а заодно прочёл несколько лекций. Мы поговорили с Иваном о задачах компьютерных алгоритмов, подкастах и возможностях регионов.

СПРАВКА

Иван Ямщиков окончил физический факультет Санкт-Петербургского госуниверситета. В магистратуре по обмену обучался в Швеции. Защитил диссертацию в Бранденбургском техническом университете. Шесть лет работал аналитиком в Яндексе, три года был евангелистом искусственного интеллекта в компании ABBYY и четыре года — постдоком в Институте Макса Планка в Лейпциге. Приглашённый профессор университета Лиссабона и стратегический директор SkillFactory.

Алгоритмы обучаемы

— Иван, вы довольно долго учились и работали за границей, а теперь вернулись. Это патриотизм?

— Да, и это нормально.

— Нормально, но не в тренде.

— Будем менять тренд.

— Раз вы жили за границей, можете сравнивать. Часто говорят, что Россия вечно отстаёт от Запада. На 100 лет, на 50, на 20, но отстаёт. Насколько сейчас это отставание ощутимо?

— В чём-то мы опережаем, в чём-то нет. Это тоже нормально. Например, по интернет-технологиям мы однозначно опережаем все страны Европейского Союза. У нас качественный, доступный и дешёвый интернет. Когда я переехал в Лейпциг, четыре недели ждал, чтобы мне провели интернет; в крупном российском городе это займёт пару часов.

В России есть свои социальные сети, а весь мир живёт с одним Фейсбуком — нет ни ВК, ни «Одноклассников». Все живут с одним мессенджером — WhatsApp, у нас есть ещё собственный Телеграм. В мире один поисковик — Гугл, у нас есть Яндекс. Везде единый сервис такси — Убер, у нас несколько игроков на рынке. Так что по IT-технологиям мы точно опережаем ЕС.

— Вы работали в исследовательском Институте Макса Планка в Лейпциге. Чему были посвящены ваши исследования?

— Мы с моим соавтором и коллегой Алексеем ТИХОНОВЫМ занимались генеративными задачами. Например, пытались алгоритм, обученный на текстах, научить писать стихи. В 2016 году мы сделали проект «Нейронная оборона» — алгоритм генерировал стихи в стиле Егора Летова, и мы даже записали альбом, чтобы показать, что такое возможно. Кому-то понравилось, кому-то нет, но с научной точки зрения это было интересно.

— Что именно интересно?

— Вот смотрите: когда человек учит язык в физической среде, мы не знаем, какой объём информации обрабатывает его мозг. В случае с машинным обучением ситуация другая: есть корпус текстов, никакой другой информации машина не получает. Интересно, может ли алгоритм только на основании этого корпуса генерировать новые тексты, чтобы они хотя бы грамматически были корректны. Оказалось — может. Дальше вопрос: можно ли добиваться стилизации под определённую категорию текстов? При этом филологи не могут описать в количественных терминах, что такое стиль и как они отличают текст того или иного автора. Конечно, когда читаешь Достоевского или Толстого, даже не зная авторов, поймёшь, что это писали разные люди. Но выделить элементы стиля сложно. И вот изучение количественных атрибутов текста, которые бы описывали стилистику, интересно и востребовано. Скажем, в задачах определения авторства, в исторических документах, когда непонятно, не подделка ли это.

— Не пробовали таким образом установить авторство «Тихого Дона», чтобы наконец поставить точку в этом вопросе?

— Точку здесь не поставишь, потому что оценка всё равно будет вероятностная. Но мы ведём совместный проект с университетом Лейпцига, где применяем модели машинного обучения к античным текстам на греческом языке. Это позволяет установить датировки некоторых документов, про которые точно известно, что это подделки.

Другой пример — мы задались вопросом: а можно ли создать модель, которая бы декомпозировала текст на семантическую информацию и стилистическую? То есть на то, ЧТО сказано и КАК. Если мы можем добиться декомпозиции, тогда можно делать автоматические алгоритмы переформулировок. Представьте, вы написали письмо и хотите на всякий случай проверить, что всё там вежливо. Пропускаете через алгоритм, который обвешивает ваш текст разными вежливыми формулировками, и уже спокойно отправляете. Или наоборот: вы написали многословно, а надо подсократить. Можно ли это сделать автоматически без ущерба для смысла? Такого рода алгоритмы пока полноценно сделать не удаётся, но мы ведём исследования в направлении декомпозиции информации, чтобы понять, какую часть того, КАК написан текст, можно извлечь, сохраняя смысл.

— Исследования чисто гуманитарные. А с экономикой это как связывается?

— Напрямую связывается, ведь это про весь документооборот. Допустим, у вас есть договор по импортно-экспортным поставкам, который должен отвечать условиям двух сторон: учитывать всякого рода ГОСТы, стандарты и др. Вручную сверка таких документов потребует много усилий.

Проблема в том, что трудно разработать универсальные модели, которые работали бы с разными текстами. Проще создать алгоритм, который решает частную задачу. Например, вычленяет из текста тему письма. Даже это уже могло бы сэкономить миллионы часов в масштабах всей экономики.

— Сейчас вы совместно с Яндексом создаёте лабораторию в Высшей школе экономики. Большая у вас команда, чем занимаетесь?

— Пока нас четверо, но планируем, что через четыре года будет человек 10-15, в зависимости от задач и дополнительного финансирования, которое мы сможем привлечь.

Работаем в нескольких направлениях. Допустим, есть две модели. Если одна решает 80 задач из ста, а вторая — 85, то вторая лучше. Хотя, возможно, она лучше на определённом типе задач, но нет гарантии, что за пределами этих задач будет так же. Как разработать критерии оценки, чтобы быть уверенным, что мы берём в работу лучшую модель? Это одно из направлений исследований, с чем мы пытаемся разобраться.

Другое направление — декомпозиция информации, о чём я упоминал. Это нетривиальная задача. Есть много идей, как представить информацию, но вопросов больше, чем ответов: какое представление лучше, в каких терминах можно проводить подобные оценки и так далее.

Вообще в науке важный этап — формирование вопроса. Придумать правильный вопрос — уже полдела. В этом смысле учёные похожи на предпринимателей по компетенциям и навыкам. Те сами придумывают, каким бизнесом им заниматься, мы сами формулируем задачу. И она должна быть достаточно сложной, чтобы её никто не решил до нас, но при этом такой, чтобы мы сами могли её решить. Наука часто движется небольшими шагами. Это игра на переднем крае: новое, но достижимое.

Искусственный интеллект: освободитель или поработитель

— В лекции вы привели пример коллежского асессора КОРСАКОВА, который в 1834 году подал записку в Российскую императорскую академию наук, разработав прибор для работы с идеями. Он предлагал кодировать информацию при помощи брусков, используя показатели их длины, ширины, веса. Комиссия отклонила идею, написав в заключении «господин Корсаков потратил много ума, чтобы дать людям возможность обходиться без ума». А ведь это актуально: искусственный интеллект тоже призван думать за нас. Это не оглупит людей?

— Человек сам решает, как использовать алгоритмы. Молотком можно гвозди забивать, а можно по пальцам лупить. С алгоритмами также. Скажем, проверка документации. Несомненно, это тяжёлый интеллектуальный труд, надо помнить много факторов и условий, тщательно сверить каждую закорючку. Но так ли важен там ум? При этом нам не хватает хороших учёных с интересными идеями. Ведь алгоритмы сами ничего не придумают, это их надо придумать, создать, научиться применять в экономике, чтобы уровень жизни людей рос.

Сергей Савостьянов/ТАСС

Сергей Савостьянов/ТАСС

— Но освобождение человека от того или иного рутинного труда как минимум делает людей безработными, и эта история известна ещё со времён луддитов. Как искусственный интеллект может помочь в решении этой проблемы (ненужности людей, безработицы)?

— Вот мы с вами сидим в одежде, которую произвели на станках, вокруг нас мебель, сделанная на станках, вы интервью на диктофон записываете. И что-то мне подсказывает, что этот диктофон не мастером-умельцем сделан, а собран на заводе. Благодаря автоматизации человечество живёт всё лучше и лучше. Благодаря науке и технологиям мы меньше болеем, дольше живём, не страдаем от голода и холода так, как наши далёкие предки.

— Ещё один вопрос связан с демографией. Как известно, население нашей страны сокращается, а предпринимаемые меры (типа материнского капитала, поддержки семьи и проч.) результатов не дают. Какие данные надо загрузить в машину, чтобы она посчитала и выдала рекомендации?

— Я не очень понимаю, зачем тут нужны машины. Население всех развитых стран сокращается. Это прямое следствие доступной контрацепции, более высокого уровня жизни и образования женщин. Демографы оценивают, что население планеты достигнет пика где-то в середине двадцать первого века, а дальше стабилизируется около отметки в десять миллиардов.

Перещёлкнуть выключатель

— У вас есть подкаст «Проветримся!». Это же фактически журналистика, вы там интервью берёте. Как медиа пришли в вашу жизнь?

— Не считаю, что это журналистика. Есть разница: либо профессиональный журналист исходя из своей повестки берёт интервью у специалиста, либо два специалиста разговаривают о том, что им интересно. Мы не привязываемся к повестке. Допустим, один из последних подкастов был про русский космизм. Это точно не в повестке СМИ! Но мне тема интересна, я нашёл специалиста в НГУ, связался с сотрудницей музея Циолковского — и получился разговор.

Второе — у нас нет жёсткого формата. Допустим, тележурналист говорит: у тебя 5 минут, расскажи о своей работе. Как можно за это время сказать что-то содержательное, кроме базового ликбеза? Либо ты скажешь одну новую мысль, но тогда её поймут два с половиной человека. В подкасте «Проветримся!» мы можем говорить час и больше. И никого не вырезаем.

— В одном из подкастов вы описали технологию их подготовки: собеседники обмениваются голосовыми сообщениями, потом вы их склеиваете. Как при этом диалог не теряет накала?

— Бывает, что склеиваем, бывает и непрерывная одновременная беседа. Но слушатель не чувствует никаких разрывов. Как я нашёл эту форму? Я был толстый и решил, что мне надо больше ходить. Ходить одному скучно — и я подумал, что можно в процессе записывать голосовые сообщения. Предложил людям в разных городах и местах со мной одновременно это делать. И пока мы гуляем, голосовыми удобно общаться: послушал, ответил. Сейчас уже над подкастом работает целая команда — режиссёр монтажа Миша СИНЕЛЬНИКОВ, Ксюша ДРУГОВЕЙКО, которая придумывает классные книжки для детей (например, про историю водопровода), а у нас записывает научно-популярную рубрику, где раскрывает тему выпуска. Даша РУШ — новосибирская журналистка из Тайги.инфо, художница Лиза ВЛАСОВА.

— Подкаст как-то монетизирован?

— У нас нет рекламы, я против экономики внимания. Но есть патроны — сайт Patrion.com/progulka, у нас там аккаунт. Есть некоторое количество людей, которые раз в месяц нам перечисляют какие-то деньги, но это не самоцель. Недавно у нас был Андрей СЕБРАНТ, и мы сформулировали определение аудитории: мы делаем подкаст для технооптимистов. Это люди, которые понимают, что технологии приносят пользу человечеству. И я хочу, чтобы таких людей у нас было больше.

— Вы анализировали свою аудиторию — сколько этих технооптимистов?

— Количество не так просто определить, потому что подкаст идёт по нескольким каналам. В Телеграме 4 тысячи подписчиков, на разных платформах, вроде Гугл-подкастов или Player FM, от пяти до десяти тысяч подписчиков. Могу лишь сказать, что у нас много дослушавших — больше 50%. Это при том, что мы можем говорить про странные вещи и глубоко закапываться. Например, был выпуск про квантовые вычисления, и то, что говорил Алексей ФЁДОРОВ из российского квантового центра, сложно было воспринимать на слух даже физику. Но люди продираются.

Я часто езжу по России, и ко мне подходят слушатели. Например, в Пензе познакомился с техническим директором местного мобильного оператора, который первым в России подключил район города к интернету по спутниковой связи без кабеля. Если такие люди, которые способны что-то сделать первыми или лучше других, будут нас слушать, я буду доволен. А если благодаря тому, что кто-то услышал чужую историю, потом придумает своё — вообще отлично. Это же такой процесс: сначала ты слушаешь про других, а потом у тебя что-то щёлкает.

Вот в Новосибирске сделали компанию iFarm — вертикальные фермы, в которых растят зелень и фрукты в полностью контролируемой среде, без пестицидов. С помощью электронного языка оценивают качество вкуса, чтобы выращивать ровно то, что хочется по вкусовым качествам. Сделали это с нуля и уже продают клиентам в Дубае, Финляндии и т.д.

Или Сергей РЫЖИКОВ в Калининграде сделал систему «Битрикс» и по всему миру продаёт систему работы с сайтами. А Давид ЯН, когда оканчивал МФТИ в 80-е, хотел заработать на кроссовки, а в итоге сделал компанию ABBYY, которая миллион долларов стоит.

И вот человек слушает всё это, а потом понимает, что он тоже может начать своё дело.

— Одна из ваших тем — регионализм. Вам, похоже, интересно понять, чем живут и чем отличаются регионы. У меня такая версия ответа: мы один цельный народ, способный понимать друг друга. Но отличия в том, что регионы в разы беднее столиц. А когда врач или учитель за ту же работу в Красноярске или Краснодаре получает в пять раз меньше, чем в Москве, — это рождает чувство несправедливости, разрушает единство страны. Да и люди уезжают из регионов. А как это изменить — непонятно.

— На самом деле ответ короткий: надо делать бизнес здесь и здесь оставаться. Такие примеры есть, та же «Додо-пицца». Фёдор ОВЧИННИКОВ основал её в Сыктывкаре, и до сих пор у него там головной офис, там компания платит налоги, хотя открыла представительства и в Нигерии, и в Лаосе, и в Британии, и в США.

Я семь лет жил в Германии и заметил: если немецкий бизнесмен открыл компанию в Гамбурге или Лейпциге, у него нет мысли перенести её в Берлин. Это вопрос любви к своей малой родине, к городу, в котором родился. Я оптимист и когда приезжаю в любой город, то сразу нахожу, что здесь классное и чем люди могут гордиться.

— И что вы нашли в Красноярске?

— Когда идёшь по проспекту Мира и в боковые улочки видишь Енисей и предгорья Саян — это очень красиво. А ещё я слышал про ваш проект «Биос-3», моделирующий замкнутую экологическую систему жизнеобеспечения человека. Это уникальный проект в истории человечества и тоже повод гордиться вашим городом.

Уверен, что таких крутых штук много. Нужно только переключить что-то в голове. Через любовь, через мотивацию. Это вернее, чем пытаться насытить деньгами. Сколько денег ни давай, если нет любви к своему месту, не будет и стремления делать это место лучше. Поэтому сначала нужно изменить отношение.

P.S.

После посещения Красноярска Иван записал новый подкаст «Енисейский Киото», где рассказал и про «Биос», и про экскурсию по Институту гастрономии СФУ, которым был откровенно восхищён.

P. P. S.

Основной посыл лекции Ивана Ямщикова: сейчас достаточно и компьютерных мощностей, и данных, чтобы просчитать фактически любую строго сформулированную проблему. А вычисление со времён Алана Тьюринга приравнивается к победе во всём. (Тьюринг — британский математик, который во время Второй мировой войны подобрал коды к немецкой шифровальной машине «Энигма» — сюжет, известный по фильму «Игра в имитацию».)

За последние десятилетия благодаря интернету мир накрыло волной данных. В 2013 г. их было 4,4 зеттабайта, в 2018 г. — 33, а в 2025 будет 175 ЗБ (зеттабайт — это 1ГБ в 12-й степени. Для сравнения: шаг в полметра в 12-й степени даст расстояние до Солнца. Так соотносится зеттабайт и гигабайт). Чтобы обрабатывать такие массивы информации, нужны алгоритмы машинного обучения. И сейчас они используются везде.

«Если у вас есть индустрия, где вы можете что-то измерить, вы рано или поздно сможете там сделать успешный стартап», — считает Иван Ямщиков. Стартап может быть в любой области — от повышения аптечных продаж до повышения надоев молока. Можно создать и новый сектор экономики. Главное — придумать, что измерять, вычислять и улучшать.

Например, сейчас популярна идея, что биологический возраст и фактический не равны. И ряд компаний по всему миру разрабатывают тесты, чтобы измерить биологический возраст быстро и дёшево, это горячая гонка сейчас на стыке медицины, биологии и анализа данных.

Интересно, что примерно о таких же возможностях, но в другой области недавно рассуждал теоретик современных визуальных медиа Лев МАНОВИЧ (США). Он читал лекцию в рамках конференции Европейской ассоциации цифровых гуманитарных наук, проводимой на базе СФУ, и подчёркивал, что огромное количество данных, которые сейчас мы можем обработать, позволяют изучать не только шедевры, а всю культуру в её нюансах. И то, какие нюансы вы увидите, с какого ракурса посмотрите, будет определять масштаб, значимость, свежесть, открытие вашего исследования. А в итоге мы можем получить (да уже получаем) совсем другую культуру и иное её понимание.

Анна ГЛУШКОВА