Сайт СФУ
Сибирский форум. Интеллектуальный диалог
апрель / 2021 г.

Всё началось с Испании

Искусственный интеллект, машинное обучение, нейронные сети — ещё десяток лет назад эти слова использовались преимущественно в фантастических фильмах. Сегодня технологии позволяют решать самые разные задачи: определить локацию бродячих собак, рассчитать возможную прибыль от будущего урожая плодового дерева, более детально узнать степень поражения лёгкого. Разработкой этих тем занимаются сотрудники лаборатории глубокого обучения СФУ. Это подразделение появилось в университете около года назад. В штате лаборатории шесть сотрудников. Средний возраст молодых учёных — 27 лет. О первых результатах работы лаборатории рассказала её руководитель Анастасия САФОНОВА.

— Как появилась идея открытия лаборатории глубокого обучения?

— В нашем вузе в принципе не было подобных лабораторий. И даже лекции по глубокому машинному обучению пока не проводятся. А тема интересна и актуальна, её нужно развивать. Более того, она интересна государству, и оно готово финансировать эту тематику в ближайшие годы. Поэтому нам поступило предложение от Руслана Александровича БАРЫШЕВА, проректора по научной работе СФУ, создать лабораторию.

Я собрала команду; искала людей, уже занимающихся этой темой. Среди них есть сотрудники СФУ, но есть и ребята из других вузов и даже из других стран. Например, молодой человек из Ирака. Мы ориентировались на то, чтобы лаборатория была международной. Это позволяет развиваться не только внутри вуза, города, страны, но и сотрудничать на международном уровне.

— Вы отметили, что есть интерес государства. Как он проявляется?

— Выделяются гранты на развитие лабораторий. Мы хотим подать заявку на один из них: мегагрант, поддерживающий развитие какого-либо нового для нашей страны направления. Но мы ещё находимся в поиске учёного. Он должен выступить руководителем лаборатории в рамках нового проекта. В условиях на получение гранта обозначены требования к такому специалисту.

К сожалению, не каждый ведущий учёный может находиться у нас в Сибири в среднем три месяца в году, как это требуется по условиям. Причины могут быть разные: как высокая загруженность, так и опасение ехать в Россию, а в Сибирь тем более. Кроме того, учёные такого уровня — часто люди в возрасте, им сложно отправиться в длительную командировку.

— Объясните, что означает «глубокое обучение»?

— На английском языке этот термин звучит как deep learning. Думаю, он переведён не совсем корректно, используется прямое значение этих слов — глубокое обучение. В целом это раздел машинного обучения. Он позволяет обучать модель предсказывать результат по набору входных данных.

Глубоким его назвали из-за того, что в современных нейронных сетях существуют скрытые слои. Если есть хотя бы один такой слой, сеть называют глубокой. Простыми словами, искусственные нейронные сети — это попытка воспроизведения работы человеческого мозга на компьютере при помощи слоёв нейронов.

Словарик

Искусственный интеллект — технология создания умных программ и машин, которые могут решать творческие задачи и генерировать новую информацию на основе имеющейся. Иными словами — это способность машины или программы находить решения при помощи вычислений.

Искусственные нейронные сети — математические модели, созданные по аналогии с биологическими нейронными сетями. ИНС моделирует работу человеческой нервной системы, особенностью которой является способность к самообучению с учётом предыдущего опыта. Таким образом, с каждым разом система совершает все меньше ошибок. ИНС состоит из отдельных вычислительных элементов — нейронов, расположенных на нескольких слоях. Данные, поступающие на вход ИНС, проходят последовательную обработку на каждом слое сети. При этом каждый нейрон имеет определённые параметры, которые могут изменяться в зависимости от полученных результатов.
В этом и заключается обучение сети.

Машинное обучение — подраздел искусственного интеллекта, изучающий методы построения алгоритмов, способных обучаться. Машинное обучение базируется на идее о том, что аналитические системы могут учиться выявлять закономерности и принимать решения с минимальным участием человека.

Понятие «машинное обучение» является составляющим искусственного интеллекта. В свою очередь, машинное обучение включает искусственные нейронные сети, и в них входят методы глубокого обучения. Сам искусственный интеллект — широкая тема, и назвать нашу лабораторию так мы не могли.

— Как определилась тематика конкретных исследований?

— Мы выбирали тематику исходя из тех знаний, которыми обладает команда. Мы делаем то, что нам интересно. Сотрудники лаборатории ведут научные исследования и создают алгоритмы для работы с графической информацией. Такие алгоритмы способны «без учителя» находить последовательность действий, приводящих к решению поставленной задачи в новой среде.

Сейчас мы занимаемся видеоизображениями, пытаемся на этих изображениях распознать объекты, детектировать их, сегментировать. Предсказать и спрогнозировать какой-то процент чего-либо.

— Что такое «детектировать»?

— Выделять фрагменты на изображении посредством построения рамки объекта по его границам. Выстраивание, создание ограничивающей рамки по объекту — это и есть детектирование.

— В планах научной деятельности лаборатории заявлены самые разные темы: и выявление заболеваний сельскохозяйственных животных, и локализация бродячих животных в черте города, и лесные пожары. Принципом для их отбора были личные интересы сотрудников?

— Да. Например, лично мне и некоторым коллегам команды интересно развитие направления дистанционного зондирования Земли. Поэтому у нас большая часть публикаций и идей в этой области. К дистанционному зондированию относятся спутниковые снимки, изображения с дрона, то есть различные изображения поверхности Земли. На них мы пытаемся детектировать какие-то объекты: растения, животных.

В частности, сегодня актуальна тема бродячих собак, нередко они нападают на людей. Мы можем создать систему, внедрить её в уличные камеры видеонаблюдения, чтобы детектировать животных. И не только собак. Это могут быть лисы, медведи, волки.

— То есть их можно посчитать?

— Можно отследить их локацию, построить маршрут. Более того, с помощью обычных цифровых видеокамер можно отслеживать состояние здоровья животных по их движениям и поведению. Это актуально для сельскохозяйственного поголовья в том числе.

— Одна из ваших тем — расчёт зелёной биомассы дерева на примере оливковых деревьев. Почему оливки, они ведь не растут в Сибири?

Сотрудники лаборатории

Сафонова Анастасия Николаевна, заведующая, тематика работ: дистанционное зондирование Земли (ДЗЗ), искусственный интеллект, беспилотные летательные аппараты, интеллектуальный анализ данных. Хобби: бег на длинные дистанции, кубик Рубика.

Русин Дмитрий Сергеевич, инженер-исследователь, тематика работ: детектирование изображений, построение собственных архитектур нейронных сетей. Хобби: игра на клавишных, походы в горы, приготовление нестандартных блюд.

Сомов Антон Константинович, инженер-исследователь, тематика работ: обработка и понимание естественных языков, задачи компьютерного зрения. Хобби: общение, походы по городу, создание метаданных для ютуба и соцсетей.

Алехина Анна Евгеньевна, инженер-исследователь, тематика работ: компьютерное зрение в задачах реального времени по областям торговли, металлургии, биологии, медицины. Хобби: фото, походы в горы, рукоделие.

Плешкова Татьяна Сергеевна, ассистент, тематика работ: анализ и обработка снимков ДЗЗ. Хобби: самообразование, стратегические карточные игры.

Хамад Юсиф Ахмед, инженер-исследователь, тематика работ: обработка медицинских изображений. Хобби: баскетбол, лёгкая атлетика.

— Эта тема связана с моими научными стажировками. Когда я обучалась в аспирантуре, каждый год выезжала в университет Гранады, вуз-партнёр СФУ в Испании. Там я работала сразу с двумя научными руководителями: один из них был специалистом в искусственном интеллекте, другой — в ботанике. Невозможно работать с дистанционным зондированием, не обращаясь к специалистам по растительности, потому что часто на изображениях не можешь понять, что это за культура, что за растение, как правильно его охарактеризовать. Кроме того, часто вместе с экспертами мы проводим наземные измерения, чтобы подтвердить адекватность своих выводов.

Расчёт биомассы оливкового дерева была последней из тем, которой я занималась в Испании под руководством Сихам Табик (отдел компьютерных наук и искусственного интеллекта университета Гранады) и Доминго Алькараз-Сегура (отдел ботаники университета Гранады). Эта тема вошла в один из подразделов моей диссертации, через пару месяцев у меня должна состояться защита PhD-диссертации. Мы пытались с помощью данных, полученных с дронов, детектировать и автоматически сегментировать крону дерева, а далее рассчитать его биомассу, чтобы спрогнозировать прибыль, которую можно получить, когда плоды созреют.

— И так можно просчитать урожай любых плодовых деревьев?

— Можно. А вот просчитать крону деревьев в лесу сложнее. Дело в том, что дрон не управляется на расстоянии свыше 300 метров. А у нас — горная местность. Дрон может подняться и потеряться. Ещё одна проблема — густой лес: кроны пересекаются между собой, и сложно отделить крону одного дерева от кроны другого, как и рассчитать их высоту. А вот там, где произведены искусственные посадки (например, в саду), всё это возможно. Так что к лету такие расчёты в качестве эксперимента мы намерены сделать.

Во время защиты в Испании я планирую провести ещё одно исследование, связанное с оливками, это будет продолжением прошлой работы, — более качественно измерить деревья. Рассчитать не только окружность кроны, но и высоту дерева, построить 3D-проекцию. Возможно, привлеку ещё какие-то спектральные каналы, не только RGB. В результате это позволит рассмотреть все возможные вариации подсчёта объёма дерева.

— Что уже удалось сделать за время работы лаборатории?

— Мы работаем меньше года. Из текущих забот сейчас — ремонт помещения, закупка оборудования. Всё это должно завершиться к осени.

Хамад

Хамад

Для работы со сложными алгоритмами нам нужны соответствующие вычислительные мощности. Пока сотрудники работают на своих компьютерах, получая доступ к необходимым графическим ускорителям. Но, конечно, хочется, чтобы у лаборатории было современное оборудование. На машинах, которые мы заказали, установлены мощные графические карты. Эти два сверхпроизводительных компьютера собраны на заказ специально для обучения нейросетей. К примеру, мы сможем ставить вычисления на ночь, уходить домой, а утром возвращаться и смотреть результаты.

За минувший год мы опубликовали одну работу в научном журнале с квартилем Q1 и подали на публикации ещё три. Две из них — совместные проекты с болгарскими коллегами из Софийского университета. Они также связаны с дистанционным зондированием Земли.

Третья работа продиктована актуальной темой коронавирусной инфекции: мы разработали алгоритм, позволяющий автоматически с высокой точностью сегментировать область повреждения лёгких на снимках КТ и рентгена, а затем предсказать стадию заражения. Этим проектом как раз занимается наш сотрудник из Ирака, его интересует медицинская тематика. Как правило, для получения таких алгоритмов необходим большой объём изображений. В данном проекте мы использовали набор данных из открытых источников нескольких стран. Это безымянные изображения — не обозначено, кому они принадлежат. Разработанные нами алгоритмы позволяют своевременно увидеть уровень повреждения лёгких и помогают специалисту рассмотреть то, что обычный снимок может не показать. Планируем опубликовать ещё две работы по коронавирусу, где предлагается использовать другие алгоритмы, также созданные нашей лабораторией.

— Это вся тематика?

— Также мы ведём совместный проект с коллегами из ЛЭТИ, Санкт-Петербург. Пытаемся автоматически детектировать горных газелей на видеоряде, полученном от одной из азиатских стран, чтобы вычислить маршрут этих диких животных. Параллельно начинаем работу над проектом по сельскохозяйственным животным — коровам, выявлению заболеваний по их поведению. Для этого будем использовать изображения, полученные с видеокамер ферм. Я говорила об этом выше: мы можем создать и внедрить в видеокамеру такую систему, которая детектирует животное и, если есть какие-то повреждения или подозрения на заболевания, вовремя извещает об этом.

— Над одной темой работает один сотрудник, или это коллективная работа?

— Если мы ведём какой-то крупный проект, трудимся вместе. Но чаще разбиваемся на группы по два — три человека и ведём определённые темы. Если работаем со сторонними организациями, то в группе по пять – семь человек.

— А как появились зарубежные связи?

— Всё началось с Испании, когда я поехала туда на свою первую стажировку. Это был второй курс аспирантуры. Там я нашла себе научного руководителя, с которым до сих проводим исследования, пишем статьи. Мы начали публиковать работы на английском языке, их стали читать и обращаться к нам с предложениями о сотрудничестве. Работать стало интереснее. Так наладились контакты с коллегами из Японии, Беларуси, Болгарии, Франции.

— Когда вы решили, что хотите делать карьеру в научной деятельности?

— О том, чтобы поступить в аспирантуру и заниматься наукой, я стала думать на третьем курсе. Моей специальностью была прикладная информатика, я училась в Институте управления бизнес-процессами и экономики СФУ. В аспирантуру поступила на кафедру систем искусственного интеллекта Института космических и информационных технологий.

— Какие глобальные планы ставите перед собой как заведующей лабораторией?

— Хотелось бы принять участие в крупных научных проектах, возглавить какой-нибудь из них и завершить его. Хочется попробовать себя и в образовательной сфере. Для начала можно открыть дополнительные курсы по искусственному интеллекту, управлению и работе с беспилотными летательными аппаратами.

Софья АНДРЕЕВА