Сайт СФУ
Сибирский форум. Интеллектуальный диалог
апрель / 2019 г.

Страх и ненависть «ВКонтакте»

Наше время оставит в сетях бесконечное количество текстов и фотографий, какофонию мыслей и слов. Но, оказывается, существуют технологии, которые помогают ориентироваться в этом океане, понимать настроения и оценивать мнения больших масс людей. Это всё о прикладной лингвистике, которой в Красноярске занимаются в Институте филологии и языковой коммуникации СФУ. О спрятанных в тексте эмоциях, манипуляциях и других секретах языка мы поговорили с доктором филологических наук, профессором Анастасией КОЛМОГОРОВОЙ — заведующей кафедрой романских языков и прикладной лингвистики.


— Анастасия Владимировна, если изложить суть прикладной лингвистики простым языком — в чём состоит и для чего существует это направление научных исследований?

— Жизнь, окружающая нас сегодня, стала текстовой. О том, что мы живём в текстовой вселенной, говорится давно. Но если раньше в тексты, становившиеся достоянием социума, помещалось самое ценное, например литературные произведения, то сегодня мы выплёскиваем на публичные просторы Интернета свои личные эмоции и переживания. Наше текстовое существование в сети под никнеймами стало практически реальным. А где есть текст, там и лингвисты: мы можем использовать наши знания о языке, его закономерностях, чтобы выявить то, что скрыто от непосредственного наблюдения. Не в самом языке, а в человеке, поскольку текст — это порождение нашей психики и мозга.

О психике и мозге мы много сказать не можем, а вот о языке можем. Поэтому прикладная лингвистика — это, по сути, обработка текстов доступными учёным-языковедам методами. Наблюдение за использованием слов, построением предложений, чтобы сказать что-то о человеке, сфере его занятий, обстоятельствах, в которых он говорит и пишет.

— Это сравнительно молодая наука?

— Да, хотя ещё в XIX веке основоположник структурной лингвистики Фердинанд де СОССЮР говорил о необходимости внешней лингвистики, которая бы изучала и систематизировала связи единиц языка с психологическими, физиологическими, социальными процессами, моделировала бы их. Но тогда для этого не было инструментария. Первые разработки в прикладной лингвистике датируются серединой XX века, когда появились дешифровальные машины, возникла кибернетика. По мере развития компьютеров стала развиваться и прикладная лингвистика, поначалу в военных и коммерческих целях. Всерьёз об этой науке можно говорить только со времени, когда все стали пользоваться ПК. Возникла корпусная лингвистика — со «складированием» размеченных текстов.

Рассказываю студентам: мой материал для кандидатской диссертации в далёкие 90-е — карточки с выписанными примерами — хранился в коробке из-под сапог. Если пропадёт, уже не восстановишь. И такие карточки все лингвисты собирали годами. А сейчас можно за 15 минут набрать примеры для исследования и анализа. Есть технологии, которые позволяют классифицировать и обрабатывать огромное количество текстового материала, то, что называется Big Data, задавая выборку по определённым критериям. Вот это и позволяет говорить о прикладной лингвистике как об активно развивающемся сегодня направлении языкознания.

— Кому в первую очередь нужны эти исследования?

— Чаще всего маркетологам, которым требуется посмотреть, как потребители оценивают товар. Сейчас все сайты по продажам товаров или услуг снабжены сервисом комментариев, пользователи ставят лайки, выражают свою оценку в высказываниях. И чтобы делать глобальные выводы о продвижении товара, успешности рекламной кампании, нужно проанализировать большой массив материала. Тогда обращаются за помощью к лингвистам, владеющим технологией, которая позволяет вычленить в текстах нейтральные, позитивные и негативные оценки.

— Госструктуры заказывают такие исследования?

— Да, есть работы, направленные на анализ общественного мнения — например, по решениям, которые неоднозначно воспринимаются в обществе, по реакциям на то или иное событие в разных социальных группах.

— Корпус текстов — что имеется в виду?

— Корпус — это электронная коллекция текстов, каждое слово в которых сопровождается пометками о частях речи, значениях, грамматических функциях слов. Корпусы используются лингвистами для того, чтобы подтвердить или опровергнуть свои гипотезы. Например, в проекте нашей кафедры по классификации эмоций нам требовались тексты эмоциональной направленности, и мы выкачивали их из сети «ВКонтакте» с помощью специально написанных программ. Получился большой материал, но для маркетинговых исследований берут намного большие объёмы данных.

— Получается, с цифровой революцией в вашей сфере произошёл настоящий прорыв?

— Наверное, о прорывах стоит говорить применительно к медицине или ядерной физике.

В лингвистике же это обилие данных — скорее, получение нового материала и инструментария к нему.

Раньше мы делали выводы на 5 тысячах примеров. Сегодня самый большой составленный лингвистами корпус — 14 миллиардов текстоформ, а технологии позволяют делать коллекции текстов и в десятки раз большие.

И когда подтверждается некая гипотеза, она обладает большей валидностью, жизнеспособностью и прикладным значением. К примеру, мы можем не просто проанализировать романы Сомерсета МОЭМА или сказать, каким был язык и стиль отдельного писателя, но и понять, какие тексты используют большинство носителей языка, чтобы выразить свой гнев и страх.

— Как развивается российская прикладная лингвистика и в каких отношениях она с зарубежными исследованиями: догоняет, опережает?

— Трудно сказать однозначно. Прикладная лингвистика зиждется на двух традициях: лингвистической и математической, а они в России традиционно сильны. Но, как это часто бывает, нашлись другие насущные проблемы… Так что мы сейчас учимся у западных коллег, у китайских коллег, которые делают пионерские вещи. Например, по машинному обучению, сентимент-анализу, выявлению эмоциональной тональности текстов — это прежде всего работы китайских авторов на англоязычном материале.

— В чём особенность проектов СФУ в сфере прикладной лингвистики?

— Наш университет многопрофильный, со множеством контактов в городе, и особенность, наверное, в том, что наши научные гипотезы глубоко проникают в общество. Наши проекты не строго академические, но всегда связаны с жизнью.

Например, первый был начат в 2014 году, когда отмечались процессы охлаждения отношений между Россией и США. Читая американские СМИ, мы видели, что действия России подаются в абсолютно негативном ключе, авторы манипулируют мнением своих читателей. На нашей кафедре было разработано программное приложение, которое позволяло отслеживать степень манипулятивности статей. Это был пробный камень.

Сегодня на кафедре мы занимаемся двумя большими проектами.

Первый — уже упомянутый проект по эмоциям на материале социальных сетей, результатом которого будет программа, позволяющая распознавать в текстах восемь видов эмоций: отвращение, радость, удовольствие, депрессию, стыд, страх, удивление, тоску. Недавно он получил грант Российского фонда фундаментальных исследований. Проект имеет практическое значение: социальные сети стали частью нашей жизни, они отражают эмоции и формируют их. Вспомните прецедент с «Синими китами». Текст может представлять собой эмоциональное насилие, провоцировать самые негативные чувства, вплоть до суицидальных настроений. Наш классификатор позволит мониторить соцсети, вычленяя депрессивные тексты, и тогда человеку можно будет помочь до совершения рокового поступка. Кроме того, наша программа будет полезной для оценки эмоциональной реакции публики на фильмы, продукты массмедиа — это уже касается маркетинга.

Второй основной проект нашей кафедры посвящён адаптации афатиков — людей, потерявших способность к активной речевой деятельности в результате инсульта или травмы. Это был социальный заказ по инициативе наших коллег-врачей из Федерального Сибирского научно-клинического центра ФМБА России.

Мы начинали с составления упражнений для речевой реабилитации таких больных. Вначале занимались восстановлением речи по традиционным методикам, начиная с упражнений на артикуляцию и значение слов. Как мы знаем, при повреждениях речевых центров мозга человек, заново овладевая речью, вначале усваивает пространственные отношения, затем временные и лишь потом метафорические. Незнакомым с этой спецификой трудно составлять учебные предложения.

Но по мере работы наши коллеги доктора медицинских наук Семён Владимирович ПРОКОПЕНКО и Елена Юрьевна МОЖЕЙКО, а также заведующая отделением Ольга Николаевна НИКОЛЬСКАЯ предложили идею создания электронной платформы для речевой реабилитации удалённых больных, находящихся в других городах.

Изюминкой этой работы для нас стало то, что упражнения составляются не для широкого круга пациентов, а для определённых социальных групп. Очевидно, что речь у преподавателя и у водителя разная, и это необходимо учитывать при составлении упражнений. Сейчас мы работаем над наполнением этой платформы. Ведём сбор информации, слов, которые используют представители разных профессий, пола и возрастных групп. Есть люди-билингвы, говорящие на двух языках, например наши соседи хакасы и тувинцы. Подобный фактор тоже влияет на восстановление речи и на упражнения, которые должны предлагаться при этом.

— В какой стадии сейчас находится этот проект?

— Есть его концепт, продумана технология. Кафедра работает над содержательным наполнением. Врачи, занимаясь программой реабилитации, опираются на медицинские показания, а лингвисты — на социальные и гендерные факторы. Мы называем это речевой биографией: с какими текстами человек имел дело, пока был здоров, о чём и как разговаривал с другими. С помощью анкетирования создаём галерею типовых портретов. Думаю, работу по афатикам мы выполнили уже примерно на 40%. Привлекаем студентов, магистрантов, стараемся работать многоярусными командами по 5—6 человек.

— Эта работа тоже имеет поддержку в виде гранта?

— Пока нет. Но вместе с коллегами-неврологами и логопедами мы подали заявку на конкурс научных проектов и инициатив ФМБА и сейчас ждём решения по ней.

Если наши исследования поддержат, то их результаты будут внедряться во всех лечебных учреждениях ФМБА. Хочу подчеркнуть, что это не исключительно кафедральный, а совместный с медиками проект. Мы работаем как дружная слаженная команда.

— Отразились ли в новых проектах ваши личные научные интересы? О чём в своё время вы писали докторскую диссертацию?

— Моя докторская написана и защищена давно, в 2006 году. Это исследование по семиотике, написанное в классическом ключе. Я тогда ещё не работала в СФУ. Но именно с приходом в СФУ, в ИФиЯК в 2013 году связываю обогащение своих научных интересов. В сравнении с предыдущими вузами, где я работала, здесь оказались совершенно иной уровень и широкие научные горизонты.

— А каким вы нашли город?

— Я родилась и выросла в Новокузнецке и в Красноярск хотела уехать ещё в юности, поступать в художественное училище, но родители не отпустили. Так что, когда наконец попала сюда, было ощущение, что мечта сбылась. Город мне понравился сразу, тем более что мы жили на зелёной территории университета, в семейном общежитии. Но и потом я не разочаровалась и уже через год заметила за собой, что говорю «наш город». Полностью ассоциирую себя с Красноярском.

В ИФиЯК мне удалось найти единомышленников, например выпускника ИКИТ Александра КАЛИНИНА, Юлию ГОРНОСТАЕВУ, которая защитила диссертацию по манипулятивным технологиям в 2018 году. Образование сотрудников — лингвистическое, не филологическое, и большинство кандидатов наук защищены по теории языка. Коллектив молодой, 13 человек. Инициатором создания кафедры была Людмила Викторовна КУЛИКОВА, которая поддержала наше увлечение прикладной лингвистикой.

— Прикладную лингвистику преподают студентам?

— Это предмет по выбору для магистратуры, и студенты с интересом ходят на наши занятия, мы привлекаем их к проектам. Александр Калинин учит основам программирования — этот курс, к сожалению, не преподаётся в ИФиЯК. Правда, сейчас у первокурсников есть предмет «IT-технологии в обучении иностранному языку», и мы стараемся вводить в него элементы программирования. Для нас эта дисциплина очень важна. И когда в магистратуру пришла недавно студентка ИКИТ, мы были очень рады: она понимает специфику наших задач и может воплотить какие-то лингвистические вещи, используя свои знания программирования.

— Какие идеи ещё вам хотелось бы осуществить?

— Новые идеи возникают постоянно. Например, почему бы не использовать тексты разной эмоциональной направленности, грустные и весёлые, при обучении русскому языку иностранцев? В каком случае результат окажется выше?

Или — насколько зависит оценка эмоциональной тональности текста от типа личности, от того, кем является человек: сангвиником, интровертом, экстравертом… Ещё одна очень интересная тема — речевые автоматизмы, которые возникают в речи больных, утративших способность говорить. Иногда бывает, что человек не может произнести ни слова, но вдруг выпаливает целую фразу. Мы пришли к выводу, что слова «выскакивают» из травмированного мозга, когда возникает яркая эмоция: злость, обида, гнев. За такие осколки речи можно зацепиться и «вытягивать» её, как за ниточку, на поверхность. И если предлагать больным речевые упражнения на радостных текстах, вызывая положительные эмоции, можно увеличить количество подобных ниточек.

— Анастасия Владимировна, анализируя соцсети, какой вывод можно сделать: это пространство ненависти или любви?

— Трудно сказать. Но мы точно знаем, что гневные тексты обладают бОльшим количеством специфических черт. А в радостных особенности найти сложнее. Например, для гневных высказываний характерно частое употребление глаголов говорения. Если в тексте есть «говорю», «когда говорят», это на 80% гневное «послание». Радость же трудно выявить на уровне лексики, грамматики или синтаксиса. При том что это, казалось бы, такая фонтанирующая эмоция… А вот стыд не так уж и безмолвен. Для текстов с этой эмоцией характерно, например, противопоставление двух временных точек — тогда и сейчас, а также слова с семантикой насилия. В тоскливых текстах часты разговоры с самим собой, здесь много местоимений. В записях, выражающих страх, много существительных и мало глаголов, много отрицательных частиц, а с точки зрения лексики часто встречаются слова, называющие членов семьи и болезни. Как правило, именно сочетание этих двух лексических рядов маркирует страх. Для многих эмоций вообще характерна интересная комбинаторика.

Кстати, наша работа — один из первых примеров анализа для восьми эмоций. В практике англоязычных исследований все тексты делят на три класса: позитивные, негативные и нейтральные. А мы нашли интересную классификацию эмоций и когда докладывали первые результаты на конференции, наблюдали большой интерес со стороны коллег.

— Привлекали ли вы к своей работе психологов или физиологов?

— Да, у нас есть коллеги-психологи, которые помогают составлять анкеты. С физиологами пока, к сожалению, не работали, но вопросы к таким специалистам накапливаются, и очень хотелось бы найти единомышленников в этой области, которые помогли бы нам с ними разобраться.

— Кроме названных больших проектов есть ли у вас любимые сферы исследований?

— Да, у нас есть одно направление, быть может, не такое технологичное, а, напротив, мягкое, домашнее… Мы изучаем язык матерей, общение мам с детьми. В своё время я собрала достаточно большой корпус видеозаписей, попросив мамочек записать по полчаса общения со своим ребёнком. В итоге получилась большая коллекция на 60—70 часов. Ещё в 2013 году я издала монографию «Мамин язык». Она вышла в издательстве «Флинта. Наука» и переиздавалась несколько раз.

А одна из моих молодых коллег, Ольга ВАРЛАМОВА, на этом материале в прошлом году защитила диссертацию на тему общения матери с ребёнком от рождения до полутора лет. Получилось очень познавательно. Например, мы выяснили, что уже в таком возрасте мать учит малыша моделям агрессивного поведения — мы назвали это игровой агрессией. Матери показывают совсем маленьким детям, как надо сердиться: «Дядя стучит, погрози ему, скажи а-я-яй!». Причём делают это на совершенно интуитивном уровне.

Очень интересно и то, что только русские матери говорят месячному ребёнку, заглядывая ему в глаза: «Ну и о чём ты там думаешь?». Мы сравнивали с аналогичным материалом французских коллег, там в общении с малышом нет ничего подобного. Это вообще невозможное для западной культуры вторжение в личное пространство. А у нас всё иначе, границы прозрачны, мы должны быть открыты друг другу… На конференции после доклада об этой особенности один из коллег прокомментировал: точно, мне сорок лет, а мама до сих пор заглядывает мне в глаза и спрашивает: «Ну и о чём ты думаешь?».

— Часто пишут, что современные матери уже не поют детям песенок, не рассказывают народных потешек, что этот язык утрачен, а культурный уровень населения падает... Это правда?

— Наши записи показывают, что нет. Очень много примеров, когда мамы играют с детьми, как раз используя фольклорные тексты. Так же и во Франции, все эти прибаутки, сказки, песенки остаются. Причём в исследовании участвовали мамы из самых разных социальных страт — и с высшим образованием, и женщины рабочих профессий. Но особых отличий в их языке при общении с младенцами нет, общая модель позволяет нам понимать друг друга в рамках нашей культуры.

Вообще, мне кажется, падение культурного уровня в обществе — это миф. Конечно, всё зависит от того, в какой среде вращается человек. Но могу сказать, что у нас замечательные студенты. Недавно в День поэзии мы кафедрой собирались вместе со студентами в магазине «Бакен», читали стихи на разных языках. И 17—18-летние знают так много стихов и на французском, и на английском, и на испанском, читают их очень эстетично и глубоко.

P.S. Хотите потренироваться в распознавании эмоций?

Соотнесите каждый из отрывков с базовой эмоцией

1. «Привыкла, что мужчины от меня уходят и надолго никто не задерживается. А теперь в моей жизни уже 3 месяца есть только один мужчина, а я всегда готовлюсь к его уходу. Увижу интересное вязание, а в голове мысли: «Свяжу, когда он уйдёт от меня»; книгу: «Прочитаю, когда он уйдёт». Выбран бассейн и спортзал, в которые буду ходить, когда не с кем больше будет проводить вечер. И постоянно говорю себе: не привыкай, не привыкай!».

2. «В старших классах был у нас учитель истории. Весь такой потрёпанный временем ловелас, в прошлом преподаватель вуза. У него давным-давно насчёт девушек сформировалось мнение, мол, симпатичные блондинки ни на что, кроме как замужество, не годны. Изрядно подпортил мне аттестат. Ведь я обладательница золотых кудрей и милого личика. Но аргументировал тем, что пятёрок на всех не хватит, и они нужнее моим одноклассницам. Недавно зашла в старую школу. На лестнице встретила его, округлившего глаза на новость, что я стала одним из уважаемых этнографов города».

3. «Учусь в медицинском. Преподаватели говорят, мол, вы уже не такие студенты, вы тупые, ленивые и т.д... вот в советское время... бла-бла-бла. А сами, как только урок заканчивается, уходят, даже если у нас есть вопросы и мы чего-то не поняли, приговаривая: «Нам не платят за то, чтобы мы сидели здесь с вами больше положенного». Думаю, вряд ли в советское время так говорили» .

4. «Всё время злился на жену за то, что она непонятно куда тратит огромные суммы денег. А потом заглянул в её ноут по мелочи, увидел незакрытую вкладку и так узнал, что она постоянно перечисляет деньги в благотворительные фонды и на операции людям. Я никогда в средствах не нуждался, за все 30 лет жизни даже и не думал помогать людям. Теперь понял, что живу с ангелом».

Ответы. 1. Тоска/Страдание. 2. Интерес/ Возбуждение. 3. Злость/Гнев. 4. Стыд.

Татьяна АЛЁШИНА