ИИ и журналистика: как в ННГУ работают над нейросетью для фактчекинга

Искусственный интеллект и журналистика данных

С наступающего учебного года в ННГУ им. Лобачевского начинается работа по повышению качества подготовки ИТ-специалистов для сферы журналистики и массовых коммуникаций. Ранее сообщалось о подписании соответствующего соглашения между директором АНО «Горький Тех» Евгением Федосеевым и ректором ННГУ им. Н.И. Лобачевского Олегом Трофимовым. Первым проектом стала магистерская программа «Искусственный интеллект и журналистика данных». Однако, как стало известно «Бизнес News», не только над ней ведется совместная работа журналистов и IT-специалистов. В рамках сетевого студенческого проекта ННГУ по верификации информации СМИ и социальных медиа #СТУДFACTCHECK планируется создание платформы и нейросети, которая будет проверять подлинность данных.

В интервью «Бизнес News» доцент кафедры журналистики, заместитель директора ИФИЖ ННГУ, руководитель студенческого проекта ННГУ #СТУДFACTCHECK Л. Макарова, системный аналитик ООО «БИ-ТЕЛЕКОМ» Ю. Баташев и руководитель направления искусственного интеллекта компании GLOBUS IT И. Померанцев рассказали об особенностях проекта.

ИИ и журналистика 1.jpeg

«Ранее эта тема никогда не поднималась. На научных конференциях и круглых столах, которые я посещала, информации было недостаточно: было желание работать с темой искусственного интеллекта, но без практического понимания, как к этой теме подступиться. Параллельно ННГУ начал уделять больше внимания технологиям искусственного интеллекта. Нам недоставало знаний в области IT-технологий, поэтому мы обратились за помощью к директору Института ИТММ ННГУ Н. Золотых. Он поддержал идею создать такую учебную программу, мы составили план. Но для ведения профильных дисциплин необходимо было найти специалистов-практиков», – рассказала Людмила Макарова, научный руководитель магистерской программы «Искусственный интеллект и журналистика данных».

Так, первым к проекту присоединился Ю. Баташев, системный аналитик ООО «БИ-ТЕЛЕКОМ». Узнав о проекте ННГУ по фактчекингу, эксперт предложил использовать в работе инструменты искусственного интеллекта.

ИИ и журналистика 2.jpeg

«Когда на конференции по ИИ мы встретились с Людмилой Макаровой, она рассказала о проекте #СТУДFACTCHECK. Мне сразу пришла в голову мысль о том, что, во-первых, в используемой методологии достаточно много монотонной и рутинной работы, которую можно автоматизировать. Во-вторых, здесь есть место для использования искусственного интеллекта. С одной стороны, мы могли бы автоматизировать и облегчить работу в рамках уже существующего проекта, а с другой – создать некий фреймворк, набор инструментов, и сделать работу по верификации информации более массовой», – рассказал Ю. Баташев.

Как отметил эксперт, сейчас развиваются два направления. Первое – создание платформы, связанной с деятельностью проекта ННГУ по фактчекингу. Это некий ресурс, на котором собрана методология, инструменты, практики, проведенные фактчеки. Второе направление – включение инструментов прикладной автоматизации конкретных этапов фактчекинга, например, с использованием нейросетей.

«Уже создана ресурсная платформа. Мы считаем, что это идею можно популяризировать на принципах краудсорсинга, дав понятный и удобный инструмент фактчекинга с описанным процессом, плюс готовый бизнес-процесс кросс-фактчекинга. В дальнейшем даже возможно запустить этот процесс на уровне «субботников» по расчистке информационного поля. Мы не говорим о информационных войнах, скорее, имеем в виду региональное инфополе. Платформа обладает широкими возможностями для сотрудничества. Например, по предложенным статьям и сомнительным данным мнение может высказать человек, обладающий экспертностью в данной области и свободным временем», – добавил Ю. Баташев.

Также к работе над проектом присоединился руководитель направления искусственного интеллекта компании GLOBUS IT И. Померанцев.

ИИ и журналистика 3.jpeg

«Погружаясь в проект, я понял, что уже накоплен большой опыт использования инструментов фактчекинга, разработана методика, которая успешно применяется. И в этом проекте есть задачи, которые можно автоматизировать с помощью искусственного интеллекта. Мы ставим себе задачей с помощью ИИ облегчить труд по поиску и обработке информации. Но итоговое решение все равно будет принимать человек, обладающий экспертностью», – рассказал И. Померанцев.

Говоря о проделанной работе, он отметил, что разработанный инструмент на данном этапе уже хорошо справляется со многими задачами, как саммаризация текста, парсинг данных и интернета, выделение основной идеи текста, поиск информации и так далее.

«Можно сказать, что сейчас в рамках этого проекта мы ведем два параллельных и взаимосвязанных направления: классический фактчекинг и автоматизированный с использованием искусственного интеллекта, создаем и тестируем некую нейросеть для фактчекинга. Фактически, данная работа станет научным направлением в развитии как магистерской программы «Искусственный интеллект и журналистика данных», так и кафедры журналистики в целом. Мы видим, что эта тематика и технологии фактчекинга могут стать достаточно востребованными, причем не только в сфере медиа, но и в бизнесе: проверка достоверности и прозрачность информации здесь, несомненно, важны», – пояснила Людмила Макарова

Говоря о магистерской программе, И. Померанцев отметил, что тот ажиотаж вокруг искусственного интеллекта и нейросетей, который имеется на данный момент, формируется с подачи журналистов и всех, кто создает контент.

«Они донесли до масс, что такой инструмент есть. Например, все знают, что такое chat gpt. Многие им пользуются и в рамках своей работы. На мой взгляд, важно обучать и готовить специалистов в сфере журналистики, которые будут знать, как работать с инструментами искусственного интеллекта, на что они, эти инструменты, способны. Уже сейчас сотрудник, который обладает этими навыками, умеет использовать в работе инструменты ИИ, намного ценнее и конкурентоспособнее на рынке труда. Например, у нас в IT есть выражение, что middle-разработчик с ИИ заменяет компании 10 junior-специальностей. Это становится актуальным для всех сфер», – рассказал И. Померанцев.

ИИ и журналистика 4.jpeg
Эксперты также отмечают, что сейчас весь маркетинг построен вокруг текста. Поэтому на рынке нужны люди пишущих специальностей, которые будут разбираться в предметной области, в частности, в технологиях. Это позволит не только улучшить качество создаваемого контента, но и повысить производительность труда за счет использования искусственного интеллекта.

Не исключается и возможность того, что создаваемая платформа на деле окажется в несколько раз масштабнее, чем авторы видят ее сейчас. Она содержит в себе несколько технологических компонентов, каждый из которых можно развивать. Платформа представляет собой портальную технологию, информация в которую поступает, в первую очередь, в формате текста. Фото- и видеоконтент также должен переводится в текстовый формат. Далее нейросеть должна проводить предварительную разметку: определить, что в тексте заявляется, как факт, и какие из этих фактов нужно проверить на соответствие действительности. Для этого и сама нейросеть также должна обладать определенной базой фактов. Но здесь есть некоторые сложности. В частности, для проверки «подсвеченного» сомнительного факта необходимо найти источник информации. Система должна будет проанализировать все данные, что найдет в интернете и где-то их хранить. Потому что, как отмечают эксперты, вся онлайн информация «динамична» – данные могут менять, ссылки становиться недоступными, страницы удаляются. Вопрос с хранением и форматом сохраняемой информации также будет дорабатываться.

Также еще одной задачей, которая стоит перед разработчиками платформы, является процесс попадания в нее информации. На данный момент модель предполагает полуавтоматическую работу: загружать информацию будет человек, а проверкой и «подсвечиванием» сомнительных фактов займется нейросеть.

«Когда мы обучаем искусственный интеллект выполнять конкретную задачу, в итоге он начинает справляться с ней лучше, чем человек. Поэтому на данном этапе мы концентрируемся именно на правильной постановке задач и отработке механизма. То, что уже удается реализовать сейчас, будет являться ярким маркером для пользователей, что к контенту стоит отнестись с подозрением и дополнительно его проверить», – пояснил Илья Померанцев.

«Есть методология, достаточно формализованная, разбитая на отдельные задачи. В рамках нее мы проверяем аффилированность автора, экспертность мнения, качество источника и т.д. В области каждой из этих задач уже существуют традиционные алгоритмические решения. На данном этапе проекта мы не стремимся создать второй Яндекс с хранением огромных массивов данных и постоянном обучением нейросети. Сейчас, на мой взгляд, правильным будет создать инструмент, выполняющий ключевые задачи фактчекинга, которые для человека являются наиболее времязатратными. Создав платформу, где каждый может получить алгоритм действий и автоматизированные инструменты для выполнения этих задач, мы сможем вовлечь в деятельность по фактчекингу большее количество людей. Популяризировать эту тему. Нарабатывая постепенно практику применения этих инструментов, развивая методологию, мы можем уточнять параметры постановки задач для нейросети, совершенствовать инструменты. Потому что, если сейчас мы возьмем курс на слишком масштабный проект, мы никуда не придем», – добавил Ю. Баташев.

ИИ и журналистика 5.jpeg

Как рассказала Людмила Макарова, изначально работа велась по проекту фактчекинга в рамках Института филологии и журналистики. Еще два года назад о проекте мало кто знал, но в 2023 году были проведены круглый стол по проблемам фактчекинга, презентация проекта в Общественной палате Нижегородской области. Интерес к проекту наблюдался и на ЦИПР Tech Week в этом году в рамках представления новой магистерской программы «Искусственный интеллект и журналистика данных».

«Я думаю, что растущая заинтересованность вызвана тем, что мы объединили два тренда современности: искусственный интеллект и борьбу с фейками. Конечно, заранее мы не можем знать, какой будет результат, но уже сейчас видим пути развития и интерес к проекту», – добавила Людмила Макарова.

Фото: Даниил Буйлов, Елизавета Болдина

Источник: «Бизнес News»

ИИ и журналистика: как в ННГУ работают над нейросетью для фактчекинга

Скоро