«Google AI вскоре сможет использовать кашель человека для диагностики заболеваний», под таким заголовком 22 марта 2024 года вышла статья на сайте журнала ХАЙТЕК+ (автор Александр Шереметьев, новостной редактор портала).
В материале, размещенном на портале ХАЙТЕК+, рассказывается о том, как команда под руководством ученых Google разработала инструмент машинного обучения, который может помочь обнаруживать и контролировать состояние здоровья, оценивая такие шумы, как кашель и дыхание. Наша команда заинтересовалась этим вопросом, и мы решили проверить достоверность данного факта и выяснить его практическую значимость.
В статье утверждается, что система искусственного интеллекта (ИИ) HeAR, обученная на миллионах аудиозаписей человеческих звуков, однажды может быть использована врачами для диагностики заболеваний, включая COVID-19 и туберкулёз, а также для оценки того, насколько хорошо функционируют лёгкие человека.
Это не первый случай, когда учёные исследуют звук в качестве биомаркера заболеваний. Эта концепция получила распространение во время пандемии COVID-19, когда учёные обнаружили, что респираторное заболевание можно обнаружить по кашлю.
Новое в системе Google, получившей названий Health Acoustic Representations (HeAR), — это значительный набор данных, на котором она обучалась, и тот факт, что её можно настроить для выполнения нескольких задач.
Специалисты, занимавшиеся этой разработкой, отмечают, что ещё слишком рано говорить о том, станет ли HeAR коммерческим продуктом. На данный момент план состоит в том, чтобы предоставить заинтересованным исследователям доступ к модели для использования в собственных исследованиях. «Наша цель в рамках исследования Google — стимулировать инновации в этой зарождающейся области», — говорит Суджей Какармат, менеджер по продуктам Google в Нью-Йорке, который работал над указанным проектом.
В случае с HeAR команда Google адаптировала его для выявления COVID-19, туберкулёза и таких характеристик, как курение человека. Поскольку модель была обучена на широком диапазоне человеческих звуков, для ее точной настройки исследователям пришлось передать ей лишь очень ограниченные наборы данных, помеченных этими заболеваниями.
По шкале, где 0,5 представляет модель, которая работает не лучше, чем случайное предсказание, а 1 представляет модель, которая каждый раз делает точный прогноз, HeAR набрал 0,645 и 0,710 для обнаружения COVID-19, в зависимости от того, на каком наборе данных он был протестирован — более высокая производительность, чем у существующих моделей, обученных на речевых данных. В отношении диагностики туберкулёза показатель составил 0,739.
Тот факт, что исходные данные обучения были настолько разнообразными — с разным качеством звука и человеческими источниками — также означает, что результаты поддаются обобщению, — говорит Какармат.
Али Имран, инженер из Университета Оклахомы в Талсе, говорит, что сам объем данных, используемых Google, придаёт значимость исследованию.
Это даёт нам уверенность в том, что это надёжный инструмент, — говорит он.
Оригинальная статья: nature.com
Прежде, чем перейти к дальнейшему анализу других статей, мы решили выяснить, возможно ли такое вообще и как работает данная технология. Наш эксперт Илья Валерьевич Померанцев, руководитель направления искусственного интеллекта компании GLOBUS-IT, помог нам разобраться в некоторых вопросах с точки зрения развития технологий ИИ.
— Есть ли исследования, которые подтверждают, что искусственный интеллект Google может использовать кашель человека для диагностики болезни, включая COVID-19 и туберкулёз?
— Гипотетически такая возможность есть, потому что в России были подобные истории, связанные с вибродиагностикой сердца, с определением по речи, где учитываются особенности человека, его национальная и языковая принадлежность. То есть, основная история искусственного интеллекта в том, что он может очень хорошо определять какие-то аномалии в данных. И если у ковидного кашля есть хоть какие-то специфические звуки, он очень просто их сможет находить и определять, что вот это именно ковидный кашель, а вот этот, допустим, туберкулезный. Гипотетически, такое возможно, если они об этом заявляют, думаю, они всё-таки добились каких-то определённых успехов. С точки зрения технологии я противоречий не вижу.
— Если мы говорим о выявлении какой-либо серьёзной болезни, есть ли перспектива в развитии у этого исследования? Сможет ли вообще ИИ выявлять стадии, например, COVID-19?
— Опять же, COVID-19 поначалу выявлялся и протекал достаточно тяжело, сейчас же он может быть похож на грипп и так далее. И тут вопрос, опять же к той выборке, к тем данным, которые есть у исследователей. Скорее всего, с изменением клинической картины, нужно будет алгоритмы дорабатывать и видоизменять. Если говорить о стадии выявления, то хорошо обученная модель искусственного интеллекта требует больших статистических данных. И вот в каких-то сложных случаях этих данных достаточно мало.
На эту же тему представлена публикация в издании СНОБ: «Нейросеть Google сможет определять болезнь по кашлю. В частности, она будет распознавать туберкулез и COVID-19».
В статье рассказывается о том, что система искусственного интеллекта обучена на аудиоклипах с человеческими звуками. Для этого использовали более 300 млн коротких записей кашля и дыхания из общедоступных видеороликов на YouTube. Каждому из них была дана специальная пометка, обозначающее одно из известных заболеваний. Затем исследователи заблокировали некоторые из них, чтобы помочь модели научиться предсказывать недостающие фрагменты.
Врачи смогут использовать нейросеть для диагностики заболеваний, включая COVID-19 и туберкулёз. Также она поможет следить за тем, насколько хорошо функционируют лёгкие человека.
ИИ обучили диагностировать заболевания по звуку кашля, пишет Тechinsider.
Но в отличие от многих других статей, этот канал рассказывает о том, как обучалась эта машину: она прослушала 300 миллионов записей.
Большинство инструментов искусственного интеллекта, разрабатываемых в этой области, обучаются на аудиозаписях кашля или дыхания. Запись сопровождается медицинской информацией о человеке, издающем эти звуки. Например, клипы могут иметь метку, что на момент записи у человека был бронхит. Инструмент позволяет связать особенности звуков с меткой данных в процессе обучения. Это так называемое «обучение с учителем».
Вместо этого исследователи Google использовали обучение с частичным привлечением учителя, которое опирается на неразмеченные данные. Учёные собрали из общедоступных видео на YouTube более 300 миллионов коротких звуковых фрагментов кашля, дыхания, покашливания и других человеческих звуков.
Каждый клип был преобразован в визуальное представление звука, так называемую спектрограмму. Затем исследователи «заблокировали» некоторые сегменты спектрограмм, чтобы помочь модели научиться предсказывать недостающие части. Это похоже на то, как обучают большие языковые модели, лежащую в основе чат-ботов. Например, ChatGPT именно так на множестве примеров текста обучался предсказывать следующее слово в предложении. Используя этот метод, исследователи создали то, что они называют базовой моделью, которую, по их словам, можно адаптировать для самых разных задач.
По словам Яэль Бенсуссан, область медицинской акустики или «аудиомики» является многообещающей: «Акустическая наука существует уже несколько десятилетий. Отличие заключается в том, что теперь, благодаря искусственному интеллекту и машинному обучению, у нас есть средства для сбора и анализа очень большого количества данных».
Бенсуссан является соруководителем исследовательского консорциума, который сосредоточился на изучении голоса как биомаркера здоровья: «Существует огромный потенциал не только для диагностики, но и для скрининга и мониторинга. Мы не можем повторять сканирование или биопсию каждую неделю. Вот почему голос становится действительно важным биомаркером для мониторинга заболеваний. Это не инвазивно и требует совсем немного ресурсов».
Крайне интересным оказался вопрос об использовании данной технологии в медицине, и мы решили подробнее об этом расспросить нашего эксперта.
Насчёт такой медицинской практики, большие сомнения. Скорее всего, будет ниша именно за бытовым использованием, например, фитнес-трекер по скринингу своего состояния. Так же, как это сейчас делают браслеты, они измеряют пульс, давление и другие дополнительные параметры. Но это ни в коем случае не является основанием для постановки диагноза и самолечения. Все равно мы приходим в медицинское учреждение, где доктор берёт дополнительные анализы, только тогда определяют и ставят диагноз, — прокомментировал наш эксперт Илья Валерьевич Померанцев.
— Получается, если такую технологию внедрят, то она будет нуждаться в других подтверждениях?
— Да. Как член Комиссии по реализации Кодекса этики ИИ под эгидой Альянса в сфере ИИ я придерживаюсь того мнения, что ответственность за постановку диагноза лежит на враче или на другом медицинском работнике. Поэтому здесь нельзя говорить о том, что это будет самостоятельное приложение, которое будет однозначно определять и ставить диагноз.
Общество должно привыкнуть, что любой новый инструмент очень плохо внедряется и сейчас существует много сложностей для его внедрения. Если бы это было однозначно, возможно, мы бы говорили о том, что да, это решение очень классное, и его через месяц уже все используют. Однако об этом речи в ближайшее время не идёт. Поэтому пока это на уровне размышления и какого-то бытового использования, дальнейших исследований.
Директор Института клинической медицины ННГУ им. Н.И. Лобачевского, доктор медицинских наук, профессор Наталья Юрьевна Григорьева прояснила нам некоторые вопросы относительно возможностей технологий прикладного ИИ в системе диагностики различных заболеваний.
— Исходя из существующих данных, как вы считаете: можно натренировать нейросеть, чтобы она могла в автоматическом режиме определять, есть ли у человека COVID-19 или туберкулёз, например, по кашлю?
— На самом деле, искусственный интеллект здесь, наверное, ни при чем, потому что существуют анализы. Причём есть экспресс-диагностика, есть более точная диагностика на антитела к коронавирусу. И здесь искусственный интеллект нам просто не нужен. По наличию и уровню антител в крови можно судить о факте инфицирования коронавирусом SARS-COV-2 в прошлом, даже при бессимптомном течении, и определить, сформировался ли иммунный ответ. Наличие антител к иммуноглобулину G подтвердит факт перенесенной инфекции. Другое дело диагностика. Вот здесь искусственный интеллект действительно имеет место быть. Уже существуют работы как китайских, так и российских учёных, когда использовался искусственный интеллект в процессе анализа результатов компьютерной томограммы более точно, чтобы сориентировать врача, найти какие-то отличия. Действительно, ИИ мог найти отличия, чем коронавирусная пневмония отличается от обычной пневмонии, которой мы болели раньше.
— С IT-специалистом мы обсуждали, что для программирования такой программы нужно минимум 1000 человек с уже подтверждённым диагнозом врача. Насколько эта цифра верна и верна ли? Какие ограничения могут возникнуть, если такая система всё-таки появится и такие масштабные данные будут загружены в ИИ?
— Совершенно, верно. Как минимум, 1000 пациентов, по результатам истории болезни которых собирается информация. И крайне важно не забывать о параметрах выборки этих пациентов. Чем более однородной является эта выборка, тем точнее результат. Если мы берём молодых, ограничимся возрастом, это одно, и там симптомы будут одни. У пожилых нужно обязательно учитывать: какие у них есть сопутствующие заболевания. Если это курильщики — они кашляют всегда. Здесь ИИ никак не поможет, потому что он вам не ответит на все вопросы. Как он поймёт — он кашляет не по болезни, а потому что он курит, или потому что у него астма. И возвращаемся к выборке. Лучше всего ограничить по возрасту. Например, это должны быть пациенты до 40 лет. Врачи, всегда выбирая пациентов для исследования, пишут, допустим, одинаковое количество мужчин и женщин в возрасте до 40 лет без значимых сопутствующих заболеваний. То есть, мы должны убрать пороки сердца, тяжёлую врождённую патологию, если речь идёт про COVID-19, здесь надо убрать другие респираторные заболевания.
— Возникают сложности даже для анализа данных, получается, есть ли вообще перспективы внедрения такой технологии в реальной медицинской практике? Видите ли вы личную перспективу?
— Наверное, всегда в медицине хочется что-то новое создать. Если появится такая именно платформа, где пациент будет загружать свои симптомы и звуковой файл с кашлем, а виртуальный помощник даст ему ответ: «вероятность такого-то заболевания у вас, например, 10% или 40%». В таком случае, да, почему бы такую систему и не создать. Но здесь не надо упираться, ещё раз повторяю, только в кашель. Это должен быть комплекс симптомов. Безусловно, польза от ИИ в помощи врачам есть. Он и есть наш помощник.
Заключение
Таким образом, разработки в области искусственного интеллекта, такие как использование кашля человека для диагностики заболеваний с помощью Google AI, действительно могут стать важным инструментом в медицинской диагностике и помочь в своевременном выявлении заболеваний. Однако важно помнить, что искусственный интеллект не застрахован от ошибок, поэтому врачам всегда следует анализировать результаты и учитывать все факторы, связанные с состоянием пациента.
Эксперты и данные исследований показывают, что необходимо сохранять баланс между использованием искусственного интеллекта в медицине и профессиональной оценкой врачей. Ключевым аспектом является комплексный подход к диагностике, учитывающий все аспекты здоровья пациента, его образ жизни, наследственность и другие факторы.
Таким образом, хотя искусственный интеллект может быть полезным инструментом в медицине, важно помнить о его ограничениях и не принимать окончательные решения на основе только алгоритмов. Профессиональная оценка врачей остается ключевым элементом в обеспечении качественного медицинского ухода.
Авторы: Арина Горшенкова, Ева Михеева, Алина Калашникова, Алена Манина, Анастасия Захарова, Даниил Буйлов