Нейросети против коронавируса: прогноз, диагноз, поиск лекарства

Опубликовано at 15.05.2020
110 0

На фоне пандемии, которая на несколько месяцев опрокинула устоявшийся порядок вещей, на передний план вышли технологии. И речь не только про коммуникации, владельцы которых сейчас переживают звездный час (а также бездну проклятий и обвинения в тотальной слежке), но и про настоящие технологии, такие как нейросети.

Мы отобрали три примера того, как искусственный интеллект поможет побороть COVID-19.

I. Прогноз распространения

Антон Халиков является основателем уральской IT-компании NetAngels и создатель нейросети, которая дает прогноз по заболеваемости COVID-19. Изначальной его целью в начале апреля было понять, реалистично ли окончание карантина после 30 апреля или нет.

Поскольку у меня есть много математических моделей, которые можно использовать для прогнозирования, я начал использовать различные варианты и смотреть какая подходит больше, это произошло примерно 15 апреля. Через несколько дней у меня получился первый результат, который так скажем, меня удовлетворял. Когда нейросети обучаются, то выборка тех данных, которые у вас есть, она всегда делится на обучающую и тестовую. Т.е. обучающую выборку мы показываем нейросети. Например, данные, которые были с начала эпидемии с 1 марта и до того, что было неделю назад, а потом смотрим данные за прошлую неделю, что бы посмотреть реальные ли они. И когда более или менее показатели стали похожи на правду, я начал строить прогнозы дальше.

По словам Халикова, с 18 апреля он начал добавлять в нейросеть новые данные и смотреть прогноз вперед, и через несколько дней понял, что прогноз получается точным, но только на неделю.

«Чтобы сделать прогноз на завтра, мы показываем ей цифры за три предыдущих дня, и она выдает прогноз. Для послезавтра ей надо показать два предыдущих дня плюс прогноз на завтра. И так далее. В итоге на четвертый день она начинает строить прогноз на основе исключительно предыдущих прогнозов. И, разумеется, тут уже она просто пытается продолжить тренд. Никаким образом она не сможет понять, что что-то изменится. Для сети это просто цифры, значения которых она никаким образом не понимает»

Халиков подчеркивает, что для нейросети темпы роста только математическая модель. Основные данные, которые использовались до недавнего времени по заболеваемости были взяты с сайта стопкоронавирус.рф. Со временем ему стало интересно, повысить точность прогноза и тогда он стал добавлять дополнительные данные.

В сетях типа RNN используется насколько слоев нейронов, первый из которых обладает памятью, то есть видит не только текущее значение показателя, но и помнит его предыдущие значения. Сети показывают тестовую выборку данных за последнюю неделю и «обучающую» — все данные, которые были ранее. Сеть делает прогноз на «тестовую неделю», допуская некую ошибку. Ее запоминают и вновь запускают обучающую выборку. Это повторяется до тех пор, пока программисты не добиваются приемлемого уровня ошибки.

Создатель нейросети, впрочем, признает, что у него недостаточно данных, чтобы рассчитать наступление пика заболеваемости в РФ, т.к. слишком много непредсказуемых факторов (могли бы помочь данные про праздники, в реальном времени обновлять данные об увеличении мер самоизоляции, со всех регионов, собрать индексы самоизоляции, данные о погоде, тогда можно будет предсказать прогнозы с большей точностью, хотя, конечно, не объективно).

 

II Диагноз

В Австралии и в России одновременно разработали и испытывают нейросети, которые умеет находить следы коронавируса по рентгеновским снимкам и определять характерный для коронавируса вид кашля на звук через смартфон.

Австралийский стартап для этого усовершенствовал нейросеть DetectED-X, чтобы она могла диагностировать коронавирусную инфекцию (COVID-19) по рентгеновским снимкам легких. Изначально разработчики создавали DetectED-X для того, чтобы помочь врачам диагностировать рак молочной железы. 

Ранее похожую нейросеть разработали в Университете Иннополис (Казань). Она диагностирует заболевание с 80% точностью – на 13% лучше, чем человек.

Добиться этого удастся благодаря использованию нейросети для определения пневмонии, которая сейчас обучается с помощью изображений легких зараженных коронавирусом людей. Система уже может учитывать такие отличительные особенности этого заболевания, как локализация воспалительного процесса и синдром матового стекла.

Предстоящее внедрение системы будет предполагать подключение рентгенографических кабинетов отечественных лечебных заведений к облачному онлайн-сервису, который предназначен для оперативной обработки полученной от врачей информации. Это позволит уменьшить необходимое для исследования снимков время, увеличит точность диагностики и улучшит ее качество — особенно в тех регионах, где ощущается нехватка квалифицированного медперсонала и специализированных тест-систем.

Также использование сервиса может существенно снизить нагрузку на врачей-рентгенологов, что будет актуально при увеличении количества исследований на фоне дальнейшего развития пандемии.

В Москве по состоянию на 12 мая с помощью искусственного интеллекта обработано около 30 тысяч исследований для диагностики коронавируса. Отмечается, что технологию применяют в стационарах и амбулаторных КТ-центрах, где сосредоточен основной поток пациентов с подозрением на коронавирус. «Точность определения стадий развития пневмонии по снимкам КТ составила более 90 процентов», — говорится в сообщении. Врачи могут загрузить КТ-снимок на компьютер и увидеть предварительное заключение, которое сделает нейросеть.

 

Стоит сказать пару слов и про приложение, которое с помощью нейросети в приложении по звуку анализирует тип кашля — влажный, сухой, свистящий, звонкий, лающий или другие. Разработки такого рода есть в Университете Карнеги — Меллона, Квинслендском университете и в Сколково.

По аналогичным признакам ставят диагнозы и реальные педиатры, только сервис сможет учитывать редкие случаи и необычные тембры кашля.

Во время клинических тестирований точность постановки диагноза таких приложений составила 80-97%.

 

 

III Поиск лекарства

 

Что еще могут нейросети? Конечно же разобрать вирус на кирпичики и, используя гигантский массив накопленных данных о ходе течения заболевания и природе этих процессов, попытаться найти панацею.

Первый опыт такого рода был проведен еще в марте, когда российская система искусственного интеллекта Gero нашла среди уже существующих препаратов 10, которые теоретически могут подавлять размножение коронавируса нового типа в клетках человека. Разработчики считают, что препараты, которые нашла их нейросеть, нужно протестировать в лаборатории. В том случае, если их противовирусная активность подтвердится, нужно начинать клинические испытания. 

На практике гипотезы нейросетей проверяют уже довольно часто: например, в конце прошлого года итальянские исследователи обнаружили, что противораковый препарат ибрутиниб можно использовать для того, чтобы восстанавливать чувствительность организма к инсулину. Еще одна подобная молекула, нилотиниб, может стать лекарством от болезни Паркинсона, если клинические испытания подтвердят его эффективность.

Еще один любопытный эксперимент был проведен в MIT: ученые с помощью искусственного интеллекта создали симфонию из белков коронавируса. Точнее, речь не о вирусе целиком, а только о его «короне» — белковых шипиках (S-белках), которые цепляются к нашим клеткам и помогают вирусу проникать внутрь. Структура шипика — это цепочка белков, хитро переплетенных друг с другом. Для более глубокого анализа шипиков ученые превратили их в мелодию.

Обычно звук возникает при вибрации какого-то материала, например, гитарной струны. Музыка появляется, когда звуки организованы в иерархию паттернов. Ровно в этом ученым и помог ИИ из лаборатории MIT — IBM Watson — он превратил молекулярные вибрации в разные типы звуков и мелодий.

У белка есть несколько уровней организации. Первичная структура — это атомы и химические связи между ними. Вторичная — последовательность аминокислот, из которых, как из деталей лего, собирается любой белок. И третичная — то, как белковая молекула свернута в пространстве.

Всем элементам нейросеть присвоила свои музыкальные эквиваленты. К примеру, длительность и ритм мелодии отражают последовательности аминокислот. Итоговая композиция звучит как симфония, которая отражает геометрию коронавирусного S-белка (шипика).

Звук, как оказалось, — весьма элегантный способ представить информацию в белках.

Все дело в нашем мозге и том, как он воспринимает звуковые стимулы. Сложную и иерархическую структуру звука — громкость, тембр, мелодию, ритм, аккорды — мозг обрабатывает целиком и сразу.

Новый инструмент анализа белков может помочь понять, почему SARS-Cov-2 так опасен для людей и как на него могут повлиять даже небольшие мутации. Все это пригодится при разработке лекарств. Мы, например, можем искать белки, которые совпадают с мелодией и ритмом для антител, нейтрализующих коронавирусные шипики.

Звучит, кстати, как саундтрек к блокбастеру на азиатскую тему.

 

Подписываемся, следим @CyberAgency

Related Post