Штучний інтелект, який аналізує знімки легенів так само, як це робить радіолог
Щодня радіологи переглядають величезні обсяги КТ-знімків у пошуках того, що легко пропустити. Невеликий вузлик. Ледь помітна тінь. Те, що може бути ранньою стадією раку легенів, а може й зовсім нічим.
Рак легенів забирає життя більшої кількості людей у світі, ніж будь-який інший вид раку. Шанси на виживання значною мірою залежать від того, наскільки на ранній стадії виявлено захворювання. А навантаження у більшості відділень радіології залишає мало місця для тієї постійної подвійної уваги, якої насправді потребує виявлення невеликих підозрілих утворень.
У дослідженні, що щойно опубліковано в журналі «Scientific Reports», міжнародна група вчених, до складу якої входять науковці з Каунаського технологічного університету в Литві, створила систему штучного інтелекту, призначену для виконання завдання, з яким існуючі інструменти постійно стикаються з труднощами. Ця система одночасно аналізує скановане зображення двома способами.
Як насправді радіолог аналізує результати сканування
Коли радіолог аналізує результати КТ-сканування, він постійно змінює ракурс. Він збільшує масштаб ділянки, що його цікавить, щоб розглянути дрібні деталі. Потім відсувається, щоб зрозуміти, як ця ділянка пов’язана з легенею в цілому. Це не або одне, або інше. Це і те, і інше — і так повторюється протягом усього процесу аналізу.
Більшість систем штучного інтелекту, створених для виконання цього завдання, змушені були робити вибір. Вони або добре фіксують дрібні локальні деталі, або добре розуміють ширший структурний контекст. Одночасне досягнення обох цілей залишається давньою технічною проблемою.
Рішенням команди стала модель, яку вони назвали C-Swin. Вона поєднує дві різні архітектури нейронних мереж, що працюють разом. Конволюційна нейронна мережа обробляє дрібнозернисті локальні ознаки — тобто здійснює детальне розпізнавання візерунків, що дозволяє виявляти невеликі ураження та ледь помітні текстури. А архітектура Swin Transformer, яка використовує підхід із рухомим вікном для аналізу просторових ділянок зображення, обробляє більш широкий контекст. Ці два компоненти працюють паралельно, а їхні результати інтегруються, а не подаються послідовно.
Дослідник Інзамам Машуд Насір із KTU пояснює це просто. Одна частина моделі зосереджується на дрібних деталях, таких як крихітні плями чи текстури в легенях, тоді як інша — розглядає загальне зображення та дає змогу побачити ширшу картину. Це можна уявити так, ніби ви одночасно дивитеся на знімок через лупу та бачите його в повному розмірі.
Що показали результати
Модель було протестовано на наборі даних IQ-OTH/NCCD — загальнодоступній колекції результатів комп’ютерної томографії — з класифікацією знімків за трьома категоріями: нормальні, доброякісні та злоякісні.
Розрізнення доброякісних (неракових) вузлів та злоякісних пухлин є одним із найскладніших завдань у радіології; помилка в цьому питанні може призвести або до пропуску випадків раку, або до проведення непотрібних інвазивних біопсій.
Результати виявилися дуже високими. Модель C-Swin продемонструвала точність 96,26 %, прецизію 97,48 % та показник F1 на рівні 97,42 %. У порівнянні з існуючими методами підвищення точності становило від 2,31 % до 6,81 % залежно від конкретного порівняння.
У медицині ці показники є досить значними. Один процентний пункт у точності діагностики, розрахований на тисячі пацієнтів і сотні тисяч обстежень, призводить до реальних результатів.
Дослідники обережно ставляться до своїх тверджень. Модель була навчена на одному наборі даних. Її ще не перевіряли на пристроях різних виробників, за різними протоколами візуалізації або на різних групах пацієнтів. Насір відверто про це заявляє. У реальних умовах існує багато змінних, і перед клінічним застосуванням систему необхідно перевірити з урахуванням усіх цих змінних.
Це застереження не применшує значення отриманих результатів. Це чесний опис того, на якому етапі перебуває якісне дослідження, перш ніж воно перейде у стадію клінічного застосування. Наступними кроками є клінічна валідація, випробування в умовах лікарні та інтеграція в існуючі системи медичної візуалізації.
Чому правильний вибір часу має вирішальне значення
Рак легенів, як і раніше, найчастіше діагностують на пізніх стадіях, коли можливості лікування обмежені, а прогноз несприятливий. Розрив між тим, що є біологічно можливим, і тим, що насправді вчасно доходить до пацієнтів, є однією з головних проблем в онкології.
Інструменти штучного інтелекту, які дійсно зменшують кількість пропущених випадків і знижують рівень хибнопозитивних результатів, а отже, зменшують кількість пацієнтів, яких направляють на непотрібні процедури, та пов’язану з цим тривогу, дозволяють одночасно вирішити обидві сторони цієї проблеми.
Насір зазначає, що ця архітектура не обмежується лише раком легенів. Такий підхід може бути корисним для будь-якого завдання в галузі медичної візуалізації, яке вимагає як детального локального аналізу, так і більш широкого розуміння структури. Серед потенційних сфер застосування згадуються пухлини головного мозку, рак молочної залози та захворювання очей.
Загальна картина
Цього тижня генеральний директор Google DeepMind Деміс Хассабіс дав два важливі інтерв’ю: одне в подкасті «20VC» з Гаррі Стеббінгсом, а інше — з популяризаторкою науки Клео Абрам, у яких він розповів про своє бачення можливостей штучного інтелекту в медицині. Його основна думка полягала в тому, що найважливіше завдання штучного інтелекту — не у створенні споживчих продуктів, а в боротьбі з хворобами. Він висловив бажання, щоб процес розробки ліків, який зараз триває десятиліття, вдалося скоротити до кількох місяців. Про те, що ШІ досягне такого рівня, коли медицина перестане виглядати так, як сьогодні.
Стаття про C-Swin не має такого масштабу амбіцій. Це одна модель, один набір даних, один ретельно обмежений набір результатів, що чекає на клінічне підтвердження. Але саме так і долається відстань між тим, що є зараз, і тим, до чого ми прагнемо. Не одним стрибком, а завдяки таким дослідженням, як це: ретельно проведеним, відкрито опублікованим і на основі яких будує свою роботу наступна команда.
Біологія раку легенів стає дедалі краще зрозумілою. Відповідні методи лікування починають з’являтися. І тепер, поступово, розвивається й система діагностики.
Джерело: Yousafzai SN, Nasir IM, Mansour S та ін. Гібридний підхід на основі глибокого навчання, що поєднує CNN і трансформер для класифікації раку легенів за даними КТ-сканування. Scientific Reports. 2026. doi:10.1038/s41598-026-41161-7
Зображення: ілюстрація, створена за допомогою штучного інтелекту