
Kontrola jakości (QA) w radiologii ma pewien paradoksalny wymiar. Proces, który ma zapewnić wysoką jakość obrazów diagnostycznych, bardzo często staje się jednym z najbardziej czasochłonnych i subiektywnych zadań w całym dziale obrazowania. Wraz ze wzrostem liczby skanerów, rozbudową protokołów i coraz bardziej rygorystycznymi wymaganiami regulacyjnymi fizycy medyczni oraz technicy spędzają znaczną część dnia na wykonywaniu skanów fantomów, ocenianiu obrazów, wypełnianiu formularzy oraz analizowaniu trendów w rozproszonych arkuszach danych.
Jeżeli spojrzeć na kontrolę jakości z perspektywy danych, duża część pracy polega na wykrywaniu wzorców, ich pomiarze oraz porównywaniu wyników z określonymi tolerancjami.
Typowa lista testów QA opartych na fantomach obejmuje między innymi:
Kontrola jakości obrazów klinicznych wprowadza dodatkową warstwę oceny. Sprawdza się między innymi:
Przez dziesięciolecia większość tych czynności opierała się na ocenie wizualnej oraz ręcznych pomiarach wykonywanych przez człowieka. Wprowadza to zmienność między obserwatorami i utrudnia analizę długoterminowych trendów.
Z punktu widzenia uczenia maszynowego wiele z tych zadań sprowadza się do klasycznych problemów analizy obrazu: klasyfikacji, detekcji obiektów oraz regresji. Są to dokładnie te obszary, w których sieci neuronowe osiągają bardzo dobre wyniki. Dlatego w pełni lub częściowo zautomatyzowana kontrola jakości przestaje być koncepcją futurystyczną i staje się realnym celem.
Badania naukowe oraz pierwsze komercyjne rozwiązania pokazują, że konwolucyjne sieci neuronowe (CNN) potrafią oceniać obrazy fantomów w tomografii komputerowej, rezonansie magnetycznym i mammografii z poziomem zgodności porównywalnym z ekspertami. Analiza taka trwa często ułamki sekundy.
W mammografii modele AI uczono na przykład rozpoznawania włókien, mikrozwapnień oraz struktur masowych w fantomach mammograficznych, a następnie generowania standardowych wyników punktowych stosowanych w programach akredytacyjnych.
Bardziej zaawansowane systemy idą o krok dalej. W literaturze opisuje się uniwersalne pipeline’y analizy fantomów, które:
W środowisku połączonym z chmurą workflow może wyglądać bardzo prosto. Technik wykonuje zaplanowany skan fantomu, skaner przesyła obrazy w standardzie DICOM do systemu analitycznego, a silnik AI generuje raport QA w ciągu kilku minut. Zamiast ręcznie wprowadzać dane do arkuszy, fizyk medyczny otrzymuje gotowe wykresy trendów oraz automatyczne alerty, gdy parametry zbliżają się do granic tolerancji.
W praktyce oznacza to przejście od sporadycznych kontroli i ręcznej dokumentacji do ciągłego, cyfrowego monitorowania jakości.
Tomografia komputerowa była naturalnym pierwszym obszarem zastosowań AI w QA. Wynika to z jej centralnej roli w diagnostyce, kwestii dawki promieniowania oraz szybkiego rozwoju zaawansowanych metod rekonstrukcji obrazu.
AI może wspierać między innymi:
W praktyce może to oznaczać sytuację, w której protokół CT klatki piersiowej zostaje zmodyfikowany tak, aby zmniejszyć dawkę promieniowania o 20-30 procent. System AI monitorujący QA stale sprawdza wtedy, czy poziom szumu i wykrywalność niskiego kontrastu pozostają w dopuszczalnych granicach.
Takie połączenie zmiany protokołu i automatycznego nadzoru zwiększa bezpieczeństwo oraz ułatwia audyt jakości.
Mammografia znajduje się na styku bardzo dużej liczby badań, rygorystycznych wymogów regulacyjnych i niezwykle niskiej tolerancji na błędy diagnostyczne. W rezultacie kontrola jakości jest tutaj szczególnie wymagająca.
W wielu ośrodkach codzienne lub cotygodniowe testy fantomów wciąż ocenia się wizualnie. Analizuje się włókna, mikrozwapnienia i masy w oparciu o półilościowe skale punktowe.
AI szybko znalazła tu zastosowanie. Badania pokazują, że systemy oparte na CNN potrafią:
Równolegle rozwijane są systemy analizujące obrazy kliniczne. Mogą one klasyfikować mammogramy według kategorii jakości PGMI, wykrywać błędy pozycjonowania lub artefakty wymagające powtórzenia badania.
Dla techników oznacza to natychmiastową informację zwrotną przy konsoli aparatu, a dla całego działu obrazowania mniejszą liczbę powtórzeń i bardziej spójną jakość badań.
Dla producentów fantomów mammograficznych i oprogramowania QA połączenie zoptymalizowanego projektu fantomu z silnikiem AI zmienia tradycyjne testy zgodności w skalowalny program monitorowania jakości.
Rezonans magnetyczny stanowi szczególnie interesujące pole dla zastosowań AI w QA. Z jednej strony deep learning pomaga przyspieszyć akwizycję obrazów, redukować szum i ograniczać ilość środka kontrastowego. Z drugiej strony sama kontrola jakości w MRI jest bardziej złożona niż w CT czy mammografii.
MRI nie jest jedną techniką obrazowania, lecz rodziną wielu sekwencji. Obejmuje między innymi obrazy T1, T2, FLAIR, dyfuzję, perfuzję czy mapowanie ilościowe. Każdy producent systemów implementuje je nieco inaczej, a lokalne protokoły dodatkowo wprowadzają zmienność.
Modele AI trenowane na ograniczonych zbiorach danych mogą mieć trudności z generalizacją w innych ośrodkach, przy innych cewkach czy parametrach akwizycji. Jest to klasyczny problem tzw. domain shift.
Artefakty w MRI są bardzo zróżnicowane. Mogą obejmować ruch pacjenta, ghosting, efekty podatności magnetycznej, problemy z saturacją tłuszczu czy zjawisko Gibbs ringing.
Modele deep learning potrafią wykrywać artefakty w określonych kontekstach, jednak nie wszystkie typy są rozpoznawane z jednakową skutecznością. Zdarza się też, że system AI oznacza drobne artefakty jako problem, mimo że klinicznie obraz jest w pełni akceptowalny.
Wysokiej jakości etykiety treningowe w MRI są kosztowne do uzyskania. Często wymagają oceny wielu ekspertów, a nawet wtedy mogą pozostawać częściowo subiektywne.
Dodatkowo niektóre modele mogą nieświadomie uczyć się zależności pomiędzy zawartością kliniczną obrazu a jego jakością, co prowadzi do niezamierzonych uprzedzeń w systemie.
Aby systemy AI w MRI mogły zostać szeroko wdrożone, radiolodzy i fizycy muszą rozumieć, dlaczego dany obraz został oceniony jako niskiej jakości. Same oceny punktowe bez wizualnego uzasadnienia są trudne do pogodzenia z istniejącymi wytycznymi QA.
Dlatego kluczowe pozostają:
Gdy obrazy fantomów i badań klinicznych są automatycznie analizowane i przechowywane w centralnej bazie danych, charakter kontroli jakości ulega zmianie.
Zamiast pojedynczych wyników testów powstają długie szeregi czasowe metryk takich jak:
Na podstawie tych danych można wykrywać subtelne zmiany w pracy systemów obrazowania, na przykład stopniowy spadek SNR lub rosnące zniekształcenia geometryczne. W rezultacie możliwe staje się przewidywanie problemów i planowanie serwisu zanim wpłyną one na diagnostykę.
Mimo ogromnego postępu AI w kontroli jakości CT, MRI i mammografii celem nie jest zastąpienie fizyków medycznych. Najbardziej efektywny model polega na współpracy.
AI może przejąć zadania powtarzalne i czasochłonne:
Eksperci natomiast koncentrują się na interpretacji wyników, optymalizacji protokołów oraz podejmowaniu decyzji klinicznych.
Aby taki model działał, systemy AI muszą spełniać kilka kluczowych warunków:
Jeśli te warunki zostaną spełnione, AI może rzeczywiście stać się niewidzialnym fizykiem medycznym. Systemem, który nigdy nie męczy się analizą obrazów fantomów, liczeniem włókien czy śledzeniem trendów jakości. Dzięki temu specjaliści mogą skupić się na tym, co najważniejsze: rozwijaniu diagnostyki obrazowej i poprawie bezpieczeństwa pacjentów.
Źródła:
https://pmc.ncbi.nlm.nih.gov/articles/PMC10039170/