뇌출혈은 생명에 위협을 가하는 심각한 뇌 혈관 질환으로, 빠른 진단과 치료가 필요합니다. CT 영상은 뇌출혈 진단에 가장 효과적으로 사용되는 검사 중 하나이지만, 이를 판독하는 것은 숙련된 전문가에게 맡겨져야 합니다. 그러나 숙련된 전문가가 부족한 지역이나 시간적 여유가 없는 상황에서는 진단이 지연될 수 있습니다.
본논문은 4종류의 CNN (convolutional neural network)으로 사전 학습된 분류기와 자연어처리 분야에서널리 사용되고있는 모델 중하나인 GPT-2 언어모델의 조합을사용하여 연속 뇌출혈 컴퓨터 단층 촬영(Computed Tomography, CT) 영상에 대한 캡션을생성하는 방식을제안합니다.
우리는 CNN에 기반한 분류기를 사전 학습시키고, 분류기의 결과 시퀀스를 GPT-2 언어모델에 입력하여 캡션을학습시켰습니다. 첫째, 대량의공개된 이미지로사전 학습된CNN을 사용하여연속적인 뇌출혈CT 이미지에서 개별 이미지를 각각 분석하고이미지에 ICH가존재하는지 식별합니다. 둘째, 개별CT 이미지들은 분류 결과로 치환되고 이들은하나의 시퀀스가되어 특징벡터로언어 모델의입력으로 사용됩니다. 이러한 시퀀스를GPT-2 언어 모델의입력으로 사용하여식별된 영역에대한 설명 캡션을 생성합니다.
제안된 방법은 뇌 CT 이미지를 분석하고캡셔닝 하는데있어서 유용한방법을 제시하며, 뇌출혈 진단 및치료에 기여할수 있습니다. 우리의 연구는뇌출혈 진단 및치료에 매우 중요한 역할을 할 수있습니다. 또한, 이 방법은 다른 의료 영상분석 분야에도적용될 수 있습니다.