VinDr

블로그

Nov 18, 2023

VinDr

과학 데이터 9권,

과학 데이터 9권, 기사 번호: 429(2022) 이 기사 인용

8653 액세스

23 인용

2 알트메트릭

측정항목 세부정보

대부분의 기존 흉부 X선 데이터 세트에는 방사선 사진에서 위치를 지정하지 않고 결과 목록의 레이블이 포함되어 있습니다. 이로 인해 흉부 이상을 감지하고 위치를 파악하기 위한 기계 학습 알고리즘의 개발이 제한됩니다. 이 연구에서는 베트남의 두 주요 병원에서 후향적으로 수집된 100,000개 이상의 흉부 X-ray 스캔 데이터 세트를 설명합니다. 이 원시 데이터 중에서 우리는 총 17명의 경험이 풍부한 방사선 전문의가 이상을 둘러싼 직사각형의 22개 로컬 라벨과 의심되는 질병에 대한 6개의 글로벌 라벨을 수동으로 추가한 18,000개의 이미지를 공개합니다. 공개된 데이터 세트는 훈련 세트 15,000개와 테스트 세트 3,000개로 나누어져 있습니다. 훈련 세트의 각 스캔에는 3명의 방사선 전문의가 독립적으로 라벨을 지정했으며, 테스트 세트의 각 스캔에는 5명의 방사선 전문의가 합의하여 라벨을 지정했습니다. 우리는 이러한 주석 절차를 용이하게 하기 위해 DICOM 이미지용 라벨링 플랫폼을 설계하고 구축했습니다. 모든 이미지는 훈련 세트와 테스트 세트의 레이블과 함께 DICOM 형식으로 공개적으로 제공됩니다.

측정

흉부 엑스레이 검사로 인한 질병 및 이상 소견

기술 유형

AI는 질병 및 이상 소견을 탐지하는 데 사용됩니다.

샘플 특성 - 위치

베트남

흉부 방사선 사진(흉부 X선 또는 CXR이라고도 함)을 위한 컴퓨터 지원 진단(CAD) 시스템은 최근 대규모 레이블이 지정된 데이터 세트의 가용성과 고성능 지도 학습 알고리즘의 발전 덕분에 큰 성공을 거두었습니다1,2, 3,4,5. 심층 합성곱 신경망(CNN)6을 활용하는 이러한 시스템은 일반적인 폐 질환 및 관련 결과를 분류하는 데 있어서 전문가 수준의 성능에 도달할 수 있습니다. CNN 훈련은 주석이 달린 이미지의 고품질 데이터 세트에 크게 의존합니다. 그러나 다음과 같은 몇 가지 제약으로 인해 이러한 데이터 세트를 구축하는 데는 비용과 시간이 많이 소요됩니다. (1) 의료 데이터는 병원이나 의료 센터에서 검색하기 어렵습니다. (2) 의사가 수동으로 주석을 추가하는 데 비용이 많이 듭니다. (3) 의료 이미지의 주석은 인간의 편견을 극복하기 위해 여러 전문 독자의 합의가 필요합니다7. (4) 대규모 의료 데이터 세트를 관리하고 주석을 달기 위한 효율적인 라벨링 프레임워크가 부족합니다.

CXR의 주목할만한 공개 데이터 세트에는 ChestX-ray8, ChestX-ray148, Padchest9, CheXpert2 및 MIMIC-CXR10이 포함됩니다. ChestX-ray8의 확장 버전인 ChestX-ray14는 미국 국립보건원(NIH)에서 출시되었으며, 30,000명이 넘는 환자의 112,000개 이상의 CXR 스캔이 포함되어 있습니다. 수동으로 주석을 달지 않으면 이 데이터 세트는 라벨 품질과 관련된 중요한 문제를 야기합니다11. Padchest는 160,000개 이상의 CXR 이미지로 구성되어 있으며, 그 중 27%는 방사선 전문의가 직접 라벨링한 174개의 서로 다른 결과와 19개의 진단입니다. 나머지 데이터 세트에는 NLP(자연어 처리) 도구를 사용하여 레이블이 지정되었습니다. 최근 출시된 CheXpert는 65,240명의 환자에 대한 200,000개 이상의 CXR을 제공하며, 의료 보고서에서 키워드를 추출하는 자동화된 규칙 기반 라벨러를 사용하여 14개의 관찰 항목에 대해 라벨이 지정되었습니다. 동일한 라벨링 메커니즘을 채택한 MIMIC-CXR에는 자유 텍스트 방사선 보고서와 함께 DICOM 형식의 377,110개 이미지가 포함되어 있습니다. 표 1은 JSRT12, Indiana13, MC14 및 SH14를 포함하여 적당한 크기의 다른 데이터 세트와 함께 앞서 언급한 데이터 세트의 요약을 제공합니다.

대부분의 기존 CXR 데이터 세트는 키워드 매칭(예: CheXpert2 및 NIH 라벨러8)을 사용하거나 NLP 모델을 사용하여 자유 텍스트 방사선 보고서에서 질병 라벨을 추출하는 자동화된 규칙 기반 라벨러에 의존합니다. 이러한 도구는 대규모로 라벨을 생성할 수 있지만 동시에 높은 비율의 불일치, 불확실성 및 오류를 발생시킵니다11,15. 이러한 시끄러운 레이블은 실제 환경에서 평가할 때 보고된 성능에서 딥 러닝 기반 알고리즘의 편차로 이어질 수 있습니다16. 또한 보고서 기반 접근 방식은 위치를 식별하지 않고 사전 정의된 결과 및 진단 목록에 있는 하나 이상의 레이블과 CXR 이미지를 연결하는 것뿐입니다. 주석이 달린 이상 위치를 포함하는 몇 가지 CXR 데이터 세트가 있지만 딥 러닝 모델을 훈련하기에는 너무 작거나(JSRT) 충분히 상세하지 않습니다(PadChest). CXR의 해석은 이미지 수준 분류에 관한 것이 아닙니다. 방사선 전문의의 관점에서는 영상의 이상 징후를 국부적으로 파악하는 것이 더욱 중요합니다. 이는 임상 실습에서 CXR을 위한 CAD 시스템의 적용이 여전히 매우 제한적인 이유를 부분적으로 설명합니다.