디지털 병리 저장공간 문제 해결하는 인공지능 압축기술 개발
- 조회수 93
- 작성자 이명훈
- 작성일 2026.01.22
디지털 병리 저장공간 문제 해결하는
인공지능 압축기술 개발
- 서울성모병원ㆍ고려대 안암병원,
데이터 관리비용 절감하는 AI 기술 제시 -
- 진단 중요도 낮은 영역 고도 압축,
품질 유지하면서도 이미지 용량 최대 90% 절감 -
- 31개 암종, 13개 병리 AI 과제에서
기존 방식 뛰어넘는 성능 확인 -
- 국제 학술지 Nature Communications 게재 -

[사진 : (좌측부터) 서울성모병원 병리과 이성학 교수, 고려대학교 안암병원 병리과 안상정 교수]
가톨릭대학교 서울성모병원과 고려대학교 안암병원을 중심으로 하는 다기관 국제 연구팀이 최근 디지털 병리 이미지의 진단 정확도를 유지하면서도 데이터 용량을 현저히 줄일 수 있는 새로운 적응형(Adaptive) 압축 프레임워크를 개발했다.
서울성모병원 병리과 이성학 교수ㆍ고려대학교 안암병원 병리과 안상정 교수 공동 연구팀 (제1저자 펜실베니아대학교 생물통계학과 이종현 박사)이 개발하여 ‘아다슬라이드(AdaSlide)’라고 명명한 해당 기술은 최근 디지털 병리 진단이 확대됨에 따라 동반되는 만성적인 저장공간 문제 해결에 일조할 것이라는 평가다.
최근 이미지 스캔 기반의 디지털 병리 진단 시스템이 임상 전반에 확대되면서, 발생한 데이터의 보관과 처리가 중요한 화두로 떠오르고 있다. 기존에는 슬라이드를 실물로 보관하기 위한 공간과 환경 문제가 이슈였다면, 이제는 병리 진단을 위해 요구되는 고해상도 이미지 데이터 관리가 병원의 큰 부담으로 떠오르고 있다.
디지털 병리 시스템을 도입한 병원에서는 환자 한 명당 약 3~4기가바이트(GB), 매년 수백 테라바이트(TB)의 데이터를 보관하기 위해 막대한 저장공간이 필요한 것으로 알려졌다. 또한 단순히 보관만 하는 것이 아니라 때로는 보관된 이미지를 재판독하는 경우도 있는 만큼, 판독 품질에 영향을 최소화하면서도 효율적으로 용량을 감소시키는 압축 기술에 대한 필요성이 제기되어 왔다.
그러나 이제까지 연구되었던 다양한 압축 방식들은 슬라이드를 전체를 일괄적으로 처리하는 과정에서 필수적인 세포 정보를 훼손하거나, 혹은 불필요한 배경 데이터까지 고화질로 저장하는 비효율성이 있었다. 연구팀은 이를 해결하고자 전체 슬라이드를 압축 처리하는 것이 아니라, 인공지능을 활용하여 한 슬라이드 내에서도 단위 영역별로 다르게 처리하는 하이브리드 압축 플랫폼 ‘아다슬라이드(AdaSlide)’를 개발했다.
예를 들어 암세포가 밀집해 정밀한 진단이 필요한 영역은 원본 화질을 보존하고, 지방 조직이나 빈 배경처럼 진단적 중요도가 낮은 영역은 고배율로 압축하는 방식으로 학습된 인공지능(AI)으로 이미지를 자동 처리하는 방식이다. 병리 이미지 내에서 진단적 가치가 높은 영역과 그렇지 않은 영역 간의 ‘정보 불균형(Information Disequilibrium)’을 적절히 처리한다면 중요한 진단 부위의 이미지 품질저하를 최소화하면서도 용량 효율화를 이룰 수 있다는 것이다.
31개 암종을 포함한 ‘판캔서(PanCancer)’ 데이터셋의 약 180만 개 패널 이미지를 활용해 학습된 ‘압축 결정 에이전트(Compression Decision Agent)’는 이미지 내의 각 영역을 분석해 압축 여부를 스스로 판단하며, 압축된 이미지는 이후 ‘기초 이미지 복원기’를 통해 분석 가능한 수준으로 복원이 가능하다.
13개의 다양한 병리 진단 과제(분류 및 분할)를 통해 성능을 검증한 결과, 해당 기술은 원본 이미지 대비 저장 용량을 65%에서 최대 90%까지 줄이면서도 진단 성능은 원본과 동등한 수준을 유지하는 것으로 나타났다. 특히 기존의 균일 압축 방식이 세포 경계를 불분명하게 만들어 분석을 어렵게 했던 것과 달리, 연구팀의 플랫폼은 정보 손실을 최소화하여 정밀한 분석을 가능케 했다.
이를 검증하기 위해 병리 전문의 5명이 참여한 시각적 튜링 테스트(Visual Turing Test)에서는 원본 이미지와 아다슬라이드로 복원된 이미지를 구별해낸 비율은 56%에 그쳤을 뿐 아니라 통계적으로 유의하지 않았다. 이는 숙련된 전문의도 육안으로 차이를 느끼기 어려운 수준의 품질을 시사한 결과다.
또한 인공지능 비교판독 시뮬레이션 결과, 핵 분할 데이터셋 (SNOW, PanNuke), 분류작업 (NCT-CRC, MHIST, LI, SICAPv2) 등에서 아다슬라이드 결과물이 원본 대비 향상된 분석 성능을 제공하기도 했다. 이는 이미지 처리 과정에서 발생한 정보 이득 (Information Benefit)에 따른 것으로, 이미지 복원 과정에서 불필요한 노이즈가 감소하고 색상이 정규화되며 중요한 정보 위주로 데이터가 보존된 결과라는 설명이다.
무엇보다 이번 연구는 단순한 용량 압축을 넘어, 인공지능이 진단에 필요한 정보를 스스로 선별하고 보존한다는 점에서 의미가 있는 것으로 평가된다. 연구팀은 아다슬라이드를 개발하며, 병리 전문의가 실제 진단 시 집중하는 영역과 유사한 패턴으로 데이터를 처리하도록 구현했다. 중요도가 떨어지는 배경 영역은 과감히 압축하고, 진단 핵심 영역은 보존하는 방식으로 진단 품질 훼손을 최소화하면서도 한정된 스토리지 자원으로도 더 많은 환자의 데이터를 장기간 보관할 수 있게 되어, 향후 AI 의료 빅데이터 구축의 효율성을 크게 높일 것으로 기대된다.
이번 연구를 주도한 서울성모병원 이성학 교수는 “진단적으로 중요한 정보가 무엇인지를 인공지능이 스스로 판단하고 선택적으로 보존하는 기술은 의료 데이터의 ‘의미 기반 관리’라는 새로운 방향성을 제시하는 접근”이라며, “향후 대규모 병리 AI 학습 데이터 구축과 국제 공동연구 환경에서도 실질적인 효율성을 제공할 수 있을 것”이라 밝혔다.
공동 교신저자인 고려대학교 의과대학 안상정 교수는 "디지털 병리의 확산에 있어 가장 큰 걸림돌 중 하나인 데이터 저장 비용 문제를 진단 정확도 저하 없이 해결할 수 있는 기술적 토대를 마련했다"며, "향후 이 기술이 병원의 의료 데이터 관리 효율을 높이는데 일조하겠다"고 밝혔다.
이번 연구 성과는 저명한 국제 학술지 ‘네이처 커뮤니케이션즈(Nature Communications, IF 15.7)’에 게재되었다.

※ 그림설명 : AdaSlide 연구 개요와 프로세스, 성능 결과
A> 훈련시키는 데 사용된 31개 암종 PanCancer 데이터셋 구성
B> 이미지 처리과정 : 타일링 – CDA – 인코딩 – 디코딩 - 재구성
C> 13개의 병리 진단 작업에서 원본 대비 성능을 시각화한 스파이더 웹 차트
- 다양한 압축방식의 품질이 비교되어 있음 (바깥쪽으로 갈수록 높은 성능)
- 파란색 선이 원본 (Baseline), 갈색 선이 Adaslide
- Adaslide는 전 영역에서 고르게 높은 품질을 보였으며, 일부 영역에서는
원본보다 우수한 모습을 보였다.

