제한된 레이블 데이터 환경에서 적응형 가중치 전략을 적용한 준지도학습 기반 반월상 연골 분할

정, 희영; 왕, 준호; 홍, 헬렌

doi:10.15701/kcgs.2025.31.2.27

J Korea Comput Graph Soc 2025; 31(2):27-36

pISSN: 1975-7883, eISSN: 2383-529X

DOI: https://doi.org/10.15701/kcgs.2025.31.2.27

Article

제한된 레이블 데이터 환경에서 적응형 가중치 전략을 적용한 준지도학습 기반 반월상 연골 분할

정희영¹

, 왕준호²

, 홍헬렌¹^,^*

Semi-supervised meniscus segmentation with adaptive weighting strategies in a limited labeled data environment

Heeyoung Jeong¹

, Joon ho Wang²

, Helen Hong¹^,^*

Author Information & Copyright ▼

¹서울여자대학교 소프트웨어융합학과

²성균관대학교 의과대학 삼성서울병원 정형외과

¹Department of Software Convergence, Seoul Women’s University

²Department of Orthopedic Surgery, Samsung Medical Center, Sungkyunkwan University School of Medicine

^*corresponding author: Helen Hong / Seoul Women’s University (hlhong@swu.ac.kr)

© Copyright 2025 Korea Computer Graphics Society. This is an Open-Access article distributed under the terms of the Creative Commons Attribution Non-Commercial License (http://creativecommons.org/licenses/by-nc/4.0/) which permits unrestricted non-commercial use, distribution, and reproduction in any medium, provided the original work is properly cited.

Received: Mar 19, 2025; Revised: Apr 24, 2025; Revised: May 08, 2025; Accepted: May 14, 2025

Published Online: Jun 01, 2025

요약

반월상 연골 이식편 이식 수술은 손상된 반월상 연골을 치료하는 주요 방법으로, 이식편의 적절한 크기와 형태를 결정하기 위해 정확한 반월상 연골 분할이 필수적이다. 그러나 반월상 연골은 주변 구조물과 밝기값이 유사하고, 형태와 두께가 다양하게 나타나기 때문에 분할이 어렵다. 본 논문에서는 무릎 MR 영상에서 모델의 일반화 성능을 향상시키고, 반월상 연골의 다양한 형태와 두께를 효과적으로 고려하여 분할 성능을 개선하는 것을 목표로 한다. 이를 위해 적은 레이블 데이터로도 효과적인 학습이 가능한 준지도학습 모델을 제안한다. 실험 결과, 제안된 방법은 재현율 93.28%, F1-score 90.02%, 균형 정확도 96.42%를 보이며 가장 높은 성능을 달성하였고, 과소분할 문제를 개선하여 83개의 레이블 데이터를 사용한 지도학습 모델보다 0.8%p 높은 재현율을 나타내었다.

Abstract

Meniscus allograft transplantation is a primary method for treating damaged meniscus, and accurate segmentation is essential to determine the appropriate size and shape of the graft. However, meniscus segmentation is challenging due to the similar intensity between the meniscus and surrounding structures, as well as the variability in its shape and thickness. In this paper, we aim to enhance the generalization performance of models on knee MR images and improve segmentation accuracy by effectively accounting for the diverse shapes and thicknesses of the meniscus. To this end, we propose a semi-supervised learning model capable of effective training even with limited labeled data. Experimental results demonstrate that the proposed method achieved the highest performance with a recall of 93.28%, an F1-score of 90.02%, and a balanced accuracy of 96.42%, and by addressing the under-segmentation issue. it achieved a recall that is 0.8%p higher than that of the supervised learning model trained with 83 labeled data.

Keywords: 반월상 연골 분할; MR 영상; 준지도학습; 평균-교사 모델; 가중치 전략

Keywords: Meniscus Segmentation; MR Image; Semi-Supervised Learning; Mean Teacher Model; Weight Strategy

1. 서론

반월상 연골은 무릎 안쪽에 위치한 내측 반월상 연골과 무릎 바깥쪽에 위치한 외측 반월상 연골로 구성된 얇은 반달 모양의 구조물로, 무릎의 하중을 분산시키고 경골과 대퇴골 사이의 마찰을 줄이는 역할을 한다[1]. 무릎 질환으로 인해 반월상 연골이 마모되거나 파열된 경우, 이를 치료하기 위해 반월상 연골 이식편 이식 수술이 수행된다. 이식편의 크기와 형태가 환자의 본래 반월상 연골과 유사할수록 수술 후 기능 회복에 큰 영향을 미치므로, 일반적으로 환자 반대쪽 무릎을 미러링하여 가장 적합한 크기와 형태의 이식편을 제작한다[2]. 따라서 이식편을 정확하게 생성하기 위해서는 반월상 연골의 길이, 너비, 높이 등의 구조적 정보를 정확히 파악하는 분할 과정이 필수적이다. 그러나 그림 1과 같이 무릎 MR 영상에서 반월상 연골은 주변 구조물인 십자인대와 밝기값이 유사하고, 내부 밝기값이 불균일하여 오분할이 발생하기 쉽다. 또한, 반월상 연골은 두께가 얇고, 한 환자의 영상 내에서도 전방과 후방 슬라이스에서 형태가 다양하게 나타나므로 분할에 어려움이 있다.

Figure 1. Characteristic of meniscus in knee MR images: (a) Similar intensity of the meniscus and collateral ligaments, (b) Inhomogeneous intensity of meniscus in knee MR images, and (c) Diverse shape and thin meniscus in the front and back slices of a single patient's coronal view.

Download Original Figure

무릎 MR 영상에서 반월상 연골 분할에 대한 연구는 일반적으로 지도학습을 사용하여 수행된다. Byra 등[3]은 작은 크기를 가지는 반월상 연골을 더 잘 분할하기 위해 중요한 영역에 집중할 수 있도록 하는 Attention U-Net을 제안하였으며, 데이터가 제한적인 환경에서도 높은 성능을 유지할 수 있도록 전이 학습을 추가로 활용하였다. Ölmez 등[4]은 두 개의 다른 무릎 MR 시퀀스 영상에서 반월상 연골의 대략적인 위치를 파악하기 위해 R-CNN을 통해 반월상 연골을 위치화 하여 분할 한 뒤, 이진화 및 형태학적 연산(morphological operation)을 적용해 최종적으로 반월상 연골을 분할하였다. Li 등[5]은 다양한 크기의 반월상 연골을 고려하기 위해 다양한 스케일을 추출하는 Residual Network-Feature Pyramid Network(ResNet-FPN)을 백본으로 하는 3D-mask-RCNN을 제안하였다. Luo 등[6]은 반월상 연골이 가지는 모양 및 크기의 가변성 문제를 보완하기 위해 다양한 스케일을 고려하는 스킵 연결을 적용한 Res2Net과 Swin Transformer를 융합한 모델을 제안하였다. 이와 같은 지도학습을 통한 반월상 연골 분할은 레이블 데이터가 부족한 경우 성능 저하가 발생할 수 있으므로 충분한 레이블 데이터를 확보하는 것이 중요하다. 그러나 의료 영상에서 고품질의 레이블 데이터를 확보하기 위해서는 많은 시간과 비용이 소요되어 레이블 데이터 수집에 한계가 있다[7-11]. 이러한 레이블 데이터 부족 문제를 완화하기 위해 소량의 레이블이 있는 데이터와 대량의 레이블이 없는 데이터를 함께 활용하여 효과적으로 훈련하는 준지도학습(semi-supervised learning) 방법이 제안된다. 준지도학습은 훈련 시 대량의 레이블이 없는 데이터를 활용함으로써 데이터의 전반적인 분포와 특징을 파악하고, 모델이 더 풍부한 정보를 학습할 수 있도록 해 네트워크의 일반화 성능을 향상시킨다[12].

따라서 본 논문에서는 무릎 MR 영상에서 다양한 형태와 두께를 가지는 반월상 연골에 대한 분할 성능 개선을 목표로, 레이블 데이터가 부족한 환경에서도 안정적인 분할 성능을 보이기 위해서 레이블이 없는 데이터를 함께 활용하는 준지도학습 모델을 제안한다. 제안된 모델은 잘못 예측할 가능성이 높은 영역을 나타내는 모호성 맵(ambiguity map)을 활용해 학생 모델과 교사 모델 간의 예측 일관성을 강화한다. 또한, 다양한 형태와 얇은 구조로 인해 분할 성능이 저하되는 반월상 연골을 고려한 분할 난이도 가중치(segmentation difficulty weight)와 무릎 MR 영상에서 배경에 비해 적은 영역을 차지하는 반월상 연골로 인해 발생하는 클래스 불균형 문제를 해결하기 위한 두께 가중치(thickness-sensitive weight)를 적용한 평균-교사 네트워크를 설계하였다. 마지막으로 레이블이 있는 데이터와 레이블이 없는 데이터의 개수를 조정하며 실험을 수행해, 준지도학습에서 레이블이 있는 데이터와 레이블이 없는 데이터의 비율이 성능에 미치는 영향을 분석한다.

2. 제안 방법

2.1 데이터 전처리

반월상 연골의 얇은 두께로 인해 전체 무릎 MR 영상에서 반월상 연골을 분할 할 시, 배경 영역과 반월상 연골 영역 간의 크기 차이로 인한 클래스 불균형이 발생하여 과소분할 문제가 나타난다. 따라서 반월상 연골의 지역적 문맥 정보에 집중하여 분할하기 위해, 반월상 연골의 해부학적 정보를 반영하여 ROI(Region Of Interest, ROI)를 설정하였다[13]. 전후방(front, back) 범위는 대퇴골과 경골이 동시에 나타나는 첫 번째 단면을 기준으로 정하고, 좌우(left, right) 범위는 대퇴골이 처음 나타나는 위치를 기준으로 설정한다. 또한, 상하(top, bottom) 범위는 대퇴골과 경골이 맞닿는 중심선을 기준으로 반월상 연골이 포함될 수 있도록 조정하여 최종 ROI를 결정한다. 이후, 해당 ROI를 기준으로 영상을 잘라 291x80 크기로 조정한다.

무릎 MR 영상에서 반월상 연골과 주변 구조물 간의 밝기값이 유사한 경우, 주변 구조물을 반월상 연골로 판단하여 오분할이 발생할 수 있다. 따라서 영상의 밝기값을 조정하여 반월상 연골과 주변 구조물이 잘 구별될 수 있도록 식 (1)과 같이 Z-Score 정규화를 통해 밝기값 정규화를 수행한다[14].

z = x − μ σ

(1)

이 때, z는 정규화된 밝기값이고 x는 원본영상의 밝기값이고 μ은 밝기값의 평균이고 σ은 밝기값의 표준편차이다.

2.2 준지도학습 기반의 반월상 연골 분할 네트워크

본 제안 방법은 그림 2와 같이 평균-교사 모델[15]로 구성된 네트워크이다. 레이블이 있는 데이터와 레이블이 없는 데이터를 함께 평균-교사 모델의 입력 영상으로 사용하고, 학생 모델의 예측값에서 오류가 발생할 가능성이 높은 영역을 나타내는 모호성 맵과 분할 성능과 반월상 연골의 픽셀 개수에 따라 계산되는 가중치를 고려하여 모델을 학습시켜 반월상 연골을 분할한다.

Figure 2. Overview of the proposed semi-supervised learning based Mean Teacher model.

Download Original Figure

평균-교사 모델은 학생 모델과 교사 모델로 구성되며 레이블이 있는 데이터와 레이블이 없는 데이터를 함께 사용하여 준지도학습을 수행한다. 학생 모델의 파라미터는 손실함수를 계산하여 갱신되며, 교사 모델의 파라미터는 식 (2)와 같이 학생 모델의 파라미터와 이전 단계의 교사 모델 파라미터 간의 지수이동평균(Exponential Moving Average, EMA) 방식으로 갱신된다. 이러한 EMA 업데이트 방식은 학습 과정에서 발생하는 변동을 줄여 보다 일관된 예측을 제공할 수 있도록 하며, 학생 모델은 이러한 교사 모델의 안정적인 예측을 사용해 학습을 진행한다.

θ t ← α θ t − 1 + (1 − α) θ s

(2)

이 때, θ_t는 교사 모델의 파라미터이고 θ_t-1는 이전 단계의 교사 모델 파라미터이고 θ_s는 학생 모델의 파라미터이고 α는 이동평균을 조절하는 하이퍼파라미터 값이고 0.99로 산정하였다.

학생과 교사 모델 모두 백본 네크워크로 2D U-Net을 사용한다. 2D U-Net[16]은 U자 구조를 가지며, 5개의 레이어로 이루어진 인코더(encoder)와 디코더(decoder)로 구성되어 있다. 인코더에서는 3x3 컨볼루션 연산, 배치 정규화와 ReLU 활성화 함수를 적용하고, 2x2 맥스풀링과 드롭아웃을 통해 특징맵을 생성한다. 디코더에서는 2x2 업샘플링을 수행하고, 동일 레이어의 인코더 특징맵을 스킵 연결한 뒤 3x3 컨볼루션 연산, 배치 정규화, ReLU 활성화를 반복 적용한다. 디코더의 마지막 레이어에서는 시그모이드 활성화 함수를 사용하는 1x1 컨볼루션을 적용하여 예측 확률맵을 생성한다. 네트워크의 일반화 성능 향상을 위해 인코더에서 드롭아웃을 수행되며, 교사 모델의 입력 영상에 랜덤 노이즈를 추가하여 추가적인 섭동(perturbation)을 가한다.

2.3 반월상 연골 분할을 위한 가중치 전략

제안하는 가중치 전략을 통해 모델의 일반화 성능을 강화하고, 학습 시 반월상 연골의 다양한 형태와 두께를 반영하여 분할 성능을 개선하고자 한다.

딥러닝에서 신뢰할 수 있는 영역이란 예측이 안정적이고 엔트로피(entropy) 값이 낮아 불확실성이 적은 영역을 나타내고, 모호한 영역은 예측이 불안정하고 엔트로피 값이 높아 불확실성이 높은 영역을 말한다. 모델이 신뢰할 수 있는 영역보다 오류가 발생하기 쉬운 모호한 영역에 집중하여 학습하면 더 많은 정보적 단서를 얻을 수 있어 모델의 성능 향상에 더 효과적일 수 있다[17]. 먼저 식 (3)과 같이 학생 모델의 예측값 p_s로부터 엔트로피 E_n을 계산하고, 이후 식 (4)와 같이 계산된 엔트로피 값이 임계값 H를 초과하는 영역(E_n > H)을 모호성 맵 A ̃ 으로 정의한다. 학습 과정에서 이 모호성 맵을 활용하여 학생 모델과 교사 모델 간의 예측 일관성을 강화함으로써, 네트워크의 일반화 성능을 향상 시킬 수 있다.

E n = − ∑ p s log (p s)

(3)

A ˜ = ∥ [E n 〉 H]

(4)

이 때, ∥(⋅)는 지시 함수이고, H는 0.6으로 설정한다[17].

반월상 연골의 형태가 다양하여 분할 성능이 낮게 나타나는 문제를 해결하기 위해 분할 난이도 가중치 w^s를 적용하여 모델이 쉬운 사례보다 분할 성능이 좋지 않은 어려운 사례에 집중하도록 한다. 분할 난이도 가중치는 식 (5)와 같이 이전 반복과 현재 반복 사이의 다이스 점수 변화가 크고 다이스 점수가 낮은 어려운 사례에 더 높은 가중치를 할당한다. 이 방법은 어려운 사례에 더 많은 주의를 기울이고 쉬운 사례에 더 낮은 가중치를 할당한다.

w s = (1 − λ t) • (λ t − 1 λ t) α

(5)

이 때, λ_t는 t번째 반복 단계(iteration)에서의 다이스 점수(dice score)이고, α는 1/2로 설정한다.

배경에 비해 비교적 작은 영역을 차지하는 얇은 구조의 반월상 연골은 클래스 불균형으로 인해 분할하기 어렵다. 이를 해결하기 위해 두께 가중치 w^t를 적용하여 얇은 구조의 반월상 연골의 영향을 높여 클래스 불균형을 완화시킨다. 식 (6)과 같이 학생 모델의 결과를 사용하고 가중치는 배경과 반월상 연골의 픽셀 수를 기반으로 계산되며, 반월상 연골이 차지하는 픽셀이 적을 때 더 높은 가중치를 할당한다.

w t = (N b + ε N m + ε) β

(6)

이 때, N^b와 N^m 는 각각 배경 및 반월상 연골 픽셀 수를 나타내고, ϵ 은 0.1로 설정된 평활화 계수이며, β는 1/5로 설정한다.

2.4 손실함수

손실함수는 학습 과정에서 모델 수렴에 직접적인 영향을 미치므로 분할 대상의 특성을 잘 반영하는 손실함수를 사용하여 모델 파라미터를 최적화해야 한다.

지도 손실함수(supervised loss, L_s)는 레이블이 있는 데이터에서 학생 모델이 출력한 예측값과 실제 정답 레이블 간의 차이를 계산하여 모델이 실제 정답에 더 가까운 예측을 생성할 수 있도록 모델을 학습시킨다. 지도 손실함수는 식 (7)과 같이 이항 교차 엔트로피(binary cross entropy)와 다이스 손실(dice loss)의 합으로 계산된다. 일관성 손실함수(consistency loss, L_c)는 레이블이 있는 데이터와 없는 데이터 모두에서 학생 모델과 교사 모델이 출력한 예측값 간의 차이를 계산해 두 모델 간의 예측 일관성을 유지하도록 모델을 학습시킨다. 일관성 손실함수는 식 (8)과 같이 평균 제곱 오차(Mean-squared error)로 계산되며, 실제 정답 레이블이 필요하지 않아 레이블이 없는 데이터에 대한 학습이 가능해진다.

지도 손실함수와 일관성 손실함수 계산 시, 반월상 연골의 다양한 형태와 두께에 초점을 맞출 수 있도록 분할 난이도 가중치 w^s와 두께 가중치 w^t를 각 손실함수에 곱하여 식 (9)와 (10)과 같이 가중 지도 손실함수(weighted supervised loss, $L s w$ )와 가중 일관성 손실함수(weighted consistency loss, $L c w$ )를 계산한다. 이때 모델 간의 예측 일관성을 강화하기 위해 모호성 맵 Ã을 일관성 손실함수에 추가적으로 곱하여 계산한다.

결과적으로, 최종 손실함수는 식 (11)과 같이 가중 지도 손실함수와 가중 일관성 손실함수를 함께 사용하여 레이블이 있는 데이터와 없는 데이터를 학습에 활용한다.

L s = C E (y i^, y i) + D I C E (y i^, y i)

(7)

L c = M S E (y i ˜, y i^)

(8)

L s w = (w s + w t) • L s

(9)

L c w = (w s + w t) • L c + A ˜ • L c

(10)

L total = L s w + L c w

(11)

이 때, CE(•), DICE(•) 및 MSE(•)는 각각 이항 교차 엔트로피, 다이스 손실 및 평균 제곱 오차이다. y_i는 i번째 데이터의 정답 레이블이고 ŷ_i은 i번째 데이터에 대한 학생 모델을 통해 출력된 예측값이고 ỹ_i는 i번째 데이터에 대한 교사 모델을 통해 출력된 예측값이다.

3. 실험 및 결과

제안 방법의 실험을 위해 무릎 관절 퇴화로 인한 재건 수술을 받은 환자의 반대편 정상 무릎 MR 영상 268개를 사용하였으며, 해당 연구는 서울 삼성서울병원 기관윤리심의위원회의(IRB 승인 번호: 2010-08-116, 2013-07-097) 승인을 받았다. 이 영상은 Achieva 3.0T Philips Medical System 장비를 통해 촬영된 3D PD VISTA MR 영상으로, 해상도는 512x512이며 슬라이스 장수는 230~250장, 슬라이스 두께는 0.5mm, 슬라이스 간격은 0.3125mm이다.

GeForce RTX 3090 그래픽 카드가 장착된 서버에서 파이썬 기반의 딥러닝 라이브러리인 Pytorch 1.10.1 버전을 사용하여 실험을 수행하였다. 네트워크 학습 시 에폭은 400, 학습률은 0.001, 배치 크기는 16으로 설정하였으며 최적화를 위해 아담 옵티마이저를 사용하였다. 또한 학생과 교사 모델의 각 레이어에 [0.005, 0.1, 0.2, 0.3, 0.5]의 드롭아웃을 적용하였다. 실험은 홀드아웃(hold-out) 검증 방식을 사용하였으며, 훈련 데이터 248개와 테스트 데이터 20개로 나누고, 훈련데이터에서 레이블이 있는 데이터와 레이블이 없는 데이터의 비율을 조정하면서 실험을 진행했다.

본 제안 방법의 성능을 평가하기 위해 정량적 평가와 정성적 평가를 수행하였으며 정량적 평가에는 F1-score, 재현율, 정밀도를 성능지표로 하여 제안 방법과 비교 방법 간의 분할 성능을 평가하였다. 무릎 MR 영상에서 반월상 연골 영역은 배경 영역에 비해 상대적으로 작은 영역을 차지하여 반월상 연골과 배경의 비율이 불균형하므로 각 영역에 대한 성능을 균등하게 고려하기 위해 반월상 연골과 배경의 정확도를 따로 계산한 후 평균을 취하는 균형 정확도(balanced accuracy)도 평가하였다. 본 제안 방법의 평가를 위해 2D nnU-Net[18]을 사용한 지도학습 방법과 평균-교사 모델(Mean Teacher, MT)에 다양한 가중치 조합을 적용한 제안 방법들을 비교하였다. 또한, 전체 훈련데이터에 대해 레이블이 있는 데이터와 없는 데이터의 개수를 조정하여 네트워크 훈련에 사용되는 데이터 수에 따른 성능을 분석하였다.

표 1은 레이블이 있는 데이터와 없는 데이터의 개수에 따른 지도학습 및 준지도학습 방법의 반월상 연골 분할 성능지표를 나타낸다. 지도학습 방법의 경우, 레이블이 있는 데이터 83개를 사용한 방법과 비교했을 때, 22개를 사용한 방법에서는 F1-score, 재현율, 정밀도 값이 전반적으로 감소하는 경향을 보였다. 준지도학습을 기반으로 하는 기본 MT 모델은 레이블이 있는 데이터 22개와 레이블이 없는 데이터 63개를 함께 활용하여, 적은 레이블 데이터만으로 학습된 2D nnU-Net 보다 높은 F1-score와 재현율을 보였다. 이는 레이블이 없는 데이터가 추가적인 정보를 제공하여 모델의 예측 성능을 향상시켰기 때문이다. 또한, 모호성 맵을 MT 모델에 적용한 방법(MT+AMB)은 모델 간의 일관성을 강화하여 일반화 성능을 높였으며, 기본 MT 방법대비 0.58%p 증가한 90.75%의 재현율을 보였다. 그러나 모호한 영역에 집중하여 분할 하도록 하는 모호성 맵을 적용함으로써 모델이 모호하거나 경계가 불확실한 영역까지 과도하게 예측해 과대분할이 발생하여 정밀도는 하락하였다. 분할 난이도 가중치를 추가적으로 적용한 방법(MT+AMB+w^s)은 형태가 다양한 반월상 연골에서 성능 저하가 발생하는 문제를 보완하고 과대분할을 개선하여, MT+AMB에 비해 정밀도를 10.73%p 향상시켰다. 두께 가중치를 적용한 방법(MT+AMB+w^t)은 클래스 불균형 문제를 보완하여 과소분할을 개선하였으며, 그 결과 재현율 91.52%, F1-score 89.72%, 균형 정확도 95.56%를 보이며 전반적인 분할 성능이 MT+AMB 보다 향상되었다. 분할 난이도 가중치와 두께 가중치를 함께 적용한 방법(MT+AMB+w^s+w^t)은 가장 적은 양의 레이블이 있는 데이터를 사용한 방법들 중에서 재현율 93.28%, F1-score 90.02%, 균형 정확도 96.42%로 가장 높은 성능을 달성하였다. 예측이 어려운 영역과 얇은 구조를 더 적극적으로 반영함으로써 가장 높은 재현율을 보였지만 동시에 예측 범위가 확장되면서 정밀도가 상대적으로 하락하는 결과가 나타났으나, 제안된 가중치 전략이 서로 보완적으로 작용하면서 재현율-정밀도 간의 트레이드 오프가 효과적으로 조절되어 가장 좋은 F1-score 결과를 보였다. 또한, 레이블 데이터를 증가시켜 학습한 nnUNet에 비해 재현율, 균형 정확도가 각각 0.8%p, 0.35%p 향상되어 레이블이 제한된 데이터 환경에서도 효과적인 분할 성능을 보임을 확인하였다.

Table 1. Performance evaluation of meniscus segmentation according to labeled data and unlabeled data ratios in supervised and semi-supervised learning network

Methods	Network	Ratio(%)		Metrics(%)
Methods	Network	Labeled	Unlabeled	Balanced accuracy	F1-score	Recall	Precision
Supervised learning	2D nnU-Net[18]	22	-	94.42±2.0	89.40±1.6	89.16±4.2	90.09±4.8
Supervised learning	2D nnU-Net[18]	83	-	96.07±1.7	90.95±1.9	92.48±3.7	89.86±5.2
Semi supervised learning	MT[15]	22	63	94.92±2.0	89.90±1.9	90.17±4.2	90.06±5.1
	MT+AMB			94.92±1.6	83.27±3.9	90.75±3.4	77.47±7.6
	MT+AMB+w^s			95.09±1.7	89.18±1.9	90.59±3.7	88.20±5.2
	MT+AMB+w^t			95.56±1.8	89.72±1.8	91.52±3.8	88.39±5.1
	MT+AMB+w^s+w^t			96.42±1.6	90.02±2.1	93.28±3.5	87.39±5.6
	MT+AMB+w^s+w^t	22	226	96.87±1.6	88.81±2.6	94.32±3.4	84.35±6.3
	MT+AMB+w^s+w^t	83	165	97.02±1.5	91.11±2.3	94.45±3.2	88.39±5.8

Download Excel Table

레이블이 있는 데이터 22개와 레이블이 없는 데이터 226개를 사용한 제안 모델은 레이블이 없는 데이터를 더 많이 활용하여 학생 모델과 교사 모델 간의 일관성을 강화하였다. 그 결과, 재현율이 1.04%p 향상되었으며, 83개의 레이블이 있는 데이터를 사용하는 nnU-Net보다도 1.84%p 높은 재현율을 보였다. 그러나 레이블이 없는 데이터의 양이 지나치게 많아지면서 일부 잘못된 예측이 학습에 반영되면서 상대적으로 과대분할 문제가 발생해 정밀도가 다소 하락하였다. 반면, 레이블이 있는 데이터 83개를 사용한 제안 모델은 충분한 레이블 데이터로부터 모델이 직접적인 피드백을 받으며 안정적으로 학습할 수 있었다. 이를 통해 과소분할과 과대분할 문제가 모두 개선되었으며, 가장 높은 F1-score와 재현율을 달성하였다.

그림 3은 레이블이 있는 데이터 개수 변화에 따른 지도학습 및 준지도학습 방법의 반월상 연골 분할의 정성적 결과이다. 레이블이 있는 데이터 22개를 사용하는 nnU-Net은 적은 양의 레이블 데이터로 인해 과소분할이 발생하였고, 더 많은 레이블이 있는 데이터를 사용한 nnU-Net에서는 분할 성능이 개선되는 경향을 보였다. 반면에 MT는 레이블이 없는 데이터를 통해 더 다양한 표현을 고려하여 과소분할이 줄었고, 제안된 방법들을 하나씩 적용하면서 얇고 다양한 형태를 가지는 반월상 연골에 대한 전반적인 분할 성능이 향상되는 결과를 보였다.

Figure 3. Qualitative evaluation of meniscus segmentation results in supervised and semi-supervised learning network according to labeled and unlabeled data ratios.

Download Original Figure

그림 4는 레이블이 있는 데이터와 없는 데이터의 개수 변화에 따른 지도학습 방법과 제안 방법의 반월상 연골 분할의 정성적 결과이다. 레이블이 있는 데이터 22개와 레이블이 없는 데이터 63개를 사용하는 제안 방법은 레이블이 없는 데이터를 추가적으로 고려함으로써 레이블이 있는 데이터만 사용하는 nnU-Net에 비해 과소분할이 개선되었다. 또한, 레이블이 없는 데이터를 226개로 늘려서 훈련한 제안 방법은 과소분할이 개선되었으나 반월상 연골 주변 조직으로 과대분할이 발생했다. 83개로 레이블 데이터를 증가시킨 제안 방법의 경우, 레이블 데이터로부터 정확한 정보를 학습할 수 있어 가장 개선된 분할 결과를 보였다.

Figure 4. Qualitative evaluation of meniscus segmentation results in supervised learning network and proposed method according to labeled and unlabeled data ratios.

Download Original Figure

4. 결론

본 논문에서는 적은 레이블 데이터 환경에서도 다양한 형태와 얇은 두께를 가지는 반월상 연골을 안정적으로 분할 할 수 있는 준지도학습 모델을 제안하였다. 제안된 방법은 모호성 맵과 분할 성능 및 반월상 연골의 두께를 고려한 손실함수를 적용하여 반월상 연골을 효과적으로 분할하였다. 특히, 잘못 예측할 가능성이 높은 영역을 나타내는 모호성 맵을 활용하여 학생 모델과 교사 모델 간의 일관성을 강화하고, 모델의 정규화를 향상시켰다. 또한, 학습 시 분할이 어려운 사례에 집중하도록 유도하는 분할 난이도 가중치를 적용하여, 다양한 형태로 인해 발생하는 분할 성능 저하 문제를 보완하였으며, 얇은 반월상 연골의 영향력을 증대시키는 두께 가중치를 적용함으로써 클래스 불균형 문제를 완화하였다. 이러한 가중치 전략들은 얇고 형태가 다양한 반월상 연골의 해부학적 특성을 효과적으로 반영함으로써 보다 정밀하고 효율적인 학습을 가능하게 하였다. 추가적으로, 레이블이 있는 데이터와 레이블이 없는 데이터의 양이 모델 학습에 미치는 영향을 분석한 결과, 적은 레이블 데이터 환경에서 레이블이 없는 데이터를 증가시키면 추가적인 정보가 제공됨으로써 모델의 예측 능력이 향상되고, 과소분할 문제가 개선될 수 있음을 알 수 있다. 그러나 레이블 데이터에 비해 지나치게 많은 양의 레이블이 없는 데이터가 제공될 경우, 일부 잘못된 예측이 학습 과정에 반영되면서 정밀도가 하락할 수 있음을 확인하였다. 반면, 레이블 데이터의 양이 증가하면 모델이 보다 정확한 정보를 학습할 수 있어 과소분할과 과대분할이 모두 개선되며, 결과적으로 재현율과 정밀도가 향상됨을 알 수 있다.

본 연구는 단일 장비 및 시퀀스 영상을 사용하여 실험을 수행하였으나, 향후 연구에서는 다양한 제조사의 MRI 장비 및 여러 시퀀스에서 획득한 데이터를 추가적으로 확보하여 제안 모델의 도메인 일반화 성능을 검증하고자 한다. 또한, 제안 모델에서 발생하는 과대분할 문제를 완화하기 위해, 후처리 방법이나 의사 레이블 필터링 방법을 고려하여 레이블이 없는 데이터를 더욱 효과적으로 사용함으로써 오분할을 억제하고 전체적인 학습 안정성과 정밀도를 높이는 방향으로 연구를 확장하고자 한다.

감사의 글

이 성과는 정부(과학기술정보통신부)의 재원으로 한국연구재단의 지원(RS-2024-00340610), 보건복지부의 재원으로 한국보건산업진흥원의 보건의료기술연구개발사업 지원(HI22C1496) 및 서울여자대학교 학술연구비의 지원(2025-0214)을 받아 수행되었으며 이에 감사드립니다.

References

[1].

D.J. Hunter, Y.Q. Zhang, J.B. Niu, X. Tu, S. Amin, M. Clancy, and D.T. Felson, "The association of meniscal pathologic changes with cartilage loss in symptomatic knee osteoarthritis." Arthritis & Rheumatism, Vol.54, No.3, pp.795-801, 2006.

[2].

J.J. Elsner, S. Portnoy, F. Guilak, A. Shterling, and E. Linder-Ganz, “MRI-based characterization of bone anatomy in the human knee for size matching of a medial meniscal implant.” Journal of biomechanical engineering vol. 132,10, 2010.

[3].

M. Byra, M. Wu, X. Zhang, H. Jang, Y. J. Ma, E. Y. Chang, S. Shah, and J. Du. “Knee menisci segmentation and relaxometry of 3D ultrashort echo time cones MR imaging using attention U-Net with transfer learning.” Magnetic resonance in medicine vol. 83,3, 2020.

[4].

E. Ölmez, V. Akdoğan, M. Korkmaz, and O. Er. “Automatic Segmentation of Meniscus in Multispectral MRI Using Regions with Convolutional Neural Network (R-CNN).” Journal of digital imaging vol. 33,4, 2020.

[5].

Y. Z. Li, Y. Wang, K. B. Fang, H. Z. Zheng, Q. Q. Lai, Y. F. Xia, J. Y. Chen, and Z. S. Dai. “Automated meniscus segmentation and tear detection of knee MRI with a 3D mask-RCNN.” European journal of medical research vol. 27,1 247. 14 Nov. 2022.

[6].

X. Luo, M. Hang, W. Lu, Z. Hua and J. Zhu, "STRR-Net: A Swim-Transformer and Res2Net Architecture for Knee MR Images Multi-label Segmentation," 2024 30th International Conference on Mechatronics and Machine Vision in Practice (M2VIP), Leeds, United Kingdom, 2024.

[7].

M.J. Willemink, W.A. Koszek, C. Hardell, J. Wu, D. Fleischmann, H. Harvey, L.R. Folio, R.M. Summers, D.L. Rubin, and M.P. Lungren, “Preparing medical imaging data for machine learning.” Radiology 295, 2020.

[8].

S.Y. Huang, W.L. Hsu, R.J. Hsu, and D.W. Liu, “Fully Convolutional Network for the Semantic Segmentation of Medical Images: A Survey.” Diagnostics 12, 2022.

[9].

Z. Yang, P. Xu, Y. Yang, and B.K. Bao, “A Densely Connected Network Based on U-Net for Medical Image Segmentation.” ACM Trans Multimed Comput Commun Appl 17, 2021.

[10].

L. Liu, J.M. Wolterink, C. Brune, and R.N.J. Veldhuis, “Anatomy-aided deep learning for medical image segmentation: A review.” Phys Med Biol 66, 2021.

[11].

D. Karimi, S.D. Vasylechko, and A. Gholipour. “Convolution-Free Medical Image Segmentation Using Transformers.” Lect Notes Comput Sci (Including Subser Lect Notes Artif Intell Lect Notes Bioinformatics) 12901, 2021.

[12].

E. Panfilov, A. Tiulpin, M. Juntunen, V. Casula, M. Nieminen, S. Saarakkala, "Automatic knee cartilage and menisci segmentation from 3D-DESS MRI using deep semi-supervised learning." Osteoarthritis and Cartilage, Volume 27, S390-S391, 2019.

[13].

U. Jeon, H. Kim, H. Hong, and J. Wang, "Automatic Meniscus Segmentation Using Adversarial Learning-Based Segmentation Network with Object-Aware Map in Knee MR Images," Diagnostics, Vol. 11, No. 9, pp. 1612, 2021.

[14].

S.G. Patro and K.K. Sahu, “Normalization: A Preprocessing Stage.” International Advanced Research Journal in Science, Engineering and Technology, 2.

[15].

A. Tarvainen, and H. Valpola, "Mean teachers are better role models: Weight-averaged consistency targets improve semi-supervised deep learning results." Adv Neural Inf Process Syst 2017-December, 2017.

[16].

O. Ronneberger, P. Fischer, and T. Brox, "U-net: Convolutional networks for biomedical image segmentation," International Conference on Medical Image Computing and Computer-Assisted Intervention–MICCAI 2015, Vol.9351, pp. 234-241, 2015.

[17].

Z. Xu, Y. Wang, D. Lu, X. Luo, J. Yan, Y. Zheng, and R. K. Tong. "Ambiguity-selective consistency regularization for mean-teacher semi-supervised medical image segmentation." Medical image analysis, 88, 2023.

[18].

F. Isensee, J. Petersen, A. Klein, D. Zimmerer, P. F.Jaeger, S. Kohl, J. Wasserthal, G. Koehler, T. Norajitra, S. Wirkert, and K.H. Maier-Hein, "nnU-Net: Self-adapting framework for u-net-based medical image segmentation." arXiv preprint arXiv:1809.10486, 2018.

< 저 자 소 개 >

정 희 영

jkcgs-31-2-27-i1

2021년 서울여자대학교 소프트웨어융합학과 학사
2025년 서울여자대학교 컴퓨터학과 소프트웨어융합전공 석사
관심분야 : 의료 인공지능, 딥러닝, 영상분할, 영상처리

왕 준 호

jkcgs-31-2-27-i2

1994년 고려대학교 의학과 학사
2002년 고려대학교 정형외과학 석사
2004년 고려대학교 정형외과학 박사
2002년-2003년 삼성서울병원 전임의
2008년-2009년 미국 피츠버그 대학교연구원
2004년-2010년 고려대학교 안산병원 조/부교수
2010년-현재 삼성서울병원 교수
관심분야: 반월상 연골판, 생체 적합 소재, 3D 프린팅

홍 헬 렌

jkcgs-31-2-27-i3

1994년 이화여자대학교 전자계산학과 학사
1996년 이화여자대학교 전자계산학과 석사
2001년 이화여자대학교 컴퓨터학과 박사
2001년-2003년 서울대학교 컴퓨터공학부 BK 박사후연구원
2003년-2006년 서울대학교 컴퓨터공학부 BK 계약조교수
2006년-현재 서울여자대학교 소프트웨어융합학과 교수
관심분야 : 의료 인공지능, 딥러닝, 영상처리 및 분석