【후생신보】 유전자 검사에서 해석이 어려워 ‘의미 불분명 변이(VUS)’로 남겨졌던 종결 코돈 변이의 병원성을 인공지능(AI)으로 정밀 예측하는 기술이 국내 연구진에 의해 개발됐다. 희귀질환과 유전성 암 진단의 정확도를 크게 높일 수 있을 것으로 기대된다.
![]() |
연세대 강남세브란스병원(병원장 구성욱) 진단검사의학과 윤지훈·이경아 교수팀은 종결 코돈 변이의 병원성을 높은 정확도로 예측하는 AI 기반 유전자 변이 판독 모델 ‘TAILVAR’를 개발했다고 밝혔다. 이번 연구는 한국보건산업진흥원의 ‘글로벌 의사과학자 양성사업’ 지원을 받아 수행됐으며, 생명과학 분야 국제학술지 Nucleic Acids Research(IF 13.1)에 게재됐다.
종결 코돈(Stop codon)은 단백질 합성을 멈추게 하는 신호로, 정상적으로 작동할 경우 단백질은 일정한 길이로 생성된다. 그러나 종결 코돈 변이가 발생하면 단백질 말단(C-terminal)이 비정상적으로 길어지며, 이로 인해 단백질이 세포 내에서 응집해 독성을 유발하거나 분해 과정에서 제거돼 본래 기능을 상실하게 된다.
이러한 현상은 도파민 반응 이상운동증, 뮤코다당증과 같은 희귀질환은 물론 유방암, 대장암 등 유전성 암 발생의 원인이 될 수 있다. 하지만 종결 코돈 변이 중 어떤 변이가 실제 질병을 유발하는지 판별하기 어려워 상당수가 의미 불분명 변이로 분류돼 왔다.
![]() |
연구팀은 단백질 말단 연장형 종결 코돈 변이의 생화학적 특성에 주목했다. 단백질 말단부의 길이, 아미노산 구성, 소수성, 응집성 등 질병 발생과 연관된 37가지 지표를 머신러닝에 학습시켜 TAILVAR 모델을 구축했다.
백만 명 이상 규모의 공개 유전체 데이터베이스를 활용해 모델을 검증한 결과, TAILVAR는 예측 정확도(AUROC) 0.956을 기록하며 기존 예측 도구 대비 최고 수준의 성능을 보였다. 실제 세포 실험 데이터와의 상관 분석에서도 가장 높은 상관계수(ρ=0.379)를 나타내 AI 예측의 생물학적 타당성을 입증했다.
특히 기존에 판독이 불가능했던 의미 불분명 변이에 적용한 결과, 약 42%를 병원성 또는 병원성 가능 변이로 재분류하는 데 성공했다. 이는 AI가 APC, MLH1, SMAD4, BAP1 등 주요 암 억제 유전자의 기능 소실 여부를 실험 결과와 일치하게 예측할 수 있음을 보여준다.
윤지훈 교수는 “이번 연구는 평가가 어려웠던 종결 코돈 변이를 체계적으로 해석할 수 있는 새로운 기준을 제시했다”며 “아직 밝혀지지 않은 질병 원인 유전자와 변이 발굴을 가속화해 정밀의료와 개인 맞춤형 치료 전략 수립에 기여할 것으로 기대한다”고 말했다.
한편 연구팀은 TAILVAR 데이터베이스를 오픈소스 플랫폼(https://github.com/dr-yoon/TAILVAR)을 통해 공개해, 국내외 연구자들이 유전자 변이 해석과 임상 판독에 자유롭게 활용할 수 있도록 했다.














