연구는 장현 종양혈액내과 교수, 정진우 비뇨의학과 교수, 김용호 방사선종양학과 교수팀이 진행했으며, 대표적인 AI 모델인 ‘ChatGPT’와 ‘클로바X’를 대상으로 했다.

결과적으로 두 모델 모두 전체적인 응답 품질은 유사했으며, 통계적으로 큰 차이는 없었다. 다만 일부 문항에선 사실과 다른 내용이나 비의학적 표현을 포함한 ‘환각(hallucination)’ 응답이 확인됐다.
장 교수는 “이번 연구는 인공지능이 한국어로 의료정보를 제공하는 데 있어 어느 수준에 와 있는지를 보여주는 기초자료”라며 “AI가 암환자들에게 더 신뢰받을 수 있도록 정확도 향상에 집중하겠다”고 밝혔다.
임혜정 헬스인뉴스 기자 press@healthinnews.kr
임혜정 기자
press@hinews.co.kr


