AI 툴 오픈AI Whisper가 의료 현장에서 사용되면서 나타난 문제들

의료 현장은 첨단 기술의 발달로 점점 더 많은 AI 시스템들을 도입하고 있습니다. 특히, 음성을 텍스트로 변환하는 기능을 가진 AI 툴은 의사들이 환자 정보를 좀 더 효율적으로 기록하는 데 중요한 역할을 합니다. 하지만 오픈AI Whisper 툴이 이런 장점 때문에 의료 현장에서 사용되면서 다양한 문제점들이 불거지고 있습니다. 이번 글에서는 Whisper 툴이 의료 및 기타 분야에서 발생시키고 있는 주요 문제점들을 다루어 보겠습니다.

오픈AI Whisper, 치명적인 오류의 시작

Whisper는 OpenAI의 트랜스크립션 도구로, 음성을 텍스트로 변환하는 데 사용됩니다. 그러나 최근 여러 대학과 연구소의 보고에 따르면 오픈AI Whisper의 트랜스크립션에는 ‘환각’으로 불리는 오류가 잦다고 합니다. 이러한 ‘환각’은 실제로 없던 발언이나 내용을 트랜스크립션에 추가하는 현상으로, 특히 의료 분야에서 큰 문제가 될 수 있습니다.

오픈AI Whisper

주요 발견 사례

여러 연구진과 개발자들이 오픈AI Whisper의 문제점을 이미 발견해 냈습니다. 예를 들어, University of Michigan의 연구진은 공청회 음성 10건 중 8건에서 잘못된 텍스트가 생성되었음을 보고했습니다. 또 다른 연구에서는 130,000개 이상의 오디오 녹음 분석 중 187개의 심각한 환각 오류가 확인되었습니다. 이러한 오류들은 의료진이 환자를 잘못 진단하거나, 불필요한 의료 조치를 취하게 만드는 치명적인 결과를 가져올 수 있습니다.

오픈AI Whisper의 의료 적용과 위험성

Whisper는 특히 의료 분야에서 주목받고 있는데, 이는 Nabla와 같은 회사가 수천 명의 의료 전문가와 의료 시스템에서 이 툴을 사용하기 때문입니다. Nabla는 오픈AI Whisper를 통해 의료 방문 횟수당 약 700만 건의 트랜스크립션을 처리했으며, 이 과정에서 ‘환각’ 문제가 계속 발생하고 있습니다.

Nabla의 문제 해결 노력

Nabla의 CTO에 따르면, Whisper의 ‘환각’ 오류를 해결하기 위해 치열하게 노력 중이라고 밝혔습니다. 그러나 현재로서는 트랜스크립션의 정확성을 검증할 방법이 없는 상태입니다. 문제는 이러한 트랜스크립션이 의료 습득 문서로 사용된다는 점에서 더욱 심각합니다. 개인정보 보호법 때문에 외부에서 이 트랜스크립션을 검수하기 어렵기 때문에, 더욱 큰 문제가 되고 있습니다.

Whisper 트랜스크립션의 사례들

Cornell University의 Allison Koenecke 교수와 University of Virginia의 Mona Sloane 교수가 연구한 바에 따르면, TalkBank라는 연구 저장소에서 Whisper의 트랜스크립션을 살펴본 결과 40% 가까운 오류가 발견되었습니다. 예를 들어, Whisper는 세 명의 사람을 검토하는 과정에서 잘못된 인종 정보를 생성하거나 폭력적인 내용을 추가하는 경우도 있었습니다.

이러한 환각 오류들은 단순한 실수로 치부될 수 없는 이유는, 의료 혹은 사회적 맥락에서 너무나도 중요한 정보를 잘못 혹은 과장해 전달할 위험이 있다는 점입니다. 기술이 삶을 더 편리하게 만드는 도구가 될 수 있는 만큼, 그 책임 역시 무거워지고 있는 셈입니다.

Whisper의 문제 해결 방안

Whisper의 문제는 기술 개발 과정에서 발생하는 피할 수 없는 부주의라는 점도 있습니다. 하지만 이러한 문제를 방지하기 위해서 기술 개발자와 기업들이 취할 수 있는 몇 가지 조치가 있습니다.

  1. 엄격한 테스트 및 검증: 기술을 배포하기 전에 다양한 환경에서의 테스트와 검증 과정이 필수적입니다.

  2. 피드백 시스템 구축: 사용자 피드백을 수집하여 지속적으로 업데이트할 수 있는 시스템을 구축해야 합니다.

  3. 투명성 강화: AI가 생성한 결과물에 대한 출처 및 데이터를 투명하게 공개하는 것이 중요합니다.

  4. 책임 있는 AI 개발: 윤리적 AI 개발 방침을 철저히 따르는 것도 중요합니다.

결론

AI 기술의 발전은 인류의 삶을 개선하는 데 큰 기회를 제공합니다. 다만 그 과정에서 발생할 수 있는 오류와 문제를 간과해서는 안 됩니다. Whisper처럼 강력한 툴도 그에 상응하는 책임을 가져야 하며, 의료와 같은 민감한 분야에서는 특히 그러한 책임이 강조되어야 합니다.

AI의 유용성과 위험성에 대해 명확한 인식을 바탕으로, 각 분야에서 더 나은 AI 사용 환경을 만들어 나가야 합니다. 이는 사용자뿐 아니라 개발자, 기업 모두의 공동의 노력으로 이루어질 수 있는 목표입니다.

참고: OpenAI’s Whisper invents parts of transcriptions — a lot

함께 읽으면 좋은 글 : 디지털 트랜스포메이션: 조직의 습관을 바꾸는 일