生成AIのChatGPTに今年の医師国家試験に挑ませたところ,正答率が合格ラインを超えたという。
생성AI인 ChatGPT에 올해의 의사국가고시를 도전시켰더나 정답율이 합격 라인을 넘었다고 한다.
チャットGPTはこれまで,米国の医師免許試験などで高得点を挙げてきた。
Chat GPT는 지금까지 미국 의사면허시험 등에서 높은 점수를 받아왔다.
今回は,非英語圏の臨床現場での有効性を探るため,日本の昨年の医師国家試験のうち,画像を見ずに回答できる問題文について,チャットGPTに日本語のまま入力した。
이번에는 비영어권의 임상 현장에서의 유형성을 탐구하기 위해, 일본의 작년 의사 국가고시 중, 이미지를 보지 않고 답변할 수 있는 문제에 대해 Chat GPT에 일본어 그대로 입력하였다.
結果は,正答率が52・8%にとどまった。
결과적으로 정답률은 52.8%에 머물렀다.
チャットGPTの学習データの多くが英語圏のネット情報に由来するとみられるからだという。
Chat GPT의 학습 데이터의 대부분이 영어권 인터넷 정보에서 유래된다고 보이기 때문이다.
そこで研究チームは,チャットGPTに日本語の問題文を平易な英語に翻訳させ最新版「GPT4」を使って回答させたところ,正答率は82・8%にまで急上昇し合格ラインを超えたという。
그래서 연구 팀은 Chat GPT에게 일본어 문제문을 간단한 영어로 번역하고, 최신 버전인 "GPT4"를 사용하여 답변시켰더니, 정답률은 급상승하여 82.8%로 합격 기준을 넘었다고한다.
しかし,研究チームは誤答に関しては「時代遅れで,致命的に不正確な回答があった」と指摘した。
그러나 연구팀은 오답에 관해서는 "시대에 뒤떨어져 있으며 치명적으로 부정확한 답변이 있었다"고 지적했다.
例えば,過換気症候群(過呼吸)の初期治療に関する問題では,「ゆっくり呼吸するように指導する」が正解にもかかわらず,チャットGPTは「紙袋を口につけて呼吸させる」を選んでいた。
예를 들어, 과환기증후군 (과호흡)의 초기 치료에 관한 문제에서는 "천천이 호흡하도록 지도하라"가 정답임에도 불구하고, Chat GPT는 "종이 봉지를 입에 대고 호흡시키라"를 선택했다.
紙袋法はかつて広く使われていたが,窒息死するケースもあり,現在は推奨されていない。
종이 봉지법은 옛날에는 널리 사용되었지만, 질식사하는 경우도 있어 현재는 권장되지 않다.
チャットGPTが文章を生み出す仕組みは,これまで学習した文章や単語から一番もっともらしい,出現頻度の高い言葉を選んでいくというものだ。
Chat GPT가 문장을 생성하는 메커니즘은 지금까지 학습한 문장이나 단어에서 가장 그럴듯하고 빈도가 높은 단어를 선택해 나가는 것입니다.
そのため,紙袋法のように長期間にわたって慣行となり,関連情報が今もネット上で広く入手可能な場合,古い情報が最新情報よりも優先される可能性があるという。
그러므로 종이 봉지법처럼 오랜 기간 동안 관행이 되고 있으며 관련 정보가 여전히 인터넷에서 널리 접할 수 있는 경우, 오래된 정보가 최신 정보보다 우선되는 가능성이 있다고 한다
ある研究者は「チャットGPTは特定の疾患だけが苦手なわけではなく,多岐にわたる疾患で間違えた。命にかかわる診断や診療には不向きだ」と話す。
한 연구자는 "Chat GPT는 특정 질환만을 실수하는 것이 아니라 다양한 질환에서 실수했다. 생명에 관여하는 진단이나 진료에는 부적합하다"고 말했다.
また,手術や患者とのコミュニケーションでは,人間の役割が大きいとも指摘した。
또한, 수술이나 환자와의 커뮤니케이션에서는 사람의 역할이 크다는 지적도 했다.
チャットGPTを医療現場で使う可能性があるとすれば,文書作成などの定型業務を代替するなど補助的な役割だとしている。
Chat GPT를 의료 현장에서 사용할 가능성이 있다면 문서 작성 등의 표준화된 업무를 대체하는 등 보조적인 역할이라고 언급한다.
생성AI인 ChatGPT를 올해 의사국가고시에 도전시켰더니 정답율이 합격 라인을 넘었다고 한다.