J Korean Med Assoc Search

CLOSE


J Korean Med Assoc > Volume 68(3); 2025 > Article
산부인과 교육에서의 인공지능 활용 가능성: 대형 언어 모델의 잠재력과 전망

Abstract

Purpose: This review examines how artificial intelligence (AI) and large language models (LLMs) can meet the diverse demands of obstetrics and gynecology education. Based on an exploration of their applications, benefits, and challenges, strategies are proposed for effectively integrating these emerging technologies into educational programs.
Current Concepts: Traditional obstetrics and gynecology education relies on lectures, hands-on training, and clinical exposure. However, these approaches often face limitations such as restricted practical opportunities and difficulties in remaining current with rapidly evolving medical knowledge. Recent AI advancements offer enhanced data analysis and problem-solving capabilities, while LLMs, through natural language processing, can supply timely, disease-specific information and facilitate simulation-based training. Despite these benefits, concerns persist regarding data bias, ethical considerations, privacy risks, and potential disparities in healthcare access.
Discussion and Conclusion: Although AI and LLMs hold promise for improving obstetrics and gynecology education by expanding access to current information and reinforcing clinical competencies, they also present drawbacks. Algorithmic transparency, data quality, and ethical use of patient information must be addressed to foster trust and effectiveness. Strengthening ethics education, developing Explainable AI, and establishing clear validation and regulatory frameworks are critical for minimizing risks such as over-diagnosis, bias, and inequitable resource distribution. When used responsibly, AI and LLMs can revolutionize obstetrics and gynecology education by enhancing teaching methods, promoting student engagement, and improving clinical preparedness.

서론: 산부인과 교육의 현황과 인공지능의 필요성

산부인과는 의학의 여러 분야 중에서도 특히 복잡하고 다면적인 접근이 요구되는 영역으로, 의료인들에게 높은 수준의 전문성과 실무 능력을 요구한다[1]. 현재 대부분의 산부인과 교육은 강의, 실습, 그리고 임상 경험을 통해 이루어지며, 학생들이 실제 환자와의 상호작용을 통해 지식을 습득하고 경험을 쌓는 방식이 주를 이룬다[2]. 하지만 이러한 전통적인 교육 방식은 실습 기회의 제한, 최신 지식의 신속한 습득의 어려움 등 몇 가지 중요한 도전 과제에 직면하고 있다[3].
이러한 한계를 극복하기 위한 대안으로 인공지능(artificial intelligence, AI)이 산부인과 교육에 변화를 가져올 수 있는 혁신적인 도구로 주목받고 있다[4]. AI는 데이터 분석, 문제 해결, 지식 전달 등의 측면에서 강력한 역량을 보이며, 교육의 질을 높이고 학습 경험을 더욱 풍부하게 만드는 데 기여할 수 있는 가능성을 제시한다[5].
AI는 옥스퍼드 영어사전에 따르면 시각 및 음성 인식, 의사결정, 언어 번역 등 인간의 지능을 필요로 하는 작업을 수행할 수 있는 컴퓨터 시스템의 이론 및 개발로 정의된다[6]. AI는 확률적 기계학습, 진화적 컴퓨팅, 전문가 시스템, 퍼지 시스템 등 다양한 기술을 포함하며, 1943년 McCulloch와 Pitts [7]가 인간 뇌의 신경망을 모사한 전기 회로 모델을 제안하면서 그 연구가 시작되었다. 이후 1956년 Dartmouth 회의에서 인공지능이라는 용어가 공식적으로 채택되었고, 이후 신경망 모델, 오류 역전파(back propagation), 다층 신경망 구조, 그리고 딥러닝 기술의 발전과 함께 다양한 분야에 혁신을 가져왔다(Figure 1) [8,9].
특히 의료 분야에서 AI의 활용은 환자 진단, 치료 계획 수립, 그리고 환자 안전을 강화하는 데 중점을 두며, 오진 감소와 의료 질 향상에 기여할 가능성이 크다[10]. 이는 고령화로 인한 의료 수요 증가와 인력 부족이라는 문제를 해결하는 데 필수적인 기술로 자리 잡고 있다[11]. 산부인과 교육에서도 AI의 도입은 학습자의 두려움과 불확실성을 완화하고, 의학교육의 방향성을 새롭게 설정할 기회를 제공할 잠재력을 가진다[4,12].
이러한 시점에서 AI와 관련된 의료 기술의 발전 현황과 한계를 명확히 이해하고, 이를 바탕으로 체계적인 교육 방향을 제시하는 것이 필요함을 시사한다. 이 논문에서는 AI 기술이 산부인과를 포함한 의료 분야에 가져오는 변화를 검토하고, 이러한 변화를 효과적으로 수용할 수 있는 의학교육의 방향성을 모색하고자 한다.

대형 언어 모델의 개요와 산부인과 교육에서의 응용

대형 언어 모델(large language models, LLMs)은 대규모 데이터세트를 학습하여 자연어를 이해하고 생성할 수 있는 AI 기술의 한 분야다. 대표적인 예로는 오픈AI (OpenAI)의 Generative Pre-trained Transformer-4 (GPT-4), 구글(Google)의 제미나이(Gemini)와 같은 모델이 있으며, 이러한 모델은 방대한 텍스트 데이터를 분석하고 이를 기반으로 새로운 정보를 생성하는 데 매우 뛰어난 성능을 보인다. 의료 분야에서도 LLMs는 환자의 기록을 분석하거나, 의료 상담을 지원하는 등 다양한 방식으로 활용되고 있다(Table 1) [13,14].
산부인과 교육에서도 LLMs를 활용할 가능성은 크다. 예를 들어, 학생들이 특정 질환에 대해 질문하면 LLMs가 관련 정보를 즉각적으로 제공하거나, 복잡한 진단 과정을 모의해 볼 수 있는 시뮬레이션 도구로 활용될 수 있다. 이는 학생들에게 보다 효율적인 학습 환경을 제공하고, 이론과 실무 간의 간극을 좁히는 데 기여할 수 있다[15].
향후 의료 시스템에서 기계학습의 활용이 더욱 확대되면, 의료 제공 환경에도 큰 변화가 예상된다. Wartman과 Combs [16]는 미래 의료의 주요 특징으로 (1) 환자의 위치와 관계없이 의료 서비스를 제공하는 환경 구축, (2) 다양한 의료 제공자들로 구성된 팀 기반 케어, (3) AI를 포함한 다양한 정보 출처 활용, (4) 의료에서 AI 모델의 효율적 관리 등을 제시하였다. 이러한 변화에 대응하기 위해서는 의료인들에게 새로운 역량이 요구된다.
또한 세계경제포럼이 제안한 4C (비판적 사고, critical thinking; 소통, communication; 협업, collaboration; 창의력, creativity)는 미래 의료인들이 갖추어야 할 필수적인 역량으로, 이를 효과적으로 개발하기 위해서는 의학교육의 변화가 필수적이다[17]. 한 설문조사에 따르면 부산 지역 의과대학 학생의 97%가 AI 교육이 필요하다고 답했으며, 스탠포드 의과대학에서의 조사에서도 학생의 73%가 의료 혁신에 대비하기 위해 추가적인 교육이 필요하다고 응답했다[17]. 하지만 현재의 교육이 변화하는 의료 기술에 충분히 대비할 수 있는지에 대한 질문에는 학생과 전공의의 18%만이 매우 도움이 된다고 답해, 교육 프로그램의 개선이 시급함을 보여주었다[17].
미국의학원(National Academy of Medicine), 미국의사협회(American Medical Association), 영국 국민보건서비스(National Health Service) 등은 의료 교육에서 다뤄야 할 주요 내용으로 다음을 제시한다. (1) 폭증하는 의학 지식 속에서 유익한 정보를 추출하고 통합하여 다양한 상황에 응용하는 능력, (2) 자기주도적 평생학습 능력, (3) 기계학습의 원리를 이해하고 이를 비판적으로 해석하며 한계점을 인지하는 역량, (4) 데이터를 활용한 정밀 의료 제공 능력, (5) 적절한 기계학습 모델을 선택하고 적용하는 능력, (6) 의료 시스템 내 다양한 구성원들과 협력하는 능력, (7) 환자와 공감하며 효과적으로 소통하는 능력 등이 포함된다[18].
이러한 역량들은 산부인과 교육에서도 매우 중요한데, 특히 LLMs는 학생과 전공의들이 복잡한 의료 정보를 쉽게 접근하고 활용할 수 있도록 지원하며, 교육의 질을 향상시키는 데 기여할 수 있다. 향후 이러한 기술을 교육 현장에 통합하는 방법을 모색하는 것이 필요하다.

지식 습득에서 대형 언어 모델의 잠재적 역할

LLMs는 의학교육, 특히 임상 훈련과 지식 습득에서 중요한 역할을 수행할 수 있는 잠재력을 가지고 있다. 이들은 단순한 데이터 분석을 넘어, 학습자와 실무자 모두에게 실질적이고 혁신적인 도구를 제공한다. 다음은 LLMs의 주요 응용 가능성을 구체적으로 살펴본 내용이다(Table 2).

1. 복잡한 의료 데이터의 분석 및 해석 지원

LLMs는 방대한 양의 의료 데이터를 분석하고 해석하는 데 강력한 도움을 줄 수 있다[19]. 예를 들어, 학생이나 전공의가 특정 환자의 병력, 실험실 검사 결과, 그리고 영상 데이터를 입력하면, LLMs는 이를 바탕으로 가능한 진단 결과를 제시하거나 다양한 치료 옵션을 추천할 수 있다. 특히, 희귀 질환이나 복합적인 증례의 경우, LLMs는 최신 문헌을 기반으로 정확하고 근거 있는 정보를 제공하여 학습자가 임상적 결정을 내리는 데 도움을 준다.

2. 진료 과정을 모의하는 시뮬레이션 도구

LLMs는 학생들이 실제 임상 환경에서 경험할 수 있는 다양한 상황을 가상으로 연습할 수 있는 시뮬레이션 도구로 활용될 수 있다[20,21]. 예를 들어, 학습자는 LLMs와 대화하며 가상의 환자와 상호작용할 수 있다. 이 과정에서 학생들은 환자의 증상을 파악하고 적절한 검사를 지시하거나 치료 계획을 수립하는 과정을 경험할 수 있다. 이러한 훈련은 단순한 암기 학습을 넘어, 실제 임상 환경에서 요구되는 종합적 사고와 의사소통 능력을 강화하는 데 기여한다.

3. 문제 해결 능력과 임상적 사고력 강화

LLMs는 학습자의 문제 해결 능력을 키우는 데에도 유용하게 활용될 수 있다[22]. 다양한 의료 사례를 제시하고, 학생들이 이를 해결하는 과정을 통해 실습할 기회를 제공한다. 예를 들어, LLMs는 복합적인 진단 과제를 제시한 뒤, 학습자가 단계적으로 문제를 해결하며 최적의 결론에 도달하도록 돕는다. 이를 통해 학생들은 체계적인 사고 과정을 훈련하고, 실제 임상에서의 대응력을 높일 수 있다. 실제로 GPT 모델과 산부인과 전공의들과의 시험성적을 비교한 최근 연구에서 GPT-4의 역량이 전공의들의 역량과 큰 차이가 없음을 보였다(GPT-4의 평균 점수 79.3점 대 전공의 점수 평균 82.1점, P=0.246) [4]. 특히 문제해결형과 자료해석형 문제에서 강점을 보였다. LLMs의 학습 기능이 발전할수록 그 적용의 능력과 범위도 늘어날 것으로 예측된다.

4. 개인화된 학습 및 피드백 제공

LLMs는 학습자의 수준과 요구에 맞춰 개인화된 학습 환경을 제공할 수 있다[23]. 학생이 특정 주제에 대해 이해도가 부족하다고 판단될 경우, LLMs는 그에 맞는 보충 자료와 설명을 제공하거나, 학생의 오답에 대해 구체적이고 실질적인 피드백을 제공할 수 있다. 이러한 개인화된 접근은 학습자가 효율적으로 지식을 습득하고, 자신감을 높이는 데 기여한다.

5. 다양한 학문적 자원에 대한 접근성 강화

LLMs는 학습자가 최신 연구와 권위 있는 학술 자료에 쉽게 접근할 수 있도록 돕는다[24]. 기존의 문헌 검색이나 해석 과정에서 시간이 소요되던 부분을 자동화하여, 학습자는 더 많은 시간을 실제 학습과 훈련에 투자할 수 있다. 특히, 비영어권 학생들에게는 언어 장벽을 극복하고 글로벌 의료 지식에 접근할 수 있는 유용한 도구가 될 수 있다[25].

AI와 LLMs의 활용에 따른 윤리적, 실질적 한계와 해결 과제

AI과 LLMs는 의료와 교육 분야에서 혁신적인 가능성을 제시하지만, 그 활용에는 다양한 윤리적 및 실질적 한계가 따른다. 이러한 문제들을 이해하고 적절히 해결하는 것은 특히 산부인과 교육에서 AI와 LLMs를 효과적으로 활용하기 위한 중요한 과제다(Table 3).

1. 데이터 편향과 결과의 신뢰성 문제

AI와 LLMs는 대규모 데이터세트를 학습하여 작동하지만, 학습 데이터가 특정 인구집단이나 환경에 편향되어 있을 경우 잘못된 결과를 초래할 수 있다[26]. 이는 의료 진단 및 치료 과정에서 부정확한 정보를 제공할 위험을 증가시킨다. 예를 들어, 산부인과에서 특정 지역이나 기기로 수집된 데이터만을 학습한 모델은 다양한 환자군의 복잡한 의료 요구를 충분히 반영하지 못할 수 있다. 이를 해결하기 위해서는 학습 데이터의 다양성과 품질을 높이고, 모델의 성능을 지속적으로 검증하는 과정이 필요하다.

2. 환자 안전과 의료 윤리

AI의 추천이 잘못된 경우, 이는 실제 환자의 치료 과정에 심각한 영향을 미칠 수 있다[27]. 산부인과에서 잘못된 태아 상태 평가나 치료 방법의 추천은 산모와 태아 모두에게 위험을 초래할 수 있다. 따라서 AI가 제공하는 결과를 의사가 비판적으로 평가하고 검증할 수 있는 시스템이 필수적이다. 또한, 의료 윤리 교육을 통해 학생들에게 AI의 활용이 가져올 수 있는 윤리적 문제를 인지시키는 것이 중요하다.

3. 딥러닝의 기술적 한계

딥러닝은 데이터의 특성에 따라 결과가 크게 좌우된다. 의료 데이터를 기반으로 하는 딥러닝 모델은 입력 데이터의 오류, 대표성 부족, 편향 등의 문제를 내포할 수 있다[28]. 예를 들어, 산부인과에서 특정 조건에 따라 훈련된 모델이 다른 환경이나 장비에서 동일한 정확도를 유지하지 못할 가능성이 있다. 이를 극복하기 위해서는 데이터의 질을 개선하고, 다양한 의료 환경에서 모델의 성능을 검증하는 연구가 필요하다.
또한 심층학습 모델의 블랙박스 특성은 의사결정 과정을 설명하기 어렵게 만든다[29]. 의료 전문가들은 AI의 결과를 신뢰하기 위해 결과가 도출된 근거를 이해할 필요가 있다. 이를 위해 최근에는 설명 가능한 AI (Explainable AI, XAI)를 개발하려는 노력이 증가하고 있다. 산부인과 교육에서도 학생들에게 이러한 기술적 한계를 이해시키고, AI 결과를 비판적으로 해석하는 능력을 길러주는 것이 중요하다.

4. 개인정보 보호와 데이터 보안

AI와 LLMs는 대규모 데이터세트를 활용하기 때문에 개인 정보 보호와 데이터 보안 문제가 중요하게 대두된다[27]. 산부인과에서 다루는 데이터는 출산 기록, 유전 질환, 생식 건강과 관련된 민감한 정보를 포함하고 있어 특히 보호가 필요하다. 예를 들어, 학습 데이터를 익명화하지 않거나 보안이 취약한 상태에서 데이터를 전송하면 개인 정보 유출 위험이 커진다. 이를 방지하기 위해 병원과 개발사가 협력하여 데이터 보호 정책과 보안 프로토콜을 강화해야 한다.

5. 과다 진단 및 의료 불평등

AI가 질병을 조기에 발견할 수 있는 장점이 있는 반면, 과다 진단으로 불필요한 치료를 유도할 가능성도 존재한다[30]. 이는 의료 비용 증가와 환자의 불필요한 불안으로 이어질 수 있다. 산부인과에서 AI를 활용할 때는 질병의 진단과 예후 분석에서 필요 이상의 개입을 줄이기 위해 신중한 접근이 요구된다.
또한, AI 기술의 접근성과 활용 가능성이 의료 환경에 따라 달라질 수 있어 의료 불평등을 심화시킬 우려가 있다[31]. AI가 일부 병원이나 특정 계층에만 제공되면, 의료 서비스의 형평성이 저하될 가능성이 있다. 이를 해결하기 위해 정부와 의료 기관이 협력하여 AI 기술이 공정하게 배분될 수 있는 정책적 노력이 필요하다.

6. 해결 방안

AI와 LLMs의 한계를 극복하기 위해서는 다음과 같은 해결 방안을 모색해야 한다. 우선 데이터 다양성과 품질 향상, 즉 AI 모델이 다양한 환자군을 포괄적으로 학습할 수 있도록 데이터 수집 과정을 개선해야 한다. 그리고 설명 가능한 AI 개발, 즉 AI의 판단 과정을 의료 전문가가 이해할 수 있도록 설명 가능한 AI 기술을 개발해야 한다. 아울러 학생들이 AI의 윤리적 문제를 이해하고 대처할 수 있도록 의료 윤리 교육을 체계화해야 한다. 또한 AI 모델의 성능을 의료 환경에서 지속적으로 검증하고, 이를 관리할 규제 체계를 마련해야 한다. 산부인과 교육에서 AI와 LLMs를 효과적으로 활용하려면 이와 같은 한계와 문제를 이해하고 적절히 대처할 수 있는 노력이 필요하다. 이를 통해 AI 기술이 산부인과 교육 및 임상 환경에서 안전하고 신뢰할 수 있는 도구로 자리 잡을 수 있을 것이다.

결론: 산부인과 교육의 미래-대형 언어 모델 활용의 전망과 발전 방향

LLMs는 산부인과 교육에 혁신적인 변화를 가져올 잠재력을 가진 도구로, 그 미래는 매우 유망하다고 할 수 있다[4,15]. 이러한 기술은 단순히 학습 자료를 제공하는 것을 넘어, 학습자의 참여를 유도하고 실제 임상 환경에 가까운 경험을 제공함으로써 교육의 질을 한 단계 높일 수 있다.
앞으로 LLMs는 더욱 정교하게 발전하여, 학생들이 실제 임상에서 마주할 수 있는 복잡하고 다양한 시나리오를 모의(simulation)할 수 있을 것이다[20,21]. 예를 들어, 고위험 임신, 응급 제왕절개, 출혈 관리와 같은 상황을 가상으로 연습함으로써, 학생들이 임상적 판단력과 문제 해결 능력을 실질적으로 강화할 수 있다. 이는 기존의 교육 도구로는 제공하기 어려웠던 정밀하고 개인화된 학습 환경을 제공하는 데 중요한 역할을 할 것이다.
또한, LLMs는 산부인과 교육에서 개인화를 촉진하는 데 크게 기여할 수 있다[23]. 각 학생의 학습 수준, 선호도, 학습 속도에 맞춘 맞춤형 콘텐츠를 제공함으로써, 학습자의 흥미를 유지하고 학습 효과를 극대화할 수 있다. 예를 들어, 초보자는 기초적인 개념과 절차를 이해할 수 있는 자료를 제공 받는 반면, 숙련된 학습자는 복잡한 사례 기반 학습(case-based learning)을 통해 고급 문제 해결 능력을 강화할 수 있다.
뿐만 아니라, LLMs는 다국적, 다문화 환경에서 교육의 접근성을 확장하는 데도 기여할 수 있다[25]. 다양한 언어로 번역된 자료와 문화적 차이를 반영한 학습 자료를 제공함으로써, 전 세계의 의료 학생들과 전문가들이 고품질의 교육에 쉽게 접근할 수 있도록 돕는다.
이러한 기술 발전은 산부인과 교육뿐만 아니라 전체 의료 교육의 패러다임을 전환시킬 가능성을 가지고 있다. LLMs는 단순한 도구를 넘어, 학생, 전공의, 교수 간의 협력을 촉진하고, 궁극적으로 환자에게 제공되는 의료 서비스의 질을 향상시키는 데 기여할 것이다[14]. 앞으로 산부인과 교육은 LLMs를 활용하여 더욱 효율적이고 효과적인 방향으로 발전하며, 의료 교육의 새로운 기준을 세워가야 할 것이다.

Conflict of Interest

No potential conflict of interest relevant to this article was reported.

Figure 1.
Hierarchy and chronological development of artificial intelligence, machine learning, and deep learning. AI, artificial intelligence; GPU, graphics processing unit; NLP, natural language processing; GPT, Generative Pre-trained Transformer. Illustration by the author.
jkma-2025-68-3-161f1.jpg
Table 1.
Summary of large language models in various domains
LLMs Developer Summary/key applications Primary domain Year of development
ChatGPT OpenAI NLP and text generation, widely used for chatbots, content creation, and code generation General AI, NLP 2022
GPT 3, 3.5, 4 OpenAI Advanced versions of ChatGPT, providing improved contextual understanding and text generation General AI, NLP 2020
Gemini Google Google’s LLM, focused on search enhancement and conversational AI General AI, NLP 2023
DeepSeek DeepSeek Chinese-developed AI assistant with DeepThink capabilities and enhanced contextual understanding General AI, NLP 2023
BioGPT Luo et al. Biomedical text generation and literature mining, specialized for clinical data processing Biomedical AI 2022
BioBERT Lee et al. Fine-tuned BERT for biomedical text generation and literature extraction Biomedical AI 2019
BioMedLM Stanford (Bolton et al.) Biomedical LLM from Stanford, optimized for medical text analysis Biomedical AI 2023
ChatCAD Wang et al. AI-driven diagnosis system analyzing medical images for clinical support Medical imaging 2022
ClinicalBERT Huang et al. Clinical text processing model trained on electronic health records Clinical data 2019
BlueBERT Peng et al. Biomedical BERT variant trained on PubMed abstracts and clinical notes Biomedical AI 2019
Clinical Camel Toma et al. Llama-based model fine-tuned for biomedical research applications Biomedical AI 2023
BioMegatron Shin et al. BERT variant trained specifically on PubMed abstracts and biomedical datasets Biomedical AI 2020
BioMedRoBERTa Gururangan et al. Fine-tuned RoBERTA model optimized for biomedical research applications Biomedical AI 2020
MedAlpaca Han et al. Alpaca-based model tailored for medical research and data processing Biomedical AI 2023
Med-PaLM Google (Singhal et al.) Google’s medical AI model trained on diverse biomedical literature and research data Biomedical AI 2023

LLM, large language model; GPT, Generative Pre-trained Transformer; AI, artificial intelligence; NLP, natural language processing; BERT, Bidirectional Encoder Representations from Transformers; BioMedLM, Biomedical Language Model; ChatCAD, Chat-based Clinical AI Diagnosis; BioMedRoBERTa, Biomedical Robustly Optimized BERT Pretraining Approach; Med-PaLM, Medical Pathways Language Model.

Table 2.
Potential roles of large language models in clinical training and knowledge acquisition in obstetrics and gynecology
Role Specific applications Expected benefits
Complex medical data analysis Providing possible diagnoses and treatment options based on patient history and test results Aiding in accurate diagnosis and treatment planning
Clinical process simulation Interacting with virtual patients to practice diagnosis and treatment Enhancing communication skills and adaptability in real clinical settings
Enhancing problem-solving skills Presenting complex medical cases and guiding step-by-step problem resolution Improving clinical reasoning and comprehensive problem-solving abilities
Personalized learning and feedback Offering supplementary explanations tailored to the learner’s level and providing detailed feedback on incorrect answers Increasing learning efficiency and boosting confidence
Improved access to academic resources Translating and summarizing the latest research and global medical knowledge Creating a learning environment based on the most up-to-date information
Table 3.
Ethical and practical limitations of AI and LLM utilization
Issue area Details
Data bias and reliability of outcomes - Utilization of large datasets, but potential for biased learning
- Requirement for diverse and high-quality data
Patient safety and medical ethics - Potential for incorrect AI recommendations
- Need for a critical evaluation system for AI-generated results
- Importance of medical ethics education for students
Technical limitations of deep learning - Possibility of errors, lack of representativeness, and bias issues
- “Black box” nature of decision-making processes
- Need for the development of XAI
Privacy and data security - Necessity for data anonymization
- Implementation of enhanced data protection protocols
Over-diagnosis and healthcare disparities - Risk of increased unnecessary treatments
- Potential rise in medical costs
- Efforts required to ensure fair access to AI technologies

AI, artificial intelligence; LLM, large language model; XAI, Explainable AI.

References

1. Fialkow MF, Snead CM, Schulkin J. Benefits and barriers to teaching medical students in an Ob-Gyn clinic. Health Serv Res Manag Epidemiol 2018;5:2333392817753518.
crossref pmid pmc pdf
2. Duhm L, Wittek A, Walter A, et al. Factors influencing medical students’ interest in obstetrics and gynecology: a longitudinal study on career preferences. Arch Gynecol Obstet 2025;311:903–914.
crossref pmid pmc pdf
3. Metheny WP, Ernest JM, Bachicha J, et al. Have we met the educational challenges of obstetrics and gynecology?: a response to the Association of Professors of Gynecology and Obstetrics Initiative of 1986 Am J Obstet Gynecol 2002;187:1405–1412.
crossref pmid
4. Eoh KJ, Kwon GY, Lee EJ, et al. Efficacy of large language models and their potential in obstetrics and gynecology education. Obstet Gynecol Sci 2024;67:550–556.
crossref pmid pmc pdf
5. McAdams RM, Green TL. Equitable artificial intelligence in obstetrics, maternal-fetal medicine, and neonatology. Obstet Gynecol 2024;Mar. 28. [Epub]. https://doi.org/10.1097/aog.0000000000005563
crossref
6. Abraham TH. (Physio)logical circuits: the intellectual origins of the McCulloch-Pitts neural networks. J Hist Behav Sci 2002;38:3–25.
crossref pmid
7. McCulloch WS, Pitts W. A logical calculus of the ideas immanent in nervous activity. 1943. Bull Math Biol 1990;52:99–115.
pmid
8. Rumelhart DE, Hinton GE, Williams RJ. Learning representations by back-propagating errors. Nature 1986;323:533–536.
crossref pdf
9. Hinton GE, Osindero S, Teh YW. A fast learning algorithm for deep belief nets. Neural Comput 2006;18:1527–1554.
crossref pmid
10. Kolokythas A, Dahan MH. Is Artificial Intelligence (AI) currently able to provide evidence-based scientific responses on methods that can improve the outcomes of embryo transfers?: no JBRA Assist Reprod 2024;28:629–638.
crossref pmid pmc
11. Mapari SA, Shrivastava D, Dave A, et al. Revolutionizing Maternal health: the role of artificial intelligence in enhancing care and accessibility. Cureus 2024;16:e69555.
crossref pmid pmc
12. Lee Y, Kim SY. Potential applications of ChatGPT in obstetrics and gynecology in Korea: a review article. Obstet Gynecol Sci 2024;67:153–159.
crossref pmid pmc pdf
13. Bedi S, Liu Y, Orr-Ewing L, et al. Testing and evaluation of health care applications of large language models: a systematic review. JAMA 2025;333:319–328.
crossref pmid
14. Thirunavukarasu AJ, Ting DS, Elangovan K, Gutierrez L, Tan TF, Ting DS. Large language models in medicine. Nat Med 2023;29:1930–1940.
crossref pmid pdf
15. Reicher L, Lutsker G, Michaan N, Grisaru D, Laskov I. Exploring the role of artificial intelligence, large language models: Comparing patient-focused information and clinical decision support capabilities to the gynecologic oncology guidelines. Int J Gynaecol Obstet 2025;168:419–427.
crossref pmid
16. Wartman SA, Combs CD. Medical education must move from the information age to the age of artificial intelligence. Acad Med 2018;93:1107–1109.
crossref pmid
17. Jung JS. Current status and future direction of artificial intelligence in healthcare and medical education. Korean Med Educ Rev 2020;22:99–114.
crossref pdf
18. Institute of Medicine, Board on Health Care Services, Committee on the Health Professions Education Summit, Knebel E, Greiner AC. Health professions education: a bridge to quality. National Academies Press; 2003.

19. Safranek CW, Sidamon-Eristoff AE, Gilson A, Chartash D. The role of large language models in medical education: applications and implications. JMIR Med Educ 2023;9:e50945.
crossref pmid pmc
20. Cook DA. Creating virtual patients using large language models: scalable, global, and low cost. Med Teach 2025;47:40–42.
crossref pmid
21. Holderried F, Stegemann-Philipps C, Herrmann-Werner A, et al. A language model-powered simulated patient with automated feedback for history taking: prospective study. JMIR Med Educ 2024;10:e59213.
crossref pmid pmc
22. Goh E, Gallo R, Hom J, et al. Large language model influence on diagnostic reasoning: a randomized clinical trial. JAMA Netw Open 2024;7:e2440969.
crossref pmid pmc
23. Lucas HC, Upperman JS, Robinson JR. A systematic review of large language models and their implications in medical education. Med Educ 2024;58:1276–1285.
crossref pmid
24. Mondal H, De R, Mondal S, Juhi A. A large language model in solving primary healthcare issues: a potential implication for remote healthcare and medical education. J Educ Health Promot 2024;13:362.
crossref pmid pmc
25. Shah K, Xu AY, Sharma Y, et al. Large language model prompting techniques for advancement in clinical medicine. J Clin Med 2024;13:5101.
crossref pmid pmc
26. Feehan M, Owen LA, McKinnon IM, DeAngelis MM. Artificial intelligence, heuristic biases, and the optimization of health outcomes: cautionary optimism. J Clin Med 2021;10:5284.
crossref pmid pmc
27. Chaurasia A, Curry G, Zhao Y, et al. Use of artificial intelligence in obstetric and gynaecological diagnostics: a protocol for a systematic review and meta-analysis. BMJ Open 2024;14:e082287.
crossref pmid pmc
28. Thakur GK, Thakur A, Kulkarni S, Khan N, Khan S. Deep learning approaches for medical image analysis and diagnosis. Cureus 2024;16:e59507.
crossref pmid pmc
29. Amann J, Blasimme A, Vayena E, Frey D, Madai VI; Precise4Q consortium. Explainability for artificial intelligence in healthcare: a multidisciplinary perspective. BMC Med Inform Decis Mak 2020;20:310.
pmid pmc
30. Komorowski M, Celi LA. Will artificial intelligence contribute to overuse in healthcare? Crit Care Med 2017;45:912–913.
crossref pmid pmc
31. Smith MJ, Axler R, Bean S, Rudzicz F, Shaw J. Four equity considerations for the use of artificial intelligence in public health. Bull World Health Organ 2020;98:290–292.
crossref pmid pmc

Peer Reviewers’ Commentary

인공지능의 필요성, 대형언어모델(Large Language Model, LLM)의 개요와 산부인과 교육에서의 응용, 임상훈련과 지식습득에서의 LLM의 잠재적 역할, 활용에 따른 윤리적, 실질적 한계와 해결 과제 및 산부인과 교육의 미래에 있어 LLM 활용의 전망과 발전 방향에 대하여 조명하였다. 특히 그는 LLM이 산부인과 교육에 혁신적인 변화를 가져올 잠재력을 가진 도구로, 그 미래는 매우 유망하다고 하면서 이러한 기술은 단순히 학습 자료를 제공하는 것을 넘어, 학습자의 참여를 유도하고 실제 임상 환경에 가까운 경험을 제공함으로써 교육의 질을 한 단계 높일 수 있다고 하였다.
[정리: 편집위원회]


ABOUT
ARTICLE CATEGORY

Browse all articles >

ARCHIVES
FOR CONTRIBUTORS
Editorial Office
37 Ichon-ro 46-gil, Yongsan-gu, Seoul 04427, Korea
Tel: +82-2-6350-6562    Fax: +82-2-792-5208    E-mail: office@jkma.org                

Copyright © 2025 by Korean Medical Association.

Developed in M2PI

Close layer
prev next