国际眼科时讯

APAO前沿追踪丨生成式人工智能与大型语言模型如何重塑眼科诊疗范式?

2026-02-06 20:41:00
81 Views

编者按：当前，人工智能（AI）技术正以前所未有的深度与广度重塑眼科医疗实践，从影像分析到决策辅助，从病程预测到医患互动，AI正在重新定义眼科诊疗的边界与可能。在技术快速迭代的浪潮中，临床工作者与科研人员面临的核心挑战已从"技术是否可用"转向"如何确保其在临床应用中的可信性与安全性"。第41届亚太眼科学会年会（APAO 2026）上，呈现了多项眼科AI研究的前沿动态。本期专题报道聚焦APAO的相关研究，探讨AI在眼科领域的应用边界、临床转化的关键挑战以及未来发展的伦理框架。

早产儿视网膜病变的连续可视化：基于受孕后年龄条件的生成模型研究

视网膜血管发育异常是早产儿视网膜病变（ROP）的核心病理特征，其动态演变过程难以通过传统影像手段完整捕捉。临床实践中，眼科医师仅能通过离散时间点的眼底检查评估病情，缺乏对血管连续成熟及潜在晚期复发风险的系统可视化工具。本研究旨在构建一种基于生成式AI的模型，通过合成不同受孕后年龄（PA）下具有解剖合理性的小儿眼底图像，实现对ROP发展轨迹的反事实模拟与预测。

研究采用以扩散模型为基础的反事实生成框架，通过预训练的扩散先验学习婴儿眼底图像的数据分布，并利用一个PA分类器提供梯度引导，使生成图像具备与特定PA阶段（30–34周、35–39周、40–44周）相符的形态特征。框架的质量取决于：扩散模型重建真实解剖结构的能力，以及分类器进行可靠区分的性能。报告验证集准确率，作为衡量模型学习到与年龄相关形态特征的指标，并以此评估引导过程的稳健性。

研究结果显示，该分类器在独立测试中取得64.4%的准确率，表明模型能够捕捉到与年龄相关的细微影像特征。尽管分类精度尚属中等，但其引导机制已能驱动扩散模型生成解剖结构连贯、符合临床认知的年龄演变图像序列，在不同PA组别间呈现出合理的形态过渡趋势。

研究人员得出结论，本研究所构建的模型能够基于用户指定的PA生成具有临床真实感的小儿眼底图像，为ROP的血管发育进程及晚期复发风险提供了直观的可视化分析工具。该技术不仅可用于医学培训与患者沟通，也为个体化治疗决策和病程模拟提供了新的方法论支持。未来工作将聚焦于前瞻性临床验证，并推动该模型与ime-to-event风险预测模型的整合，以进一步提升其在ROP动态评估与干预规划中的实用价值。

标题：A Post-Conceptional-Age-Conditioned Diffusion Approach to Visualize and Anticipate Retinopathy of Prematurity Progression

作者：Putu Emilia DEWI, Kadek Rina AGUSTINAWATI, Ni Wayan SEDANI

视神经炎临床问答的大语言模型评估：基于多模型比较的准确性与可读性分析研究

随着AI技术在医疗领域的深入应用，大型语言模型（LLM）正逐渐成为辅助临床决策和患者教育的新型工具。视神经炎作为神经眼科常见急症，其诊疗咨询对信息的准确性与完整性具有较高要求，然而目前针对LLM在此专科领域表现的系统性研究仍显不足。本研究系统评估了四种主流LLM聊天机器人——Claude-2、ChatGPT-3.5、ChatGPT-4.0及Google Bard在视神经炎专业问答中的实际表现，通过构建包含24个临床问题的评估集，邀请三位资深眼科专家从准确性、全面性两个维度进行三分制盲法评分，并采用四种标准化可读性量表对回答文本的阅读难度进行量化分析。

评估数据显示，在回答准确性（满分9分）方面，各模型表现存在显著差异：ChatGPT-4.0（7.62±0.86）、Google Bard（7.42±1.20）、ChatGPT-3.5（7.21±0.70）、Claude-2（6.44±1.07）。ChatGPT-4.0与Google Bard的准确性显著优于Claude-2（P=0.0006，P=0.0015）。质量分级结果显示，ChatGPT-4.0有62.5%的回答获评"优秀"，Google Bard为58.3%，明显高于Claude-2的29.2%（P均≤0.042）与ChatGPT-3.5的41.7%。另外，Claude-2与Google Bard均有8.3%的回答被评定为"不足"。在回答全面性维度上，各模型表现未见统计学差异（P=0.1531）。文本可读性分析表明，所有模型生成的回答均需具备大学及以上教育水平方可充分理解。

研究人员得出结论，当前主流大型语言模型在视神经炎专业咨询场景中已展现出差异化能力，其中ChatGPT-4.0与Google Bard在信息准确性方面表现相对突出。作为视神经炎临床咨询工具，LLM聊天机器人具备巨大潜力，但在正式部署前仍需进一步优化并建立恰当的评估策略，以确保其回答的可靠性与准确性。

讲题：Evaluation and Comparison of Large Language Models’ Responses to Questions Related to Optic Neuritis

作者：Han-Jie HE, Ling-Ping CEN, Wai Kit CHU

小结

在APAO 2026会议上，AI在眼科领域的创新应用成为备受关注的焦点议题。众多研究展示了从疾病预测到临床决策支持的全方位技术进展，突显了AI技术正在深刻改变眼科诊疗的传统模式。在技术快速发展的同时，建立科学的验证体系和临床应用规范至关重要。通过跨学科合作与严格的临床验证，AI有望为眼科疾病防治提供更加精准、个性化的解决方案，最终惠及广大眼疾患者。

来源：APAO 2026官网

声明：本文仅供医疗卫生专业人士了解最新医药资讯参考使用，不代表本平台观点。该等信息不能以任何方式取代专业的医疗指导，也不应被视为诊疗建议，如果该信息被用于资讯以外的目的，本站及作者不承担相关责任。