国际眼科时讯

APAO前沿追踪丨从研究到临床：多项研究展示AI优化眼科诊疗流程的实践路径

2026-02-07 17:03:00
80 Views

编者按：在数字技术与医学深度融合的今天，人工智能（AI）正在重塑眼科诊疗的格局。在第41届亚太眼科学会年会（APAO 2026）上，多项研究生动展现了AI技术与眼科这一精细学科交叉融合的最新进展。从青光眼的结构参数评估，到糖尿病性视网膜病变的智能化筛查，再到基于多模态信息的辅助分诊，相关研究不仅体现了技术创新，更蕴含着优化诊疗流程、提升服务可及性的现实关切。

系统综述：AI在青光眼诊断中的准确性评估

青光眼是全球不可逆性失明的主要病因，其防治关键在于早期精准诊断以启动有效干预。AI技术通过分析多种眼部成像模态，为辅助青光眼诊断提供了极具潜力的工具，备受关注。

研究人员进行了一项系统综述，旨在全面评估基于AI的青光眼诊断系统的准确性，并深入剖析其诊断性能。研究人员检索了Cochrane、PubMed、MEDLINE及EMBASE等主要医学数据库，采用预设检索策略进行文献筛选。由评审人独立完成文章筛选与数据提取，内容包括研究设计、样本量、所用AI算法、成像模态及诊断准确性指标。

经筛选，共8项研究符合纳入标准。所采用的AI技术涵盖传统机器学习、深度学习及卷积神经网络。诊断所依据的成像模态主要包括眼底照相、光学相干断层扫描（OCT）及视野检查。所有研究均将视网膜神经纤维层缺损（RNFLD）作为核心判读特征。各模型的诊断敏感性差异较大，介于64.0%至96.2%之间。

结论

基于AI的模型在青光眼诊断中展现出良好的应用前景与诊断效能，但其敏感性在不同算法与模型间存在差异。

标题：Artificial Intelligence Accuracy in Glaucoma Detection: A Systematic Review?

作者：Randy KINDANGEN, Yeni LESTARI, Astrianda SURYONO

AI在糖尿病性视网膜病变筛查中的应用

糖尿病性视网膜病变（DR）是导致工作年龄人群视力损害的主要疾病，早期筛查对延缓病情进展至关重要。尤其在农村等医疗资源相对匮乏地区，基于视网膜影像的远程筛查技术可显著提升服务可及性，实现更高效的大规模人群覆盖。

研究共随机纳入400名参与者，其中DR患者与健康对照组按1:4比例分配。收集所有参与者的眼底图像，采用AI筛查软件进行分析，并将其结果与眼科医生的临床诊断进行比较。通过受试者工作特征（ROC）曲线评估该系统的诊断效能，并计算其敏感度与特异度。

参与者平均年龄为56.48±9.4岁，两组间性别分布无显著差异（P=0.089）。该AI软件的敏感度与特异度分别为92.4%和94.7%，ROC曲线下面积达0.987。经第二位专家复核后，在图像层面的DR识别敏感度与特异度分别提升至91.0%和95.4%。

结论

与眼科医生诊断相比，该AI软件在DR早期筛查中展现出更高的敏感度与特异度，且具有成本效益高、筛查效率高的优势。该AI软件在特异性、敏感性及综合诊断效能方面的表现，支持其在DR早期筛查中的临床应用价值。

标题：Artificial Intelligence for Detection of Diabetic Retinopathy

作者：Bayasgalan PUREVDORJ，Tumenjargal TUMENBAATAR

多模态大语言模型在眼科分诊中的应用

在当前眼科专科医师资源有限而疾病负担持续增长的背景下，由非专科医师承担眼科分诊工作面临显著挑战。

研究构建了一种融合临床文本与眼部影像的多模态大语言模型（LLM）框架，通过引入幻觉检测与思维链推理机制，旨在提升模型在眼科分诊中的诊断准确性。研究使用新加坡一家重组医院的41例真实眼科临床病例作为数据集，并通过缩写展开、句子重建与幻觉检测对数据进行预处理。为克服样本量有限及病种覆盖不足的问题，额外利用GPT-4基于单样本提示生成包含100例眼科病例的合成数据集，并通过语义相似性分析及眼科专科医师人工审核确保其可靠性。模型诊断方式分为三类：仅基于文本、文本联合图像、以及结合思维链推理的文本-图像分析。通过基于有向无环图的差异度量方法，将模型预测诊断与参考诊断映射至SNOMED-CT标准化术语，进而计算差异分数以量化两者间的语义距离。

合成数据集覆盖眼前节疾病（40例）、眼后节疾病（35例）及眼外疾病（25例）。实验结果显示，纯文本方法的平均差异分数为6.353±1.685，加入图像信息后降至5.235±1.305。在影像特征重叠或图像质量不佳的病例中，思维链推理进一步提高了诊断的准确性。

结论

融合多模态输入可提升眼科分诊诊断的一致性，而思维链推理机制有助于缓解因影像模糊所导致的误判。本研究提出的框架有望发展为一种可靠的眼科分诊辅助工具。

标题：Evaluating a Multi-Modal Large Language Model for Ophthalmology Triage

作者：Caius GOH, Wei Yung AU, Xiuyi FAN, Kelvin LI, Alva LIM, Jabez NG, Clarence SEE

眼科住院医师与AI在垂直杯盘比评估中的准确性比较

垂直杯盘比增大是青光眼诊断的重要结构指标，但其人工评估较为耗时，可能影响临床诊疗效率。本研究旨在比较深度学习模型与眼科住院医师在垂直杯盘比测量中的准确性。

研究从一项人群队列中随机选取80人（共160张眼底图像），分别由两名不同资历的眼科住院医师（二年级与四年级）和一位青光眼专科医师采用标准化方法进行垂直杯盘比评估。青光眼专科医师的评分结果作为金标准。深度学习模型在同一数据集上进行测试。根据误差阈值（≤0.1、0.1–0.2、>0.2）评估模型与住院医师测量结果与金标准的一致性，重点关注误差≤0.2的临床可接受标准（该阈值在眼高压相关研究中被定义为评分者间一致性界限）。

结果显示，深度学习模型与金标准的一致性最高，95.6%（n=153）的样本误差≤0.2（其中≤0.1为75.6%，0.1–0.2为20.0%），略优于四年级住院医师（94.9%，n=152；≤0.1为83.1%，0.1–0.2为11.8%）和二年级住院医师94.4%，n=151；≤0.1为76.3%，0.1–0.2为18.1%）。McNemar检验表明，各组间差异均无统计学意义（P≥0.80）。

结论

深度学习模型在正常人群垂直杯盘比评估中表现出与金标准高度一致的结果，其准确性不低于眼科住院医师。该结果有待在本地青光眼患者群体中进一步验证。若在临床人群中获得类似表现，该模型有望成为辅助识别青光眼疑似病例的高效工具。

标题：Are Ophthalmology Residents or Artificial Intelligence Better at Grading Vertical Cup-to-Disc Ratios?

作者：Eunice GOH, Bryan Chin Hou ANG, Kelvin Zhenghao LI, Sheng Yang LIM, Kok Yao LOW, Vivien Cherng Hui YIP

小结

AI正逐步成为眼科精准医疗的关键支撑。它在多种眼病的筛查与诊断中展现出媲美甚至超越人工的效能，同时在分诊与辅助决策方面显示出巨大潜力。随着技术迭代与临床验证的深入，未来有望构建人机协同的新型诊疗模式，真正赋能基层，提升眼健康服务的可及性与质量。

来源：APAO 2026官网

声明：本文仅供医疗卫生专业人士了解最新医药资讯参考使用，不代表本平台观点。该等信息不能以任何方式取代专业的医疗指导，也不应被视为诊疗建议，如果该信息被用于资讯以外的目的，本站及作者不承担相关责任。