MAI-DxO系统助力医疗诊断革新 :Microsoft新推出的MAI-DxO系统,旨在提升复杂医疗案例的诊断精准度。研究团队在论文中表明,该系统在处理复杂案例时,准确性和成本效益远超人类医生。
独特测试评估系统性能 :为评估MAI-DxO系统,团队创建了Sequential DiagnosticBenchmark(SDBench)。此测试模拟真实临床决策的渐进过程,与传统医疗AI测试不同,它并非一次性提供所有信息。测试案例源于《新英格兰医学杂志》的304个复杂案例,使用“gated模型”控制信息发布,还能生成合成测试结果。
对比测试凸显系统优势 :测试中,美英21位经验丰富的医生诊断准确率为19.9%,平均每例成本2963美元。而MAI-DxO结合OpenAI的o3模型,准确率达79.9%,平均成本2397美元。尽管o3模型在标准模型中准确率最高达78.6%,但平均成本高达7850美元。MAI-DxO不仅提高了诊断准确率,还将成本降低了近70%。
虚拟医生团队提升性能 :MAI-DxO通过模拟虚拟医生团队来增强性能,团队包含“假设医生”“测试选择医生”等不同角色,防止系统过早锁定单一假设。
系统存在一定局限性:研究人员也承认SDBench仅基于复杂教学案例,未反映日常常见疾病分布。成本计算为粗略估计,未考虑现实多种因素。且参与测试的医生为全科医生,评估未使用外部资源。
© 版权声明
文章版权归作者所有,未经允许请勿转载。