%title插图%num

目前,斯坦福大学的医学和成像人工智能中心(AIMI)正在大幅扩展已经是世界上*大的人工智能注释医学成像数据集免费存储库。

对于解释医学图像,人工智能已经成为一个越来越普遍的工具,从乳房X光片和脑部扫描中检测肿瘤,到分析人体心脏跳动的超声视频,人工智能几乎无所不能。

现在,许多人工智能驱动设备的精确度可与人类医生媲美。除了简单地发现疑似肿瘤或骨折外,一些系统还能预测患者的病程并提出建议。

但是人工智能工具必须在昂贵的图像数据集上进行训练,这些图像数据集需要经过人类专家的精心注释。因为这些数据集大概需要花费数百万美元来获取或创建,所以大部分研究都是由大公司资助的,而这些大公司不一定愿意与公众共享它们的数据。

“无论是外科医生还是产科医生,我们都必须承认,推动这项技术的是数据,我们想要强调,医疗数据是一种公共产品的理念,并且应该向世界各地的研究人员开放。”AIMI的联合主任、斯坦福大学放射学助理教授Matthew Lungren说。

两年前推出的AIMI已经获得了超过100万张图像的注释数据集,其中许多来自斯坦福大学医学中心。研究人员可以免费下载这些数据集,并使用它们来优化人工智能模型。

现在,AIMI已经与微软的AI for Health计划合作,推出了一个更加自动化、可访问和可视的新平台。它将能够托管和组织来自世界各地机构的大量图像。在这个策划中还预备创建一个开放的全局存储库。该平台还将提供一个共享研究的中心,以便改进不同模型和识别人口群体之间的差异。该平台甚至具备云计算能力,因此研究人员不必担心构建本地资源密集型临床机器学习基础设施。

%title插图%num

建立研究生态系统

这个想法是为人工智能医学研究创造一个完整的生态系统,而不仅仅是为了分析图像。有了正确的数据集,人们还将能够探索像素数据之外的重要临床用例,包括其他相关的多模态数据。

该中心已经有9个数据集,其中包含超过100万张图像,Lungren预测这一数字将在明年翻一番。新平台将发布两个新数据集。

他认为“这个平台将拥有世界上*大的、内容*丰富的人工智能医疗数据集”。

随着时间的推移,该平台还将提供标准化的机器学习工具和预先训练的模型,利用开源数据和通用架构(可以说是盒装AI软件)来推动众包AI研究。

%title插图%num

扩大关注领域

通过免费提供数据,研究人员将能够探索小众领域,例如影响特定社区的医疗问题,而大公司可能会忽视这些领域。

这些不同的数据集也将使研究人员更容易发现数据或算法中隐藏的偏差。研究表明,某些人工智能模型只针对其特定受众群,而对其他人群就没有那么准确了,这主要是因为它们是根据某一地点患者的数据进行训练的。而拥有来自许多不同社区的数据集将使研究人员更容易发现这些问题。

Lungren认为:“我们喜欢公司的这些工作,但事实上,分享信息的机会是不对称的,我们很反感这一点。如果他们收集数据,然后将其锁定,他们将是唯一能够创新的人,这将排除世界各地计算机科学家和临床医生的重要贡献。这不是我们想要的结果。”