重磅分享!人工智能医疗器械软件可靠性评测研究进展
随着计算机技术在医疗领域的广泛应用,软件在医疗服务中的地位和作用越来越突出,对公众生命、健康、财产、信息安全的影响也越来越大。同时,人工智能技术与医疗器械软件的结合,使针对产品的有效性与安全性的评估日趋复杂。其中,,可靠性是衡量人工智能医疗器械软件质量的一个重要维度。
一方面,目前的软件规模与内部架构日趋复杂,计算框架、组件、数据充满变化,产品的可靠性越来越难保证。根据国外公布的数据,每年由于软件原因导致的医疗器械召回事件有上百次,影响临床对产品的接受度,也为监管和质量评价敲响警钟;
另一方面,临床应用场景对软件运行的可靠性要求越来越高,随着软件智能化、自主化程度的提升,软件可靠性对患者和操作者的安全及权益的影响程度也越来越大。医疗器械软件可靠性的评测已经成为人丁智能医疗器械软件质量评价的重要环节之一。本文旨在概述人工智能医疗器械软件可靠性的评测现状,为业内提供参考。
人工智能医疗器械软件可靠性概念
根据2020年起草的行业标准《人工智能医疗器械质量要求和评价第1部分:术语》中的定义,可靠性是指在规定时间间隔内和规定条件下,系统或部件执行所要求功能的能力。人工智能医疗器械软件的可靠性关注产品在规定的条件下和规定的时间区间完成指定临床功能的能力。规定的条件是指直接与软件运行相关的使用该软件的计算机系统的状态和软件的输入条件,或统称为软件运行时的外部输入条件:规定的时间区间是指软件的实际运行时间区间;指定临床功能是指为用户提供给定的医疗服务。
人工智能医疗器械软件功能的可靠性包含成熟性、可用性、容错性、易恢复性等方面。成熟性是指软件产品在满足要求的软/硬件环境或其他特殊条件下(如一定负载压力下)使用时,为用户提供相应服务的能力,如软件的故障密度、缺险严重程度、完整性级别等。可用性是指软件在使用时能够进行操作和访问的程度,它是成熟性、容错性和易恢复性的组合。容错性是指软件在由干非法数据,非法操作,误操作等原因导致无法正常运行和参数传递错误的情况下,软件能否为用户提供相应临床功能服务的能力。易恢复性是指软件发生失效的情况下,采取何种措施重建为用户提供相应临床服务和恢复直接受影响医疗器械数据的能力。
人工智能医疗器械算法的可靠性强调算法在规定条件下的可重复性,即对同一输入的响应和输出保持不变。人,智能医疗器械算法的可靠性强调算法在规定条件下的可重复性,即对同一输入的响应和输出保持不变。根据相关文献,聚类分析、深度学习等算法分支都报道过可重复性方面的问题,因此在测试阶段需要引起重视,不能掉以轻心。
人工智能医疗器械软件可靠性的技术实现
人工智能医疗器械软件可靠性,建立在以下四方面的活动和有关技术基础上:
(1) 软件可靠性分析:进行软件可靠性的需求分析、指标分配、故障树分析、故障模式和影响分析、软件开发过程中有关软件可靠性的特性分析等;
(2) (2)软件可靠性设计和实现:进行防错设计、容错设计、检错设计、纠错设计、故障恢复设计、软件可靠性增长等;
(3)软件可靠性测量,测试和评估:在软件生存周期各阶段进行有关软件可靠性的设计,制造和管理方面的属性测量,进行软件可靠性测试、软件可靠性预计、软件可靠性估计、软件可靠性验证等;
(4)软件可靠性管理:确定影响软件可靠性的因素,制定必要的设计和实现准则以及对软件开发各阶段软件可靠性相关的过程和产品的要求,对有关测试数据和分析结果控制和改进开发过程,进行风险管理要考虑安全性等技术风险,对采购或重用的第三方软件进行可靠性管理等。
上述活动也包含着对人工智能算法模型本身的可靠性评价。制造商需要根据临床应用场景,在研发和产品验证阶段评估人工智能算法正确执行临床功能的运行时间和运行条件,积累先验的数据。
人工智能医疗器械软件的可靠性验证方法是为了验证在给定的统计置信度下,软件当前的可靠性水平是否满足临床用户的要求而进行的测试,即临床用户在接收软件时,确定它是否满足软件规格说明书中规定的可靠性指标。该种方法一般是在软件验收阶段进行的,在软件需求方参与的情况下实施。其主要过程是根据实际临床使用场景测试的故障情况,利用某种或某些软件供需双方都认可的可靠性验收模型进行可靠性的定量评价,以判断该软件是否达到了其需求说明书中约定的可靠度。