'); })();

试管婴儿创业:人工智能的承诺与挑战

文章 (7) 2021-02-01 09:31:21

两年前推出的IVF风险项目的目的之一是,利用人工智能(AI)来重新设计体外受精(IVF),目的是使辅助生殖更加有效,数字化和可扩展。确实,一些最好的想法和最有趣的商业计划是机器学习的应用,以隔离和优化IVF程序的特定部分。

受到广泛关注的一个领域是使用计算机算法对IVF周期队列中的每个胚胎进行评分,并根据怀孕概率对它们进行排名。来自五大洲的企业家向我们发送了将这一想法付诸临床实践的商业计划。

这个想法是合理的,原型经过深思熟虑地精心制造。这些小组中的每个小组都做了出色的工作,但仍有许多工作要做。关于如何充分量化作为独立业务,平台的机会,以及AI在创建更好,更易获得的IVF中的总体作用,仍然存在疑问。

最根本的问题是:在胚胎选择中,人工智能比传统方法要好多少?改进值得吗?

让我们从评估产品开发开始。据我了解(而且我还不是一位数据科学家,欢迎评论和滥用),该算法是在回顾性数据集上进行训练的,查看成千上万被选择用于移植的胚胎,然后评估结果与观察到的模式并通过强大而复杂的成像方法进行分析。基本假设是计算机看到了我们看不到的东西,要么是因为我们缺乏检测这些模式的视觉敏锐度,要么是因为我们还没有弄清楚要看的地方,要么是因为众多观察值之间的相互关系的复杂性超出了我们的处理能力。

我首先担心的是,由于最初的训练集是基于已经转移的胚胎,并且这些胚胎是根据我们试图改进的标准选择的,因此我们在最早的阶段就将偏见引入了该过程,在计算机上找到新的影响决策的输入,但只能从已经包含旧决策参数的一组胚胎中找到。

我确信,随着算法的前瞻性检验其假设并重新确定其决策标准,机器学习的后续周期将逐渐减小初始偏差的影响。是否可以通过向数据集中输入更多的周期来加快算法生成的缓慢开始,还是将不同诊所的不同胚胎选择方法结合起来会受益?

除了推导算法的机制外,评估用于胚胎选择的AI的挑战还凸显了需要验证我们一些长期存在的假设,以及回填我们整个行业运营模型中的某些空白。最基本的假设是,在胚泡阶段,通过协议进行的胚胎选择必然比随机胚胎选择更好。

从细胞阶段到原始阶段的过渡本身就是对胚胎质量的压力测试,前提是要有足够的培养条件。大量医学文献比较了不同的培养基,并比较了第3天和第5天的转移,但是我不知道有任何研究比较单个胚泡的随机选择与根据已达到该阶段的胚胎从实验方案中选择的比较。(如果我错过了回答该问题的开创性论文或摘要,请纠正我。)

理想的前瞻性研究应包括三个部门,每个部门用于诊所的护理标准,随机选择和基于算法的选择。这三个之间的结局是什么?如果我们要解决的是每名婴儿的成本和到婴儿的时间,那么这些改善百分比的数字对于量化每位患者的成本节省以及采用新技术可以使整个行业成功治疗的额外患者数量至关重要。

广义上讲,评估AI在胚胎选择中的价值主张突出了一个更广泛的IVF数据问题。在第一个成功周期的四十年后,IVF的工程不足,在很大程度上与可衡量的终点缺乏相关,我们可以使用这些可测量的终点来隔离和评估对单个结果有长期贡献的特定步骤:怀孕或不。从以下列表中进行决定:启动卵泡刺激的决定,每日调整药物剂量和触发成熟的时机,取卵和受精卵准备过程中的机械步骤,精子制备的机理,精子注射技术的变化(ICSI) ),培养,胚胎操作和活检,胚胎选择以及胚胎移植的难度和机制,

硬中间数据的这种稀缺性使得很难在没有大量观察的情况下分离出单独的决定和干预措施,考虑到在特定诊所甚至特定国家进行的IVF量,这可能是不现实的。IVF患者的异质性,以及从一个IVF计划到另一个计划或同一计划中不同临床医生之间通常不一致的决策标准(例如,是否使用ICSI),使这个问题更加严重。

也就是说,机械化程序的逐步合并和数据驱动的合理决策是创建可扩展的IVF行业的必要条件,该行业具有足够的能力来有效满足尚未接受治疗的大量患者的需求。值得庆幸的是,这些早期AI项目背后的企业家们对这次爬升到验证的前景并不感到畏惧。

有解决这些挑战的方法。例如,植入前遗传学测试的加入,例如,为“信任算法”接受了机器学习在翻译成千上万个“囊胚图像分析”时所施加的复杂标准,从而增加了硬数据点(整倍体与非整倍体)每个胚胎的相关性与妊娠结局”相关联,成为个体治疗建议。

验证的另一个潜在来源是通过交叉引用从胚胎发育的延时成像获得的信息。关于单个静态图像分析与动态形态动力学数据的相对益处的持续争论可能会表明这两种方法是互补的,它们的益处是相加的。如果是这样,将两者结合的AI可能更有效地预测结果,并且通过将静态图像特征与可识别的生长异常(例如单个细胞的优势)相关联,可以为算法的经验结论提供生理相关性。

还可以放心:数据集的多变量复杂性是一个可解决的数学问题,可以通过增加数据集的大小来解决,假设可以合理估计每一步结果的潜在贡献变化。这表明IVF的数字化和优化步伐在很大程度上取决于能否处理非常大且特征非常丰富的周期数据。一旦分析了足够的数量并采用了初步的算法,人工智能系统便会从自身中学到东西,从而启动持续的质量改进过程。

但是,到目前为止,达到临界质量是限制步骤。相对于可以从最大的IVF程序中收集到的IVF数据量而言,用于训练原型算法的周期数很大,但对于“大数据”目的而言仍然相对较小,这意味着需要汇总几个或多个诊所的病人在一起。

这有两个问题。

首先,IVF实验室不会讲通用语言。各地的周期数据记录不一致,胚胎评估缺乏通用的描述性词汇,更不用说可重复且一致的数字语言了。

其次,由于AI甚至在“低垂果实”的首次应用(即胚胎评估)中,都在细胞水平上收集和分析数据,因此每个胚胎都在数据库中占据了自己的系,需要唯一的标识符,并且目前没有系统可以将不同诊所的样本合并为统一可访问和可分析的形式,从而消除了重叠和重复标识的风险。因此,采用标准化的标本级数据收集系统是合理而必要的步骤,然后才能在IVF中有效使用AI。

人工智能将成为体外受精过程中不可或缺的一部分,从执行不一致,资源效率低,劳动强度大的过程到流程优化和工程化的行业,这一行业可以充分照顾非常大的,尚未解决的患者群体有需要。

 

THE END

发表评论