AI是更实惠和可用的实时转录的关键

文章 (136) 2021-03-25 15:25:55

许多具有无障碍思想(或授权)的组织认为实时转录服务是现场活动的必备条件。如何确保每个服务人员都能跟上情况,尤其是那些聋哑或听不清的人?

还有其他理由来抄写言论,而无障碍获取,例如保存法院和立法机构的诉讼记录。但是,将语音实时转换为文本并不容易。因此,做得好的人会要求溢价,而且需求量很大。那些使组织没有预算来聘请此类专业人员或那些在活动当天找不到任何可用人员的人会从哪里去呢?

与以往一样,技术提出了一种解决方案-在这种情况下,是自动实时转录。许多人心中的问题是,该解决方案是否能够兑现其承诺。

每当谈论转录时(无论是机器供电还是其他方式),都必须进行澄清。许多公司使用了所谓的后期制作转录服务。这些服务的工作方式如下:您提交媒体文件,该文件通过自动转录软件放置或传递给人类进行转录。无论哪种情况,最终的交付物都是笔录,其质量将取决于软件的功能或笔录人员的勤奋。

当今可用的大多数转录解决方案都用于后期制作,因此不适合现场直播。机器需要打包的媒体文件才能工作。与实时完成相同任务相比,人类能够倒带语音并完善笔录,从而可以提供更高质量的工作。然而后期制作服务和解决方案占主导地位,加深了公司在实时转录市场上的困难。

AI驱动的实时转录

确实存在实时运行的自动转录解决方案。语音支持服务的普及极大地受益于它们的发展。例如,搜索引擎现在使您可以用语言表达查询而不是键入查询,在具有狭窄触摸屏的移动设备上,前者通常是更可取的。

支持此类服务的技术与支持自动转录解决方案的技术相同。不同之处在于后者以文本形式输出人类语音可能含义的结论。

谷歌,亚马逊,IBM和其他知名公司已经发布了语音识别API,开发人员可以使用它们来构建自动实时转录解决方案。这些API提供了解决许多公司在确保实时转录服务方面面临的成本和供应障碍的途径。但是,这种方法的实用性取决于它们与人类相比的性能。

这些结果对需要实时转录服务的企业和其他组织意味着什么?现在,会议演讲,大学演讲,教堂讲道和其他实时开展的活动都可以负担得起且广泛使用的转录方式。

此类解决方案已经存在,为长期的实时转录挑战提供了解决方案。例如,出于预算原因,不再需要只转录会议的一部分(例如主旨演讲),而不必转录整个计划。

如果您准备将自动实时转录添加到事件中,那么您在解决方案中应该寻找什么?始终牢记您希望实现的目标。对于典型的现场活动,您可能希望能够在室内监视器上显示实时转录,或从场所的PA系统引入音频。并非每个解决方案都可以做到这一点或使其变得容易。例如,移动应用程序更适合于记录一对一的采访,而不是使会议更容易访问。

另外,请注意解决方案的复杂性。谁将在活动当天负责该解决方案,他们的专业技术水平是什么?特别是专用设备可以使设置和操作非常简单。

更多可用性意味着更多可访问性

不仅组织可以从更实惠和可用的实时转录中受益。真正的赢家是那些有听力障碍或母语与他们参加的活动所使用的母语不同的人,或者是现场活动中坐在容易聊天的人附近的人。在此类情况或更多情况下,实时转录只能增进理解和享受。

THE END

发表回复