苹果的数字旁白让人工智能语音为你朗读一本书

Apple 数字旁白

如果您是 Apple Books 的爱好者,有一个新功能可能会让您感兴趣或感到害怕:Apple 宣布推出新的 数字旁白 项目使用人工智能创建有声读物。由于有声读物市场正在爆炸性地流行,但实际上只有一小部分书籍被转换为音频,苹果的新技术提供了一种方法来消除与创建人类录音相关的”成本和复杂性”。

该项目的第一个公开结果已在 Apple Book Store 上发布。如果您打开”图书”应用程序并搜索”AI 旁白”,您会发现几十本标记为”Apple Books 旁白”的小说和爱情小说。点击该标签,您就会被告知这本书是否会由用于这些流派的数字女高音”麦迪逊”或相当于男中音的”杰克逊”朗读给您听。据说两者都是基于真实的人类叙述者,但音频是使用人工智能生成的。

关于Apple 网站,您还可以聆听来自”Helena”和”Mitchell”的样本,他们是非小说类和自我类作品的数字声音。开发类型,但这些尚未用于任何公开提供的有声读物。

苹果向我们保证,这些声音是”先进的语音合成技术以及语言学家、质量控制专家和音频工程师团队的重要工作的结果”,但很明显,麦迪逊和杰克逊最吸引人的品质是他们的效率。录制真人旁白需要几周的时间,可能要花费数千美元,并且需要经验丰富的配音艺术家或名人(或者越来越多的作者)在场,这就是为什么这么多书籍仍然是纯文本的原因。人工智能方法极大地提高了流程的成本效益。

但是真的有效吗?我听了克里斯汀·埃斯里奇(Kristen Ethridge)的《避难所》的前几页,被它听起来多么不人道所震惊。 “麦迪逊”听起来不太像一个人,并且无法令人信服地使她的讲话模式适应文本内容。也没有无形的人类情感品质可以帮助听众保持参与。我不断地走神,将声音作为背景噪音过滤掉。

这项技术无疑正在进步,可能会在几年内取代人类配音演员,但目前还没有实现。很明显,在快速制作、读者群较少的书籍中,自动化旁白过程将节省大量资金,但同样明显的是,为什么苹果公司在为更受瞩目的图书推出这一功能时持谨慎态度,并强调突出移动一般。据我们所知,该项目还没有标准新闻稿,苹果公司似乎更多地将其宣传针对作者和出版商,而不是媒体网站或公众。

那些作者可能不太热衷于这个想法。正如 Guardian 指出,这一策略必须应对除读者以外的许多利益相关者的批评。该报联系的一位有声读物制作人和一位文学经纪人都谈到了高质量叙述所提供的价值,并对该项目表示了一定程度的怀疑,但更严重的保留意见可能来自政治或法律实体。通过这项新服务,苹果似乎开始涉足有声读物的创作而不仅仅是销售,这将为反竞争行为的指控开辟新的战线。