苹果收购 Xnor.ai 如何为我们期待已久的 Siri 带来提升

siri ios13

苹果公司在一年中收购了很多公司,但只有少数公司达到了令人感兴趣的新闻水平。去年收购英特尔智能手机调制解调器业务的交易当然符合条件,2018 年收购 Shazam 也符合条件,但在大多数情况下,苹果会因为我们永远不知道的原因而选择了我们从未听说过的公司。

其最近的收购可能有所不同。您可能没有听说过 Xnor.ai 这家公司,但他们却并不陌生。自去年夏天以来,这家总部位于西雅图的初创公司的技术一直是广受欢迎的 Wyze 摄像头的核心功能:人员检测。简而言之,它使这款 20 美元的相机能够区分人脸、宠物和灰尘,并极大地提高了其能力,使其与世界上昂贵得多的 Ring 和 Nest 相机形成了一定的公平竞争环境。

wyze 凸轮运动跟踪 Wyze 实验室

Wyze 的人物检测完全在设备上运行,因此无需担心视频被黑客攻击。

但这不仅仅是 Xnor.ai 的引擎在廉价摄像机上运行,​​而是它的工作方式。它不仅极大地提高了小型录音机的功能,而且还考虑到了隐私。使用名为 Edge AI 的技术,Xnor.ai 能够在相机本身上处理其算法引擎,这意味着它不需要将图像传输到遥远的云端。

这切入了苹果公司主要的隐私论点。我们长期以来一直怀疑 Siri 落后于 Google Assistant 和 Amazon Alexa 的原因是苹果没有收集与这些公司相同类型的信息,因此处于劣势。谷歌和亚马逊可能提供切换隐私设置的能力,但核心商业模式依赖于数据收集。当您有大量数据需要处理时,尤其是在与数百万用户打交道时,改进人工智能处理会更容易。但也许不一定是这样。

Siri 安全无恙

这就是 Xnor.ai 的用武之地,这也可能是苹果认为它值得数百万美元的原因。我不认为 Siri 的发展(或缺乏发展)是苹果公司萎靡不振或缺乏关注的结果,而是人工智能引擎的能力所致。 Apple 希望在设备上处理尽可能多的数据,但现实是,在 Siri 的规模上这是不可能的,至少在没有一点帮助的情况下是不可能的。

这并不是因为缺乏处理能力。苹果的 A 系列 Bionic 芯片确实有能力。 iPhone 11 上的 A13 拥有比以往更快的神经引擎和一组机器学习加速器,可以处理比以往更多的任务,但它仍然仅限于设备特定的实际应用,例如电池效率、功耗和图形加速。

apple a13 ml 控制器 苹果

A13 Bionic 芯片已经拥有强大的神经引擎,但 Edge Ai 可以将其提升到一个新的水平。

但 Xnor.ai 的 Edge AI 引擎可能会将一切整合在一起。我们不太可能在 iPhone 12 甚至 iPhone 13 中看到苹果的收购带来任何成果,但苹果令人难以置信的芯片进步,再加上 Xnor.ai 带来的设备上人工智能处理,可能会增强 Siri 在以下方面的功能:大路。通过神经引擎或新的协处理器将 Edge AI 嵌入到苹果自己的芯片中,Siri 可以更快、更强大,从你所做的事情中学习并确定任务的优先级。而且这一切都可以离线工作,利用苹果片上系统的巨大力量,并在设备上完成强大的云的工作。

Xnor.ai 估计,Edge AI 的运行速度是基于云的系统的 15 倍,内存为云系统的 10 倍,而专用于每部特定手机的响应式助手最终可以让苹果构建一个近乎完美准确度的语音识别系统。我们多年来一直在等待 Siri 能够区分不同用户的声音等基本功能,而 Edge AI 可以更好地理解每个用户的特定节奏。毕竟,我们已经知道 Xnor.ai 的 Wyze AI 能够区分人和宠物,因此用于区分声音应该不会那么困难。仅此一点就将有助于缩小 Siri、Google Assistant 和 Amazon Alexa 之间的差距。通过直接在我们的手机上构建强大的人工智能引擎,Apple 可以使用 Siri 做我们希望它做的事情,而不会损害我们的隐私。

同样的引擎可以应用于语音模式。 Siri 听写一点也不差,但说”句号”和”逗号”就很乏味了。边缘人工智能可以识别我们的声音模式,因此当我们以某种方式暂停时,它会添加一个句号,或者如果我们改变语调变化,它会添加一个问号。

wyze cam v2 Hero Wyze 实验室

如果 Xnor.ai 可以用 Edge AI 改造一台 20 美元的微型摄像头,想象一下它能为 Siri 和 iPhone 带来什么。

让我们更进一步。假设您正在与朋友发短信,他们询问看电影。这可能会触发 Siri 在你的对话中悄悄建议即将到来的放映时间。或者,如果您在 Safari 中复制链接,智能建议甚至可以在您按下共享按钮之前立即呈现一系列应用程序。这些是苹果永远不会在云中做的事情——整个what-happens-on-your-iPhone-stays-on- your-iPhone 的东西,但通过使用 Edge AI,Apple 可以将此类交互带到 iPhone 本身,从而为 Siri 开启了一个新的功能世界。

如果它在设备上学习,那么它就可以知道我们正在使用哪个应用程序并做出相应的响应。因此,如果我们在照片中,我们可以说,”与我的妻子分享这个”,并且不需要任何额外的说明。或者,如果我们正在 Safari 中阅读一篇新闻文章,我们可以说,”告诉我更多有关此内容的信息”,它就会进行适当的搜索。或者也许可以根据我们的应用习惯建议自动例程。

底线:Siri 有很多事情不太清楚该怎么做,Xnor.ai 的 Edge AI 引擎可以帮助教授它。同时保持苹果的隐私承诺完好无损。对于 Wyze cam 用户来说不幸的是,Xnor 的 Edge Ai 系统已被撤下,但他们的损失可能是 Siri 的收获。