苹果的机器比 Bard 和 Bing 更智能地学习

带有 Siri 徽标的 Apple Park

在谈到苹果和热门新技术时,有一个古老的观点:如果该公司没有推出业界其他人目前关注的产品,那么它一定落后了。

这很少是事实。

苹果公司的业务就像众所周知的冰山一样:我们只看到了公司所做工作的一角,而其绝大多数研发工作都隐约可见于表面之下。看看它最近一个季度的财务状况就知道了:研发支出为 77 亿美元,占其全部运营支出的一半以上。

这个故事情节中的最新技术当然是人工智能。如果公司不尽快推出聊天机器人或图像生成器,如何在这个新兴市场中竞争? (没关系,它还没有发货虚拟现实耳机 –这是公司明显落后的最后一个市场。)

但是,正如这种特定谣言的情况一样,事实是苹果一直在以自己特定的方式开发人工智能,而不是为了追逐市场。

继续学习

苹果的人工智能工作有时被忽视的原因之一就是术语。虽然该公司并不经常谈论”人工智能”,但它确实花了很多时间讨论”机器学习”(ML),这是苹果许多最新技术的关键基础。

尽管机器学习在技术上可能只是人工智能的一个子集(甚至在这一点上也存在一些分歧),但这两个术语经常可以互换使用,至少在口语基础上是这样。 ChatGPT、Google 的 Bard 和微软的新 Bing 聊天机器人等工具背后的大型语言模型都利用了机器学习技术,DALL-E 和 Stable Diffusion 等图像生成器也是如此。从广义上讲,这些技术都涉及使用数据来学习和改进的算法。

苹果对机器学习的投资显而易见:2018 年,该公司聘请了谷歌机器智能主管 John Giannandrea 担任机器学习和人工智能战略高级副总裁,直接向蒂姆·库克汇报。它还运行一个罕见的面向公众的网站,其中 发表了大量机器学习研究成果,并积极赞助博士学位。奖学金、招募实习生并提供实习机会。它为开源机器学习项目做出了贡献,例如,优化 Stable Diffusion 软件以在其硬件上运行。 ChatGPT ChatGPT 等工具利用了机器学习技术。

以色列国防军

机器学习的核心

您可能会承认 Apple 对 ML 感兴趣,但也许您会加倍询问它通过所有这些投资实际生产了什么。

很多。如果您喜欢实时文本等功能(该功能可让您从照片或视频中选择任何文本),或者喜欢在照片库中搜索”狗”一词并实际查看所有狗的照片的功能已经采取,或者测试版实时字幕功能可以为从您的设备播放的任何视频或音频添加字幕,您将受益于 Apple 的机器学习研究。

该公司还创建了一个名为 CoreML 使开发人员可以轻松地将机器学习集成到他们的产品中,如果是的话还不够,那么请记住,自 2017 年的 A11 Bionic 以来,每一款 Apple 制造的处理器都具有专用的神经引擎,针对运行机器学习算法进行了优化 – 在最新的迭代中,它具有 16 个内核,可以运行令人震惊的 17 万亿次运算每秒,以典型的苹果方式,允许机器学习模型在您的设备上私下运行,而不是依赖于云服务。

如果苹果公司花钱将其处理器的很大一部分用于机器学习,那么它肯定是说到做到。

苹果实时字幕

实时字幕 Beta 版是苹果机器学习研究的一个例子。

苹果

冰山一角

苹果是否有更多机会扩大其机器学习足迹?当然。圆滑的答案是,Siri 经常表现不佳的表现可以通过你在最近的聊天机器人中看到的那种人工智能来增强——不过,考虑到与 微软最近的尝试,苹果似乎不会立即进入深度(学习)领域池。

但这些类型的系统保留上下文并以更流畅和人性化的方式进行通信的能力确实具有优势,可以而且应该融入苹果的虚拟助手,即使是以更加有限和受控的方式。

同样,如果 Apple 在令人印象深刻的 Whisper语音识别框架.

同样,这些并不像苹果许多竞争对手在市场上所做的那样华丽,但苹果也不必以同样的方式追逐这些功能。例如,谷歌和微软正在利用人工智能在搜索领域一决高下,而苹果并没有真正参与这个市场(尽管我几乎不会反对苹果使用一些底层技术来改进自己的设备上搜索)能力)。

最终,苹果对机器学习的使用更多地是出于如何增强用户行为的想法,而不是仅仅为了自身而存在。虽然这可能无法以同样的方式激发想象力,但它最终可能会对用户的生活产生更大的影响。在我看来,这让苹果在这场游戏中处于领先地位,而不是落后。