嘿 Siri,苹果是否正在放过另一个人工智能机会?

Apple 徽标 AI 图形

ChatGPT 是科技界最近可以谈论的所有内容,并且有充分的理由。这种人工智能驱动的工具令人印象深刻,但也存在很多担忧——版权侵权、抄袭、在课堂上使用,甚至失业,所以难怪那些以写作为生的人会强调人工智能看似可以写得很好。但也有一些抱有幻想的科技公司看到了未来——计算机能够自然地对话并创建企业可以实际使用的内容,其规模、速度和成本是人类无法比拟的。

但是 ChatGPT,Google Bard 和 Microsoft 的 Bing 聊天只是生成式 AI 革命的一小部分。在过去的一年里,艺术界一直在热议新的生成式人工智能艺术工具,并对同样的问题感到担忧——偏见、版权、失业等。Deepfakes 就是其中的秘诀,神经网络以惊人的真实感替换视频中的人物。冰山一角。

这些工具不仅仅是昙花一现。他们还处于婴儿期,并且进步得非常快。像谷歌和微软这样的大型科技公司将这种新的生成式人工智能视为我们未来的重要组成部分。对他们来说,提出主张并建立领导地位就像在 90 年代统治网络一样重要。

但是有一个玩家没有参与其中:苹果。地球上最有价值的科技公司似乎完全错过了一场彻底的计算革命。苹果对人工智能并不陌生——它通过 Siri 引发了一场助理革命——但它也已经因为没有投入足够的资金来抵御竞争对手而浪费了自己的领先地位。

生成式人工智能的历史会重演吗?还是苹果公司有一些令人惊奇的东西,只是像往常一样保持着令人难以置信的秘密?

人工智能分析是旧的,人工智能创造是新的

多年来,所有最大的科技公司都在热衷于人工智能。人工智能可以分离和解析您的语音以进行听写和语音助手,并可以区分不同的声音以获得个性化结果。人工智能将录制的声音拼凑起来与你”交谈”。 AI隔离图像的各个部分以轻松编辑它们。人工智能可以识别物体和人物,为您的搜索提供支持。 AI 可让您选择任何图像中的文本

苹果做所有这些事情。这对公司来说非常重要,他们在所有芯片中构建了神经引擎,这是加速此类机器学习任务的专用硬件。苹果甚至正在致力于解决最大的人工智能挑战,自动驾驶汽车

但是生成式人工智能则是另一回事。这是一类较新的人工智能,几乎不需要文本输入就能创造出全新的东西。是的,训练模型需要大量的时间和大量的数据,但是用户将运行的那些模型相对较小,并且似乎可以产生无限量的新东西。可以找到照片库中所有土豆的人工智能与可以从头开始以各种艺术风格绘制土豆的人工智能完全不同。

Bing.com 主页 微软通过必应聊天进入了生成式人工智能游戏。

马克·哈赫曼 / IDG

ChatGPT、Bard 和 Bing

目前成为头条新闻的生成人工智能技术是ChatGPT 来自 OpenAI。高级聊天机器人以及基于其构建的工具已经在商业领域中使用,以生成文章、电子邮件、模板等,一些争议。学生们正在使用它在一个小提示下写出整篇论文,而且结果足够好,以至于人们竞相开发好的工具,让教师识别 ChatGPT 撰写的作业。

因为它是用大量网络数据进行训练的,尽管这些数据已经过时,但仍然与许多事情相关,所以它几乎就像您与之交谈的搜索引擎。这让 Google 非常震惊,以至于它宣布了自己的竞争对手对话式 AI 产品,Bard,它还没有准备好让世界尚未尝试,但很快就会推出。 公开演示提供了有关詹姆斯·韦伯太空望远镜的错误信息,因此谷歌显然需要努力做。

微软还宣布推出新的对话式搜索功能,您现在就可以在 Bing 和 Edge 浏览器中开始使用。它基于 ChatGPT 构建,并进行了一些增强和修改。

这些不仅仅是玩具或好奇心。这些是人们用来做实际工作和推动创意项目的真实工具。这一切都还处于早期阶段,有时感觉还没有为整个世界做好准备,但改进和创新的步伐是惊人的——人工智能模型的复杂性和复杂性每六个月就会翻一番。

稳定扩散、中途、DALL-E

这不仅仅是书面文字。我们都用 DALL-E 2 去年,但随着进一步的培训和增强,这些生成式 AI 艺术工具已经变得非常有用不仅仅是制作动漫风格的猫头顶鱼缸水肺潜水的图像。

中途稳定扩散已经变得非常好,他们正在创造可以轻松为杂志封面增色的艺术 – 并且可以几分钟内就可以生产出几十个。

这些工具的用途不仅仅是制作各种风格的全新图像。他们可以改变输入图像。 App Store 中已经充斥着头像和个人资料制作应用程序,这些应用程序使用该软件拍摄几张脸部照片,并通过改变身体特征以令人惊叹的方式对其进行修改,而无需任何人知情。比如戴上看起来完全真实的太阳镜。

去年它还只是一个噱头,但现在技术发展如此之快,它已经是一个工具了。 Adobe 已经使用人工智能驱动的图像生成工具改进了许多应用程序,以实现一键照片恢复和大幅改进的对象删除。但该公司计划很快将重要的生成式人工智能添加到其工具集中,让您可以将图像插入到现有的照片和艺术品看起来很合适。

DALL-E 2 艺术

Dall-E 2 不仅仅是一个用于创建古怪图像的有趣的时间浪费工具。

Dalle2.app

行动窗口很窄

苹果在这一切中处于什么位置?该公司将自己定位为技术领导者,尤其是在创意领域。但除了来自 ML 研究网站的几篇博客文章以及对 Apple 芯片库的一些相对省力的优化之外,Apple 似乎对这一问题置之不理。我的意思是,我认为 Divam Gupta 的 DiffusionBee 非常酷,但它是一个有点独立的第三方应用程序,已经有一段时间没有更新了,而且已经落后于最新水平了-人工智能图像生成中的艺术。

这项技术将带来彻底的变革。不相信我?查看 OpenAI 对生成音乐的研究。它创造了各种风格的新音乐,包括一些完全凭空出现的歌唱。微软的 VALL-E 可以生成令人震惊的真实声音,听起来非常接近真人,只需使用真人声音的一小段作为输入。它甚至可以模仿各种情绪状态。

其中许多项目以及其他数十个项目仍处于研究阶段。不难发现其中任何一个的缺陷。但从研究到现实世界的旅程将会很快,而且缺陷将变得很难被发现。

苹果当然拥有构建自己的生成式人工智能聊天机器人的工具。每台新的 Mac 和 iPhone 都配备每秒能够执行高达 15.8 万亿次操作的神经引擎,以及强大的 Core ML 和机器学习 API。但我们还没有看到库比蒂诺内部有任何动静。对于 AI 聊天机器人来说,准确性和速度至关重要——本周,在 Bard 聊天机器人出现错误后,谷歌的股价和可信度大幅下跌——因此,它有可能正在与 Siri 一起在幕后进行工作,而按照真正的苹果风格,在发布之前不会发布任何内容。完善的。但即使拥有大量可用的工具,问题仍然存在:苹果是否在关注?

如果不是专心关注人工智能领域,苹果可能不会意识到它的发展速度有多快。生成式人工智能花了一年的时间从​​”愚蠢的在线研究项目玩具”变成”微软和谷歌的决斗公告”。再过两年,这些工具将会好十倍,而且数量也会更多。你将很难分辨什么是真实的,什么是完全由人工智能凭空生成的。如果您有伟大的想法但艺术技能有限,生成式人工智能将使您更容易实现梦想。

m1 与 m2 芯片

Apple 的 M1 和 M2 Mac 芯片具有专用的神经引擎,能够执行以下操作:

数万亿 每秒的操作数。

苹果

凭借 Siri,Apple 走在了向大众提供 AI 语音助手的前沿。随着这项技术的发展,苹果公司远远落后了,现在 Siri 经常被视为无法与 Google Assistant 或 Alexa 相比的令人失望的产品。在生成式人工智能方面,苹果甚至不具备像 Siri 那样的先发优势。大大小小的科技公司已经在推出强大的工具。如果不采取行动,苹果最终只会制造一些硬件,而我们的生成型人工智能驱动的未来将在其上运行。

在没有意识到这项新技术在自己的软件和服务中的力量的情况下,苹果将让其他人定义最先进的技术,这可能是几十年来计算领域最重要的转变。也许该公司对此表示同意,但随着硬件销售趋于平缓以及苹果业务的软件和服务方面的增长,它确实无法成为生成式人工智能革命的领导者。

当然,苹果是科技领域最神秘的公司之一,尤其是在软件方面。苹果可以让大型团队努力将生成式人工智能功能引入 iMovie、Final Cut Pro、Logic Pro、照片、邮件、消息和整个 iWork 套件。所有这些都可以通过强大的生成式人工智能工具彻底改变。我们知道苹果至少收购了一家生成式人工智能公司,AI Music,大约一年前。今年苹果的产品中至少会出现一个”为你的视频生成原创即时配乐”的工具,这并不是没有道理的。

我们可能根本没有从 Apple 那里听说过任何关于生成式 AI 的事情,然后在 WWDC 上,BAM! Apple 产品中遍布世界一流的生成式 AI!

我希望情况确实如此,因为如果苹果在这种变革性技术上迟到了,它将注定其软件在未来几年落后于竞争对手。