为什么 iPhone 上的自动更正功能仍然如此糟糕?
我们都经历过。您的意思是输入一个简单的短语,例如”您今天午餐想吃什么?”它给人的印象是,”你想要什么来让发布变得整洁?”自动更正错误是如此常见,而且已经存在了很长时间,以至于我们几乎不再承认它们,除非它们无意中很搞笑。
这是为什么呢? iPhone 已经问世 15 周年了,这款设备开创并普及了纯触摸键盘输入,自动更正功能自 90 年代以来就以某种形式出现在我们身边,当时 Word 会自动更正意外的大写锁定或常见的拼写错误.
经过几十年和数十亿台设备的销售,更不用说机器学习和人工智能的迅速崛起,自动更正感觉还是一如既往的愚蠢。在某些方面,它感觉像是倒退了,甚至在简单的字母交换就能产生正确的单词时进行无意义的替换。自动更正真的很难吗?或者它根本就没有尝试按照它需要的方式工作?它不再是优先事项了吗?
在”你今天午餐想吃什么”中错过了几个按键,你就会得到这个怪物。
九进行曲
大约 20 年前,我第一次了解到”九进行曲”这个概念(尽管我不知道这个词起源于哪里)。我正在研究和撰写有关最新语音听写软件的文章。那时计算机用户必须购买 Dragon Dictate 之类的软件才能与他们的机器对话。
准确率达到 90% 的听写软件听起来不错,但毫无价值。如果你必须每 10 个单词中修改一个单词,你实际上不会节省太多时间。事实上,即使是 99% 的准确率也还不够好。 99.9% 是事情变得有趣的地方……如果你可以向计算机口述 1,000 个单词,并且只需要修复其中一个,那么你就可以节省大量时间(更不用说一个令人难以置信的辅助工具)。
但是 99% 的准确率不仅仅比 90% 好 9%。实际上,它的性能提高了 1,000%,即提高了 10 倍,因为错误率从 10 个单词中有 1 个错误变为 100 个单词中有 1 个错误。
对于任何自动化流程的准确性,每增加一个”九”,你就会让它对人类来说似乎只是稍微好一点,但你必须做出十倍的改进才能实现这一目标。换句话说,对于用户来说,99.9999% 的感觉并不比 99.999% 好多少,但对于计算机来说,它的难度仍然是 99.9999% 的 10 倍。
自动更正是否陷入了”九进一出”的困境?它是否秘密地进行了在我们看来微不足道的巨大飞跃?我不这么认为。自动更正的错误率仍然相当高,而其可用的计算能力(尤其是机器学习任务)是十年前的数百倍。我认为是时候看看其他地方了。
自然语言处理并非如此
无论您谈论的是 Siri 或 Alexa 等语音助手、语音听写还是自动更正,科技公司都喜欢说他们正在采用”自然语言处理”。
但是真正的自然语言处理仍然超出了任何这些消费者系统的能力范围。我们剩下的是基于机器学习的对几乎完全没有语义的词性的统计分析。
考虑以下内容:”去街角商店给我买一根黄油。确保它不加盐。”
如果我问某人”它”指的是什么,任何人都会立即知道我指的是黄油,尽管从语法上来说,”它”也可以指商店。但谁听说过不加盐的商店呢?如果我们将第二句话改为”检查今天是否营业”,我们就知道”它”指的是商店。
这对人类来说是非常微不足道的事情,但计算机在这方面却很糟糕,因为语言系统是在不了解单词实际含义的情况下构建的,只了解它们是什么类型以及它们是如何拼写的。
所有这些基于语言的系统(语音助手、听写、自动更正)都依赖大量报酬微薄的承包商来采集语音样本或文本句子,并精心标记它们:名词、动词、形容词、副词、粗俗语言、专有名词名词等。计算机语言系统可能知道,如果您输入”品尝我刚刚制作的汤”,则拼写错误的单词应该是”汤”,因为它应该是一个名词,并且它的大部分字母与非名词相同。 -你输入的词是我的意外。但它不知道汤到底是什么。句子中也没有任何其他词:品味、制作、只是……
我认为这就是自动更正仍然如此糟糕的真正原因。如果您不知道单词的含义,即使是肤浅的含义,那么无论您的机器学习多么复杂,或者其训练集规模多么庞大,都无关紧要。
只有当我告诉 iPhone 知道 Macworld 时,它才知道 Macworld。
Google 会自动为您预测 Gmail 中的整个短语,但这也只是非常复杂的静态分析。它使用机器学习来确定您在回复具有特定关键字和短语分布的电子邮件时最常跟在您刚刚使用的单词后面的短语。它仍然不知道这意味着什么。
使用我原来的例子:自动更正建议”你想要什么来启动整洁”,因为它不知道这是一个无意义的句子。如果我的 iPhone 知道这些单词的实际含义,而不仅仅是它们的语法作用,那么自动更正就很容易只提出可能是人类语言的建议。 (当然,这也是不可能的语法的大杂烩,这表明自动更正仍然是多么糟糕。)
自动更正似乎不再是优先事项
事实是,自动更正不再像以前那样优先。您最后一次看到 Apple 在 iOS 营销中宣传自动更正准确性的巨大飞跃是什么时候?
在智能手机的早期,当我们都习惯用大拇指在小触摸屏上打字时,修复胖手指错误的能力是一个巨大的卖点。这是一个核心功能,表明设备的软件优雅且易于使用。
尽管自动更正有很多缺点,但现在已经过时且无聊了。我们已经忍受了它的缺点太久了,以至于市场并没有真正将它视为可用性的标志。我们已经转向其他问题,例如精美的相机功能和通知。我确信苹果和谷歌都有聪明、勤奋的工程师在努力研究自动更正,但它可能只获得了负责拍摄稍微好一点的照片的团队的一小部分资源,因为稍微好一点的照片可以卖出手机,也可以稍微卖点。更好的自动更正不能。
在我们的手机对单词的语义有一定的了解之前,人工智能建模和功能将发生绝对巨大的飞跃。但当然,即使是现在,我们还可以做更多的事情来过滤掉无意义的句子和垃圾自动更正建议,这些建议会产生毫无意义的胡言乱语。
我只是想看到任何改进。任何可以将自动更正从发布时的陈规中解放出来的东西。