“如果我问人们想要什么,他们会说更快的马。”这种情绪,以及诸如“人们不知道自己想要什么,直到你向他们展示”之类的衍生品,使得技术的未来非常可预测。变得困难是因为它需要创新来彻底改变范式。对于即将到来的新的和现有的谷歌应用程序的人工智能功能浪潮来说尤其如此。
【资料图】
Google 对即将发生的事情并非毫无准备。该公司在过去两届I/O 开发者大会上公开讨论了自然语言理解(NLU) 和大语言模型(LLM),这是该公司每年最大的活动。 2021 年的Conversational App 语言模型通过Pluto 进行了演示,去年的LaMDA 2 也能够通过AI Test Kitchen 应用程序进行演示。
还有多任务统一模型(MUM),有一天它可以回答“我已经爬过亚当斯山,现在想明年秋天爬富士山,我应该做哪些不同的准备?”未来,在Google Lens 中,您可以拍摄自行车零件的损坏照片并获取如何修复它的说明。
除了详细介绍其技术外,桑达尔·皮查伊(Sundar Pichai) 的说法更有说服力:“自然对话功能有潜力使信息和计算从根本上更容易访问和使用。”搜索、助手和工作区被特别命名,因为谷歌希望“[集成]更好的对话功能”产品。
然而,正如最近的评论所证明的那样,这还不足以被记住。相反,谷歌没有提供更具体的例子来让公众意识到这些新的人工智能功能将如何使他们每天使用的产品受益。
话又说回来,即使在2022 年5 月提供了更具体的示例,当当年晚些时候推出ChatGPT 时,它也会很快被淘汰。 OpenAI 演示/产品现已推出(并已付费),体验它们的感觉无与伦比。它引发了很多关于直接响应如何影响谷歌基于广告的商业模式的讨论,认为如果用户已经在生成和总结的句子中得到答案,则他们将不再需要点击链接。
让谷歌措手不及的是竞争对手将这些新的人工智能进步整合到交付应用程序中的速度之快。考虑到红色代码,很明显该公司认为不必这么快推出除演示之外的任何东西。安全性和准确性问题是谷歌在其现有预览中明确强调的问题,高管们很快指出,当今市场上的产品如何“编造谎言”,如果大规模推出谷歌搜索,将损害声誉。
宣布裁员的同一天,《纽约时报》披露了谷歌计划在今年5 月的I/O 2023 上展示的20 多款AI 产品。
这些公告大概是由“具有聊天机器人功能的搜索引擎”主导的,它们似乎渴望与OpenAI 正面交锋。特别令人感兴趣的是“图像生成工作室”,它看起来像是DALL-E、Stable Diffusion 和Midjourney 的竞争对手,其中Pixel 壁纸创建器可能是其中的一个分支。当然,谷歌将直接应对艺术家因图像生成人工智能而引起的强烈反对。
AI Test Kitchen 将文本添加到图像演示除了搜索(稍后会详细介绍)之外,泄露的内容似乎都没有从根本上改变普通用户与Google 产品的交互方式。当然,这从来都不是谷歌的做法,它一直是在现有产品(甚至只是其中的一部分)技术可用时添加一些小便利。
Gmail、Google Chat 和Messages 中有智能回复功能,文档和Gmail 中的智能撰写功能并不能完全为您撰写电子邮件,但自动完成建议确实很有帮助。
Pixel 上有Call Screen、Hold for Me、Direct My Call 和Clear Calling,其中人工智能用于改进手机的原始关键用例,而设备上的语音识别则可以实现出色的录音机和更快的助手。当然,还有计算摄影和现在的Magic Eraser。
这并不是说谷歌没有使用人工智能来创建全新的应用程序和服务。 Google Assistant 是自然语言理解进步的成果,而计算机视觉使Google Photos 中的搜索和分类成为可能,七年后我们认为这是理所当然的。
最近,谷歌镜头通过拍照和附加问题进行视觉搜索,而谷歌地图中的实时视图则提供AR 方向。
在ChatGPT 之后,人们想象一个搜索引擎,您的问题将通过完全为您/该查询生成的句子直接回答,而不是获取链接或显示引用可能有答案的相关网站的“特色片段”。
纵观这个行业,我感觉自己是少数对对话体验和直接答案缺乏热情的人。
我预见到的一个问题是,并不总是(甚至经常)需要阅读完整的句子来获得答案,尤其是如果只需阅读知识面板中的一行即可找到答案的情况下;它可以是日期、时间或其他简单的事实。
与此同时,信任任何公司的聊天机器人搜索生成和总结能力都需要时间。至少精选片段可以让我立即查看并决定我是否信任引用的出版物/来源。
在很多方面,直接的句子是智能助理一直在等待的东西,而今天的谷歌助理则转向它已经知道的事实(日期、地址等)(知识面板/图表)和功能片段。当您与语音交互时,可以肯定地认为您无法轻松地看着屏幕并期望立即得到答案。
我知道技术的历史充满了迭代更新,这些更新很快就被改变游戏规则的创新所践踏,但感觉技术还没有到来。我回想起语音助手的早期阶段,它明确地试图在盒子里复制人类。即将到来的人工智能浪潮有点像人类回答你的问题或为你完成任务,但这种新鲜感会持续多久?