不知道大家还记得年初上映的DALL·E2吗?因为受欢迎,大家开始讨论AI绘画是否会取代设计师的工作。这个话题至今仍经常被提及。近日,OpenAI又出大招,推出ChatGPT,风靡互联网。大家都开始讨论内容创作者、技术从业者、甚至HR岗位是否会被取代!
(资料图)
但事实真的是这样吗? GPT真的有这么强大的能力吗?今天我们就来看看GPT是如何“密谋”抢走大家的“饭碗”的。
GPT发展历史
生成式预训练Transformer (GPT),一种基于互联网上可用数据训练的文本生成深度学习模型。要谈GPT,就不得不谈他的雇主OpenAI。 2016 年成立时,该公司的主要目标包括创建使用自然语言的“通用”机器人和聊天机器人。如今,其核心目的仍然是“实现安全的通用人工智能”。 (AGI)”,这也给很多人造成了误解,认为GPT的未来就是AGI,但事实真的是这样吗?
我们先来了解一下GPT的发展历史吧!
GPT-1
众所周知,2018年是自然语言处理(NLP)预训练模型的元年。同年也是GPT-1 诞生的一年。
GPT-1使用的模型结构是Transformer Decoder结构,总共12层。
这在当时已经是一个非常大的模型了,但就性能而言,它只能用于监督和与任务无关的任务。
(Transformer解码器模型)
常用的任务包括:自然语言推理、问答和常识推理、语义相似度识别、分类。
GPT-2
一年后,一句“发布太危险”和GPT-2走红网络,也开启了OpenAI的成名之路。
与GPT相比,GPT-2并没有在原有网络上进行太多的结构创新和设计,但模型、数据、训练模型都得到了很大的增强。
(GPT-2型号)
性能方面,GPT-2在——这一代才发现了自己真正的实力,尤其是在阅读摘要、写续写等方面表现出了强大的天赋。
同样在这一年,OpenAI通过GPT-2认识到了Zero-Shot的可能性,并发布了许多搭载GPT-2的衍生品。
GPT-2 衍生品MuseNet
MuseNet 是OpenAI 的早期衍生品,它使用与GPT-2 相同的通用无监督技术。
GPT-2是OpenAI之前提出的大规模Transformer模型。它训练人工智能预测序列中的下一个标记,包括音频和文本。当在MuseNet 上使用时,给出一组音符后,AI 需要预测接下来会出现什么。笔记。
MuseNet可以使用10种不同的乐器生成4分钟不同风格的音乐;即使MuseNet 知道许多不同的风格,它也可以混合并生成新的音乐。
例如,当你输入肖邦夜曲的前6个音符并让它生成一首流行音乐后,然后让它添加钢琴、鼓、贝斯和吉他伴奏,生成的音乐将完美融合。肖邦和邦乔维风格。
GPT-3
GPT-2 流行仅一年后,OpenAI 就推出了GPT-3。虽然模型上没有什么创新,只是遵循了更大更强的风格,但通过GPT-3 我们也可以明确:OpenAI 对GPT 的迭代不再是其模型的创新,更多的是其实用性,即能否完成自然语言处理的大部分任务。
在性能方面,GPT-3已经能够将网页描述转换为相应的代码、模仿人类叙事、创建自定义诗歌、生成游戏脚本,甚至模仿已故哲学家的风格。而且,OpenAI还开放了GPT-3 API接口。您可以自行申请白名单,体验GPT-3的效果,从而正式开启GPT的商业化模式。
GTP-3衍生物DALL·E
DALL·E图像生成器是GPT的衍生品,它的名字是为了向艺术家萨尔瓦多·达利和皮克斯的机器人WALL-E致敬。作为热门的AI绘画平台,DALL·E2可以通过文字描述直接生成超现实般的图像,让机器拥有顶级画家和设计师的创造力。
而得益于GPT-3强大的模型,DALL·E 2甚至可以通过AI计算来考虑整体构图。当标题文字暗示图像必须包含未指定的具体细节时,DALL·E 2 可以自然地将其整合到图像中。对于整个画面来说,这是其他AI绘画工具无法做到的。 OpenAI 将这一概念称为“填补空白”。
DALL·E 2的使用也非常简单。用户只需输入自己心中对图片的描述,也可以上传一段想要变换的文字,输入命令就可以得到自己想要的图片。这对于没有接受过专业美术培训,但想从事美术工作,或者想尝试自己的设计的感兴趣的用户来说,无疑是大有裨益的。
然而,目前DALL·E2的整体算法模型还不够充分。有时自动生成的图片不能满足我们的设计需求,有时图片不合逻辑。随着GPT算法训练的次数越来越多,相信它生成的图像会越来越丰富。
GPT-3 衍生物ChatGPT
ChatGPT是GPT-3自然语言生成模型的最新衍生品,也是继DALL·E之后的又一风潮产品。它理解并生成自然语言,并且具有高度智能和可训练性。它可以以对话方式与人类互动,回答后续和连续的问题,承认其答案中的错误,并在人类提出问题时指出不准确之处。纠正前提,拒绝回答不恰当的问题。
ChatGPT 能做的远不止这些,这就是为什么每个人都称自己失业了。我们来看看ChatGPT的功能。
写入内容
内容创作者是当今大时代最常见的工作类型之一。很多人都表现出了自己独特的创造力和不可替代性;各种热门关键词也层出不穷,丰富了很多人的闲暇时间。
现在,ChatGPT可以通过算法完成内容输出!
您甚至可以在问题后输入风格要求,这样您就可以对著名艺术家、世界首富、著名政治家、甚至美国杀人犯的表达风格感到满意。
但ChatGPT创造的故事重复度还是比较高的。这可能与其工作原理有关,即根据初始输入短语将单词相互关联并生成后续的其他单词。因此,文字作者无需担心GPT 会取代您的作品。
指出错误
ChatGPT 使用“预训练-微调”工作范式训练了一个初始模型:人类AI 训练员提供对话,其中他们扮演双方—— 个用户和AI 助手。 AI训练师可以访问模型编写的对话回复,并帮助AI调整你的回复内容。
编写软件
真正让ChatGPT在互联网上流行的自然是因为它“将取代技术人员的工作”。据说可以自己写代码、自己调试。但事实上,ChatGPT 自己的解释是“我可以为用户解决各种技术问题。比如我可以帮助用户解决编程语言的问题,比如Java、Python、C++等,我也可以帮助用户解决操作系统的问题。问题,例如Windows、Linux、MacOS等。此外,我还可以帮助用户使用软件工具解决问题,例如Eclipse、Visual Studio、Git等。”
也有人在ChatGPT 和Google 上搜索同样的问题。通过比较,他们发现ChatGPT往往能够给出用户最想要的答案,而且答案呈现的方式也非常直接,为未来的搜索引擎提供了新的范式。 ChatGPT也被认为是最有可能取代Google的下一代智能搜索引擎。
正是因为GPT-3衍生出来的很多支持各行业自动补全的产品的出现。您只需输入几个单词即可完成一个段落(或更多)。因此,GPT-3 被描述为世界上最强大的自动完成系统。
那么回到文章开头提到的观点:GPT 的未来是AGI。但GPT真的可以等同于AGI吗?
预测:GPT-4等于AGI吗?
说到AGI,很多非技术专业人士可能会有些困惑,但相信“人工智能”这个词大家都很熟悉。自从早年“AlphaGo在围棋方面击败了人类最优秀棋手”以来,人工智能战胜人类的话题就一直被讨论不断;因此,当GPT可以取代设计师、编曲者、内容创作者、技术工程师等工作的话题一出,立即引起关注。
其实通过我们刚才的分析,相信大家都能够明白,OpenAI推出的GPT衍生品并不能取代任何人的工作。人类通常善于整合各种感官信息来创造新的内容,所以我们在做AGI研究时必须考虑的东西是征服的基础。
AGI,至少从一开始,将需要一个机器人身体来学习这样的东西。
这些计算机不需要驻留在机器人内部,但可以远程连接,因为电信号的传输速度比我们神经系统中的信号传输速度快得多。然而,机器人能够学习如何堆叠积木、移动物体、随着时间的推移执行一系列动作,并从这些动作的后果中学习。使用视觉、触摸、操纵器等,AGI 可以学习以基于文本的系统根本无法实现的方式进行理解。
GPT没有针对该内容的训练,更多地局限于内容生成训练。我们相信,随着人类不断使用反馈训练,GPT生成的内容会越来越丰富、越来越有逻辑性,但用文字来表达抽象层次是GPT无法学习的。
总结
虽然GPT不等于人工智能,但它之前有DALL·E2,之后有ChatGPT。一定程度上确实降低了各类劳动者的准入门槛和工作压力;相信随着AlphaGo的前行,更多的人工智能产品将会逐渐与大家见面。
我们可以看到,人工智能引入日常生活将对我们的生活和工作方式产生深远的影响;我们还相信人工智能将用于自动化日常任务、创建个性化服务并根据数据做出决策。
顶到智联注重打造以人为本的运营体系。我们也希望操作系统能够为客户提供更加个性化、智能化的操作体验。希望大家持续关注钉刀生态,和我们一起参与更多更新。就多个主题进行讨论。