ChatGPT

一，ChatGPT简介

ChatGPT是一款于2022年11月30日在美国发布的聊天机器人程序，是一款基于人工智能技术驱动的自然语言处理工具。
ChatGPT全称为“Chat Generative Pre-trained Transformer”，Chat是聊天，GPT是“生成型预训练变换模型”，它可以翻译成“聊天生成预训练转换器”或简称“优化对话的语言模型”。
ChatGPT是OpenAI开发的、具有语言预测与文本续写功能的一个大模型。一个用对话的方式进行交互的模型。一种基于互联网可用数据训练的文本生成深度学习模型。一个人工智能聊天机器人程序。
ChatGPT是一款建立在云计算、海量数据库、人工智能算法架构和深度神经网络基础之上开发的聊天机器人程序，它不像传统的搜索引擎一样复制和拼凑网上已有的信息给用户。相反，它提供的回答是有逻辑的、生动的，有上下文关联的。
总结一下，ChatGPT是美国人工智能研究实验室OpenAI新推出的一种人工智能技术驱动的自然语言处理工具，使用了Transformer神经网络架构，也是GPT-3.5架构，这是一种用于处理序列数据的模型，拥有语言理解和文本生成能力，尤其是它会通过连接大量的语料库来训练模型，这些语料库包含了真实世界中的对话，使得ChatGPT具备上知天文下知地理，还能根据聊天的上下文进行互动的能力，做到与真正人类几乎无异的聊天场景进行交流。ChatGPT不单是聊天机器人，还能进行撰写邮件、视频脚本、文案、翻译、代码等任务。

ChatGPT功能

ChatGPT目前系统功能主要是文本生成、聊天机器人、语言问答、语言翻译、自动文摘、绘画功能、编程功能、视频生成等八大功能模块所组成。

二，ChatGPT底层技术架构

ChatGPT生成性预训练变换模型

从ChatGPT字面意思来看，Chat是聊天，GPT才是关键。
字母G是Generative，属于生成的人工智能，根据我们的需要，创造生成全新的内容。
字母P是Pre-trained的缩写，预训练。表示这个模型已经在大量的数据集上进行了预训练，ChatGPT在与人的对话中几乎接近正常人的交流，就是因为已经接受过海量数据的训练，而这些数据就是我们2022年以前在互联网上的内容（目前版本的ChatGPT还不具备网络数据实时更新功能）。ChatGPT当前还没有实现网络的实时连接，因此回答问题的时效性受到一定的限制。
字母T是Transformer，转换器的意思，是ChatGPT底层人工智能学习的一个算法架构。

ChatGPT严格意义上来说是一种基于Transformer的自然语言处理模型。采用预训练加微调的方法，通过对大规模语料库进行预训练，对标注数据进行微调，从而使模型能够适应特定的自然语言处理任务，拥有语言理解和文本生成能力。

ChatGPT的演进

ChatGPT使用基于GPT-3.5架构的大型语言模型并加以强化训练训练。
ChatGPT的演进过程：
第一阶段：GPT-1发布
2018年6月，OpenAl 第一篇论文《Improving Language Understanding by Generative Pre-Training》通过生成式预训练来提高语言理解能力的论文中提出了第一个模型GPT-1。从这篇论文中得出的关键结论是，Transformer 架构与无监督预训练的结合产生了GPT-1，加上有监督微调方式，针对特定任务进行预训练，实现了强大自然语言理解能力。
第二阶段：GPT-2发布
2019年2月，OpenAI发表了第二篇论文《Language Models are Unsupervised Multitask Learners》，推出了GPT-2 。GPT-2是一种自然语言生成模型，其设计目标是生成与人类语言相似的文本，可以完成多任务处理。
第三阶段：GPT-3发布
2020年5月，OpenAI发表第三篇论文《Language Models are Few-Shot Learners》，推出了GPT-3。GPT-2和GPT-3是两个不同的模型，它们的主要区别在于应用场景、模型规模和性能表现。GPT-3是一种自然语言生成模型，它是目前规模最大的预训练模型，可以生成高质量的自然语言文本，包括文章、诗歌、对话等。GPT-3还支持一些其他的自然语言任务，例如翻译、问答、语义搜索等。
第四阶段：GPT-3.5 发布
2022年11月29日，OpenAI发布了一个命名为“text-davinci-003”（文本－达芬奇-003常称为GPT3.5）的新模型。它以对话方式进行交互，既能够做到回答问题，也能承认错误、质疑不正确的前提以及拒绝不恰当的请求。

ChatGPT的预训练加微调

所谓的ChatGPT预训练，是一个基于transform模型的预训练语言模型，它的训练逻辑如下：
第一是语料准备，从互联网上收集大量文本语料。
第二是对数据预处理，对语料进行处理，把它们分割成许多独立的句子或段落，对每个句子进行分词。分词后把每个单词转换成数字，生成一个数字序列，然后构建成数字词典。
ChatGPT训练就是使用这些数字序列用transformer模型进行模拟场景试验，需要投入大量的人工干预，并使用监督学习的方式对预训练模型进行微调。根据奖励模型优化策略，然后生成输出，ChatGPT的预训练应当是基于正向传递，反向更新，梯度收敛，预训练模型降低了获取更高水平人工智能的成本。

ChatGPT的Transformer转换器

ChatGPT的核心技术之一是Transformer转换器，Transformer技术是近几年人工智能技术最大的亮点之一，由谷歌的人工智能的团队“谷歌大脑”首先发布。
这种模型是使用一种叫自注意力的机制（self attention mechanism），它允许模型在进行预测的时候，可根据语言序列的任何位置，为输入数据的不同部分赋予不同的权重，并支持处理更大的数据集。
Transformer的精度和性能上都比之前流行的CNN（卷积神经网络）、RNN（循环神经网络）等模型，大幅提升了模型训练的效果，让人工智能在更大模型、更多数据、更强算力的基础上进一步增强运算能力。此外，还具有很强的跨模态处理能力，不仅在NLP（自然语言理解）领域表现优异，在语音、图像方面也显示出了优异的性能。
Transformer是ChatGPT语言模型的核心技术，是一种用于序列到序列（Sequence-to-Sequence）任务的神经网络模型，例如机器翻译，语音识别和生成对话等，它使用了注意力机制来计算输入序列和输出序列之间的关系。
Transformer的主要优点是它可以并行地处理输入序列中的所有信息，因此在训练和推理时都有很高效率。
此外，Transformer没有使用循环结构，因此它不受长序列的影响，并且在处理长序列时不会出现梯度消失或爆炸的问题。

ChatGPT人类反馈优化语言模型（RLHF）

ChatGPT 面对多样化的问题对答如流，已经打破了机器和人类沟通的边界，这一工作的背后是大型语言模型 (Large Language Model，LLM) 生成领域的新训练范式RLHF (Reinforcement Learning from Human Feedback) ，即依据人类反馈的强化学习方法模型。
OpenAI官网上如是说：我们使用依据人类反馈的强化学习方法模型（RLHF）来实施训练，使用监督微调训练一个初始模型与人类人工智能训练师提供对话，他们在其中扮演用户和人工智能助手。我们让培训师可以访问模型编写的建议，以帮助他们撰写答案。为了创建强化学习的奖励模型，我们需要收集比较数据，其中包括两个或多个按质量排名的模型响应。为了收集这些数据，我们进行了人工智能培训师与聊天机器人的对话。我们随机选择了一个模型编写的消息，抽样了几个替代完成，并让AI培训师对它们进行排名。使用这些奖励模型，我们可以使用近端策略优化来微调模型，我们执行了此过程的多次迭代。

ChatGPT强化学习算法训练奖励模型简单来说就是分为三个阶段：
第一阶段是收集示范数据，人工智能培训师与聊天机器人对话，并接受监督。
第二阶段是收集比较数据，训练一个奖励模型。
第三阶段是利用PPO强化学习算法，优化一个针对奖励模型的策略。

ChatGPT的DALL.E 2自然语言转换成像技术

根据OpenAI官网上的介绍，ChatGPT中的DALL.E 2自然语言转换成像技术，最初只是一个研究项目，目标是制定并继续改进安全缓解的措施，其中包括：
第一、限制DALL·E 2 自然语言转换成影像时生成暴力、仇恨或成人图像。通过从训练数据中删除有害的视频内容、使用先进的技术来防止真实人物的面部，包括公众知名人物的面部在视频中出现。
第二、遏制用户滥用政策。不允许文本要求生成暴力、成人或政治内容等视频。如果我们的过滤器发现可能违反我们政策的文本提示和图片上传，ChatGPT就会采用自动化和人工监控系统予以拒绝。
OpenAI认为：负责任的开发和安全监管是人工智能的重要组成部分，让用户对ChatGPT安全系统有信心。
OpenAI希望DALL.E 2自然语言转换成像技术能降低图像生成模型相关的风险。为此，DALL.E 2在互联网上数亿张带标题的图像上进行训练，删除并重新加权其中一些图像，更改模型学习的内容。
同时，采用在DALL.E 2中设置各种防护栏训练数据集，过滤训练数据，放大偏差、重复数据删除等多种技术手段，以防止生成的图像违反内容管制政策。使人们能够创造性地表达自己，帮助人们了解ChatGPT人工智能系统如何看待和理解我们的世界，对于创造人类的人工智能使命至关重要。

ChatGPT存在哪些局限性

1，数据偏差和样本不足问题。虽然 ChatGPT 使用了很大规模的语料库进行预训练，但是其在某些领域的样本仍然不足，比如在一些非英文的语言中，ChatGPT 的表现不如英文。
2，在训练的强化学习 (RL) 阶段，没有真相和问题标准答案的具体来源，来答复你的问题。
3，模型参数过多，计算资源要求高。ChatGPT 模型参数数量大，对计算资源的要求也高，需要大规模的GPU 集群才能进行训练和应用。
4，监督训练可能会误导/偏向模型倾向于知道理想的答案，而不是模型生成一组随机的响应并且只有人类评论者选择好的/排名靠前的响应

三，一些看法

吴军（计算机科学家，畅销书《浪潮之巅》作者）对于 ChatGPT 的看法

在美国，大家谈论 ChatGPT 也就十几天的时间，之后大家就不谈这件事了。但是在中国，大家却造出了一个神。以前，造出的神还是人，比如乔布斯、马斯克，但是现在却把一个机器或者工具神化了。ChatGPT 产生的内容，基本上是没有营养的，我们在读ChatGPT写的文章时，读第一遍可能会觉得很有意思，感觉它写的东西跟人写的有点像，但是，接下来读其他文章的时候，就越发的发现，ChatGPT 写的文章，几乎都是车轱辘话，没有什么意义。
其实，ChatGPT 是一个概率模型，这个模型保证输出优质结果的概率最大。比如，我想写一份简历，并给出了一些关键词，通过一定的预测、整合，ChatGPT会输出一份简历，这份简历，可能是现有互联网资源中的最优简历。这时，我们可以把互联网上跟我给出的关键词相关的所有简历当作是条件，把 ChatGPT 输出的简历当作是结果。试想，如果互联网上没有现有的所有简历，ChatGPT 可以输出的简历，会是什么样的呢？
ChatGPT 在技术上是一个语言模型——用现在的语言或知识来预测一些新的语言或者知识，所以它不会产生新的知识。人类的价值在于产生新的知识，而 ChatGPT 就像一台复读机。也正是因如此，ChatGPT 对于在抖音或者快手等平台上，生产没有营养的内容、文字的人冲击最大——同样是没有营养的内容，但 ChatGPT 的生产效率更高，甚至于质量更好。
但是，对于稍微有一些创作性的工作，ChatGPT 是替代不了的。但是，现在互联网上80%的内容都是没有营养的，而这80%的内容，是可以交给 ChatGPT 来做的。
几年前有一次，出于好奇，我写了一个简短的程序，想看看它能不能写唐诗。其实，答案显而易见——可以——只要把李白的诗学习一遍，就能写出李白风格的诗。但是，程序写出来的诗，是没有李白或者杜甫他们在特定环境下而产生的深刻感悟的，换言之，是没有营养的。
同理，ChatGPT 并不是一个很神秘的东西，只是现在很多的人将它神化了。说严重些，如果你也跟着一起造神，那最后的结果就是被割韭菜。

人面猴
序言：七十年代末，一起剥皮案震惊了整个滨河市，随后出现的几起案子，更是在滨河造成了极大的恐慌，老刑警刘岩，带你破解...
沈念sama阅读 221,548评论 6赞 515
死咒
序言：滨河连续发生了三起死亡事件，死亡现场离奇诡异，居然都是意外死亡，警方通过查阅死者的电脑和手机，发现死者居然都...
沈念sama阅读 94,497评论 3赞 399
救了他两次的神仙让他今天三更去死
文/潘晓璐我一进店门，熙熙楼的掌柜王于贵愁眉苦脸地迎上来，“玉大人，你说我怎么就摊上这事。” “怎么了？”我有些...
开封第一讲书人阅读 167,990评论 0赞 360
道士缉凶录：失踪的卖姜人
文/不坏的土叔我叫张陵，是天一观的道长。经常有香客问我，道长，这世上最难降的妖魔是什么？我笑而不...
开封第一讲书人阅读 59,618评论 1赞 296
港岛之恋（遗憾婚礼）
正文为了忘掉前任，我火速办了婚礼，结果婚礼上，老公的妹妹穿的比我还像新娘。我一直安慰自己，他们只是感情好，可当我...
茶点故事阅读 68,618评论 6赞 397
恶毒庶女顶嫁案：这布局不是一般人想出来的
文/花漫我一把揭开白布。她就那样静静地躺着，像睡着了一般。火红的嫁衣衬着肌肤如雪。梳的纹丝不乱的头发上，一...
开封第一讲书人阅读 52,246评论 1赞 308
城市分裂传说
那天，我揣着相机与录音，去河边找鬼。笑死，一个胖子当着我的面吹牛，可吹牛的内容都是我干的。我是一名探鬼主播，决...
沈念sama阅读 40,819评论 3赞 421
双鸳鸯连环套：你想象不到人心有多黑
文/苍兰香墨我猛地睁开眼，长吁一口气：“原来是场噩梦啊……” “哼！你这毒妇竟也来了？” 一声冷哼从身侧响起，我...
开封第一讲书人阅读 39,725评论 0赞 276
万荣杀人案实录
序言：老挝万荣一对情侣失踪，失踪者是张志新（化名）和其女友刘颖，没想到半个月后，有当地人在树林里发现了一具尸体，经...
沈念sama阅读 46,268评论 1赞 320
护林员之死
正文独居荒郊野岭守林人离奇死亡，尸身上长有42处带血的脓包…… 初始之章·张勋以下内容为张勋视角年9月15日...
茶点故事阅读 38,356评论 3赞 340
白月光启示录
正文我和宋清朗相恋三年，在试婚纱的时候发现自己被绿了。大学时的朋友给我发了我未婚夫和他白月光在一起吃饭的照片。...
茶点故事阅读 40,488评论 1赞 352
活死人
序言：一个原本活蹦乱跳的男人离奇死亡，死状恐怖，灵堂内的尸体忽然破棺而出，到底是诈尸还是另有隐情，我是刑警宁泽，带...
沈念sama阅读 36,181评论 5赞 350
日本核电站爆炸内幕
正文年R本政府宣布，位于F岛的核电站，受9级特大地震影响，放射性物质发生泄漏。R本人自食恶果不足惜，却给世界环境...
茶点故事阅读 41,862评论 3赞 333
男人毒药：我在死后第九天来索命
文/蒙蒙一、第九天我趴在偏房一处隐蔽的房顶上张望。院中可真热闹，春花似锦、人声如沸。这庄子的主人今日做“春日...
开封第一讲书人阅读 32,331评论 0赞 24
一桩弑父案，背后竟有这般阴谋
文/苍兰香墨我抬头看了看天上的太阳。三九已至，却和暖如春，着一层夹袄步出监牢的瞬间，已是汗流浃背。一阵脚步声响...
开封第一讲书人阅读 33,445评论 1赞 272
情欲美人皮
我被黑心中介骗来泰国打工，没想到刚下飞机就差点儿被人妖公主榨干…… 1. 我叫王不留，地道东北人。一个月前我还...
沈念sama阅读 48,897评论 3赞 376
代替公主和亲
正文我出身青楼，却偏偏与公主长得像，于是被迫代替她去往敌国和亲。传闻我的和亲对象是个残疾皇子，可洞房花烛夜当晚...
茶点故事阅读 45,500评论 2赞 359