chatGPT：基础扫盲篇

ChatGPT是美国研究人工智能的OpenAI公司于2022年11月30日发布的通用聊天机器人程序。ChatGPT推出之后，在2个月内达到1亿活跃用户，是历史上增长最快的消费者应用程序，受到全世界的广泛关注，掀起了人工智能领域的技术巨浪。分析ChatGPT的相关技术特点，研究在市场监管领域应用的优势和存在的问题，对于做好新时期的智慧监管工作具有重要的意义。

一、ChatGPT概述

ChatGPT作为由人工智能技术驱动的自然语言处理工具，能够通过理解和学习人类的语言来进行对话，根据用户的文本输入和聊天的上下文内容，产生相应的智能回答，像人类一样来聊天交流，还可以完成编写代码、设计文案、撰写论文、机器翻译、回复邮件等多种任务。

ChatGPT具有令人惊艳的语言理解、生成和知识推理能力，能够很好地理解用户意图，真正做到多轮沟通，并且回答内容完整、重点清晰、有概括、有逻辑、有条理。ChatGPT是继数据库和搜索引擎之后全新一代的知识表示和调用方式。

ChatGPT在推出之后迅速形成了一种现象级的应用，表现出很高的人机交互水平，已经具备面向通用人工智能的特征，在众多行业领域具有广泛的应用潜力。

二、ChatGPT相关技术与发展

（一）ChatGPT的相关技术。

Chat GPT的模型架构。ChatGPT 采用基于 Transformer 模型架构实现的，Transformer是一个利用注意力机制来提高模型训练速度的大语言模型。ChatGPT包括了多层自注意力机制和前向神经网络，能够捕捉长距离的依赖关系，具有较强的语言理解能力。

ChatGPT的学习机制。ChatGPT通过大规模语料库的有监督学习来训练的，利用互联网上的海量文本数据进行预训练，从而学习到丰富的语言知识和规律。大规模语料库训练的优势在于可以利用大量的文本数据，从而提高模型的泛化能力、准确率和覆盖率。此外，大规模语料库训练还可以提高模型的鲁棒性，使得模型能够更好地应对各种复杂的自然语言处理任务。

ChatGPT的训练方法。ChatGPT在训练的过程中使用了“人类反馈强化学习”的训练方法，这种方法在AI训练的过程中使用人类反馈，以最大限度地减少无意义的、失真的或者存在偏见的输出。得益于这种训练方法，ChatGPT能够在对话过程中记忆先前使用者的对话讯息，即上下文理解，以回答某些假设性的问题。ChatGPT可实现连续对话，极大地提升了对话交互模式下的用户体验。

（二）ChatGPT的技术发展。

ChatGPT采用的大语言模型规模庞大，包含数十亿的参数，来学习语言数据中的复杂模式。2018年OpenAI推出的第一代GPT-1模型具有1.17亿个参数，2019年推出第二代GPT-2模型已经具有15亿个参数，2020年推出的GPT-3模型具有1750亿个参数，在GPT-3模型面前，用户提供小样本的提示语或直接询问，就能获得符合要求的高质量答案。2022年3月，OpenAI推出了InstructGPT模型，该模型为GPT-3的微调版。2022年11月30日，OpenAI推出全新的对话式通用人工智能工具——ChatGPT。ChatGPT表现出了非常惊艳的语言理解、生成、知识推理能力，可以很好地理解用户意图，做到有效的多轮沟通，并且回答内容完整、重点清晰、有概括、有逻辑、有条理。

2023年3月15日，OpenAI发布了最新的人工智能语言模型GPT-4，这是一项具有里程碑意义的技术进步。GPT-4不仅可以生成类似于人类语言的文本，还可以接受图像和文本作为输入，并输出文本。GPT-4可以处理多种类型的信息，并以更自然和流畅的方式与人类交流。与GPT-3.5相比，GPT-4拥有更大的模型规模和更多的训练数据，从而提高了其生成文本的质量和多样性。GPT4在语言理解、逻辑推理、数学计算等方面都有很强的能力。除文本输入外，GPT-4还具有处理图像输入的能力，用户可以指定任何视觉或者语言任务。据OpenAI称，GPT-4在各种专业和学术领域的基准测试中表现出了“人类水平”的性能。3月17日，微软发布Microsoft 365 Copilot，使用了最新发布的 GPT-4 ，并将其引入到 Microsoft 365 应用程序，包括 Word、Excel、PowerPoint、Outlook等，标志着GPT已带来人们与电脑办公软件交互方式的新阶段。

（三）国内类ChatGPT的大模型产品。

随着OpenAI的GPT系列产品在全球的关注度不断提升，国内致力于人工智能技术研发的机构也先后推出自己的类ChatGPT的大模型技术产品。2023年3月16日，百度正式推出国内首款生成式AI产品“文心一言”，可支持文学创作、文案创作、数理推算、多模态生成等功能。4月10日，商汤科技发布“日日新SenseNova”大模型体系，推出自然语言处理、内容生成、自动化数据标注、自定义模型训练等多种大模型及能力。4月11日的阿里云峰会上，阿里巴巴推出大语言模型“通义千问”，具备多轮对话、文案创作、逻辑推理、多模态理解、多语言支持等功能。4月25日，华为云发布盘古系列超大规模预训练模型，包括30亿参数的全球最大视觉（CV）预训练模型，以及与循环智能、鹏城实验室联合开发的千亿参数、40TB训练数据的全球最大中文语言（NLP）预训练模型。2023年5月6日，科大讯飞正式发布讯飞星火认知智能大模型，拥有跨领域的知识和语言理解能力，能够基于自然对话方式理解与执行任务。从海量数据和大规模知识中持续进化，实现从提出、规划到解决问题的全流程闭环。科大讯飞将大模型落地应用，推出了面向教育、办公、车载等行业的解决方案。后续国内将会有更多类ChatGPT的大模型产品发布，把国内人工智能技术发展和应用推向新的阶段。

三、ChatGPT技术应用中面临的问题

ChatGPT是人工智能技术领域的一项新的突破，作为新的技术在市场监管领域获得应用，还面临数据安全、技术成熟度和资源投入等一些问题。

（一）数据安全问题。

运用ChatGPT技术的应用需要大量数据进行训练，具有收集、储存和使用海量数据的功能。用户在输入端口提出问题后，用户与其对话的数据将会被存储在应用程序运行的云计算平台。人机交互问答中，提问者与ChatGPT分享的数据被用于未来模型的迭代训练，这些数据中可能涉及隐私信息、敏感数据，存在数据泄露的安全风险。ChatGPT就运行在OpenAI公司的云平台，如果直接使用OpenAI的ChatGPT，存在数据跨境流动的安全风险。因此，不建议在市场监管应用中直接使用或者调用ChatGPT，在保证数据安全的前提下，可以应用ChatGPT相关的技术。

（二）人机协调问题。

在ChatGPT出现之前，人工智能应用以专用型为主，ChatGPT的出现是通用型人工智能应用的重要里程碑。但是，ChatGPT不能完全代替人，不能过于迷信运用ChatGPT技术由机器给出的结果，ChatGPT也会出现误判，影响市场监管工作的准确性和效果。市场监管应用，必须充分考虑市场监管工作人员的基于自身知识、经验的判断，妥善处理人机协调问题。

（三）技术壁垒与成熟度问题。

OpenAI并没有向中国大陆用户开放ChatGPT应用，目前国内用户只能通过ChatGPT的镜像网站进行有限的使用体验。ChatGPT之后，国内相关机构先后推出了类似ChatGPT的应用，如百度的“文心一言”、阿里的“通义千问”，科大讯飞的“讯飞星火认知大模型”，商汤科技的“日日新SenseNova”大模型体系等等，关于ChatGPT技术的成熟度还有待进一步检验。目前的ChatGPT应用主要集中在问答式的应用，由用户提问，计算机给出问题的回答结果。ChatGPT推出以来，还没有看到与政府部门业务相关的成功案例，ChatGPT的应用领域还有待读者去进一步观察和关注。

（四）资源与成本问题。

ChatGPT需要非常大量的算力来支持其训练和部署。目前ChatGPT应用时需要大算力的服务器支持，而这些服务器的成本普通用户是无法承受的，即便数十亿个参数的模型在搜索引擎的部署也需要惊人数量的计算资源才能运行和训练。因此，大多数企业都难以承受这高昂的成本。对于普通大众来说，还需等待更轻量型的模型或更高性价比的算力平台。

四、注册国内同类产品（审核ing）

百度文心一言

科大讯飞讯飞星火认知大模型

阿里云通义千问

chatGPT：基础扫盲篇

chatGPT：基础扫盲篇

相关阅读更多精彩内容

友情链接更多精彩内容