LLM基础(一):模型参数量、模型参数精度

什么是LLM?

LLM是大语言模型的简写。全称是Large Language Model。

大型语言模型,是一种使用大量文本数据训练的深度学习模型,能够理解和生成自然语言文本

最重要的是能生成世界上以前没有的文本!

GPT、LLaMA、Mistral等都属于大模型。

总结:使用大量语言文本数据训练出来的模型,具有强大的语言理解推理能力,能够理解和顺畅的生成自然语言。

对大多数人来说,没有必要单独学习LLM的相关内容,只要学习一下Prompt Engineering(提供工程)就够了。就像一般的Android开发不用关心它的底层是什么原理,只要知道常用的接口就可以。

提示工程也叫做上下文提示,是一种通过不断调整模型参数/权重来引导LLM朝着特定结果发展的一种方法。

LLM中的关键词

模型参数量

模型参数量是指模型中可学习和调整的变量的数量。

参数中存储的是模型的权重和偏差信息。

权重是指模型中不同神经网络层神经元连接的强度数值,可以理解为词与表述词之间的相关性值。

偏差是指每个神经元额外参数,帮助神经元在没有输入信号时依然能生成内容。

模型参数量越多,模型能处理的关系越复杂,从而在任务处理生就能得到越好的效果,也需要更多的训练数据计算资源。 

模型参数中所说的10b,13b,70b,中的b指的是billion(十亿)。10b = 100亿个模型参数。

谨记:并不是模型参数量越大模型越优秀,关键还要训练数据和质量。

模型参数量就像数据库中数据表的字段数,字段数越多,对数据的表述就有可能越准确,但是要想越准确就要把这些字段都填写(训练)而且要准确(优质)。

模型参数精度

模型参数精度是指模型参数的数据类型,决定了模型参数在内存中存储计算参数所使用的位数(bit)

常见的模型参数精度有:

float32,4 Bytes。单精度浮点数(32bit)。

float16,2 Bytes。半精度度浮点数(16bit)。

float64,8 Bytes。双精度度浮点数(64bit)。

int32,int64等。不常见。

越高的精度参数,存储的信息越多,占用的内存越大,运算起来越慢。

最后编辑于
©著作权归作者所有,转载或内容合作请联系作者
平台声明:文章内容(如有图片或视频亦包括在内)由作者上传并发布,文章内容仅代表作者本人观点,简书系信息发布平台,仅提供信息存储服务。

推荐阅读更多精彩内容

  • 关系数据库入门 关系数据库概述 数据持久化 - 将数据保存到能够长久保存数据的存储介质中,在掉电的情况下数据也不会...
    d4d98020ef88阅读 728评论 0 0
  • 一、Hive基本概念 Hive 是基于 Hadoop 的一个数据仓库工具,可以将结构化的数据文件映射为一张表,并提...
    CJ21阅读 1,765评论 0 13
  • 1、简述编译型和解释型语言编译型:运行前先由编译器将高级语言代码编译为对应机器的cpu汇编指令集,再由汇编器汇编为...
    Zzmi阅读 1,015评论 0 0
  • 1.自动驾驶发展趋势 2.乘用车搭载自动驾驶的趋势 3.自动机驾驶组成 4.产业链 感知层的视觉系统:舜宇、大立光...
    HelloBinary阅读 3,758评论 0 0
  • 第1章 初识MySQL 1.1 数据库基础 1.1.1 什么是数据库 1.1.2 表 1.1.3 数据类型 1.1...
    _Cappuccino_阅读 12,643评论 0 0