ZYvette - 简书

发简信

ZYvette

7
关注
78
粉丝
80
文章
93046

字数
48

收获喜欢
12

总资产

IP属地：北京

ZYvette

base-llm 2.2.3 模型构建、训练与推理
一、模型结构设计 NER本质是序列标注问题——为输入序列中的每一个Token预测一个对应的标签。 1. Token Embedding 层 token_ids 转成词向量。使...

30 0 0
ZYvette

base-llm 4.1 模型部署实战 FastApi/docker-compose
FastAPI是基于Starlette和Pydantic构建。pydantic能利用Python的类型提示（Type Hints）实现自动的数据校验和转换，极大减少了繁琐的参...

27 0 0

ZYvette

base-llm 2.2.4 模型的推理与优化
一、理解模型输出实体级别的F1值是衡量模型性能的核心标准，而非简单的Token分类准确率。 1.1 Token级准确率的陷阱 Token分类准确率，也就是模型预测的正确标签...

27 0 0
ZYvette

base-llm 2.2.2 NER项目的数据处理
一、数据处理流程总览 1.1. 数据处理目标使用的是BMES方法模型输入X: [batch_seq_len] (每个位置是TokenID)模型标签Y: [batch_s...

35 0 0
ZYvette

base-llm 2.2.1 命名实体识别概要
一、命名实体识别简介文本分类是一种对文本的宏观理解。命名实体识别则，则是深入内部理解，学习如何精准是被出句子中的人名、地名等具有特定意义的词语或短语。是作为信息抽取、知识图...

23 0 0
ZYvette

base-llm 1.5.3 T5结构及应用
Bert是基于Encoder架构，擅长理解（如分类、实体识别），GPT基于Decoder架构，擅长生成（如续写、对话）， T5回归了Encoder-Decoder架构，将输入...

26 0 0
ZYvette

Base-llm 1.5.2 GPT结构及应用
GPT系列模型是完全基于Transformer构建的，与BERT致力于通过双向上下文来“理解”语言不通，GPT的中心在生成语言。它的设计初衷是为了根据给定的上文，以自回归的方...

35 0 0

ZYvette

Base-llm 1.5.1 BERT结构及应用
一、BERT的设计原理与预训练策略 Bert（Bidirectional Encoder Representations from Transformers））是纯编码器架构...

32 0 0
ZYvette

base-llm 1.4.3 深入理解transformer
Transformer 来自2017年Google研究团队的名为《Attention is All You Need》的论文。其思想抛弃了传统RNN和卷积网络，整个模型基于注...

45 0 1
ZYvette

Base-llm 1.4.2 注意力机制
标准seq2seq 存在信息瓶颈问题，同一个固定的上下文向量C，作为解码输入，在生成阶段无法找到实际关注点。为了解决这个问题，注意力机制被提出。一、注意力机制的设计原理 ...

38 0 0
ZYvette

Base-llm 1.4.1 seq2seq架构
前边学习了如何使用RNN和LSTM处理序列数据。这些模型在三类任务重表现出色：多对一：将序列信息压缩成一个特征向量，用于文本分类情感分析等任务多对多：输入序列的每一个词...

46 0 0
ZYvette

Base-LLM 1.3.2 LSTM 与GRU
一、LSTM与门控机制常规RNN的问题是内部状态的更新方式是与旧信息无差别混合，并通过权重矩阵W进行变换。这种无论信息是否重要，都会在反向传播中形成梯度累乘。LSTM是赋予...

37 0 0

ZYvette

Base-LLM 1.3.1 循环神经网络
一、如何处理序列信息从分词到embedding是从文件到稠密词向量的过程，解决了模型输入的问题，即文本数值化。第二个问题就是，如何从一个词向量序列中有效地提取整个序列的特征...

31 0 0
ZYvette

Base-llm 1.2.4 基于Gensim的词向量实战
一、Gensim简介 Gensim是一个功能强大且高效的Python库，专门处理原始、非结构话的纯文本文档。内置了多种主流词向量和主题模型算法，如Word2Vec、TF-ID...

10 0 0
ZYvette

Base-llm 1.2.3 从主题模型到Word2Vec
一、寻找理想的词向量哑编码、序号化等方式都无法解决语义关系，例如“国王”与“女王”的语义比“国王”与“苹果”更近。分布式表示的方式就是为了解决这个问题，目的是将词语映射到...

27 0 0
ZYvette

datawhale Base-llm 笔记
第一部分理论篇第一章第一章 NLP简介[https://www.jianshu.com/p/84fb67d283d0] 第二章文本表示 1.2.1 初级分词技术[ht...

129 0 0
ZYvette

Base-llm 1.2.2 向量表示
一、为什么需要词向量？以文本分类为例，jieba分词无法理解语义，需要使用机器学习和深度学习模型。这些模型的输入都是数值形式。解决自然语言和数学模型之间的鸿沟。词向量表...

61 0 1

ZYvette

Base-llm 1.2.1 初级分词技术
第一节初级分词技术一、分词的定义与重要性定义：把连续的文本序列切分成具有独立语义的基本单元。重要性：气氛错误可能会导致语义信息的丢失。这中错误会在后续的处理链条中...

58 0 0
ZYvette

Base-llm 之 1.1 NLP简介
一、 NLP 是什么 1.1 定义与核心任务定义：它是ai领域重要组成部分，赋予计算机理解、解释、生成人类语言的能力，并基于这些能力对文本数据进行决策。目标：我的理解是...

40 0 0
ZYvette

langchain使用中各种报错总结（持续更新中）
1. KeyError: 'intermediate_steps' 报错原因：在 Agent 执行流程中，传入 agent_scratchpad 的输入字典缺少 interm...

19 0 0

暂无个人介绍