240 发简信
IP属地:吉林
  • 提示词记录

    前后关键,AI就能发挥大作用了。当然,最后还要结合人的经验和认知能力进行修改。 我作为一个资深的IT运维专家和咨询师,接到一个XX公司的咨询需求...

  • 提示词记录

    有用的提示词,要反复打磨。和AI交流有4个象限:我知道AI知道,我知道AI不知道,我不知道AI知道,我不知道AI不知道。在不同的象限,有不同的提...

  • 使用DeepSeek进行智能的日志异常分析

    从微信公众号看到的文章,很早就想实操一下,一直没有机会。今天利用在北京公司的时间,连上公司的DeepSeek实践了一下。限于条件,不用ES和飞书...

  • Resize,w 360,h 240
    MCP Server代码积累

    最近手搓的代码,弄一次之后,果然记忆和理解就不一样了。这次除了本地的MCP SERVER,还弄了HTTP SSE的远程MCP SERVER。 方...

  • Resize,w 360,h 240
    重走NLP长征路-N-Gram模型

    感觉最近对大语言模型的进化有了一个新的体悟,所以把之前混沌状态的知识点,再撸一次,加深印象。 学习的URL:https://zhuanlan.z...

  • Resize,w 360,h 240
    手搓版BPE算法

    从CSDN上弄的,对于简单的测试数据OK,但对于很多字的文本文件,好像有问题。反而我让DEPPSEEK输出的代码,又规范,又能解析更多的文件。用...

  • Resize,w 360,h 240
    [转]大模型基础知识学习笔记之Tokenizer

    一个知识点,一个知识点的慢慢学起来吧。https://www.jianshu.com/p/cff8b080de1e[https://www.ji...

  • Resize,w 360,h 240
    大模型的嵌入层代码实现

    在上次的tokenizer化之后,接下来还要作嵌入层的编码,这些细节,就是要手一次一次打才能熟练吧。人老了,不办法,只能多练。 具体思路如图: ...

  • Resize,w 360,h 240
    大模型中的tokenizer代码实现

    这几天对DeepSeek研究不少,重新把之前不熟悉的知识点再check一下。参照的书籍正是《Build a Large Language Mod...

个人介绍
还将旧来意,怜取眼前人。