240 发简信
IP属地:河北
  • Resize,w 360,h 240
    原理

    [图片上传失败...(image-b4a8ef-1740983460219)] [图片上传失败...(image-d5bf1d-17409834...

  • LLama1, LLama2和LLama3的区别有哪些?

    LLama1, LLama2和LLama3的区别有哪些? 参数规模第一代和第二代的Llama模型都包含了四个不同参数规模的版本,其中最小的模型参...

  • 手写一下正弦编码和旋转位置编码的代码?

    获取更多面试真题的集合,请移步至 https://pica.zhimg.com/80/v2-7fd6e77f69aa02c34ca8c33487...

  • 大模型面试题:目前大模型中的位置编码有哪些?

    我整理了很多的算法题,详情见参考链接1 在大模型中,位置编码主要分为两大派:绝对位置编码和相对位置编码。主流的几种脍炙人口的位置编码如下所示: ...

  • 大模型面试题:常见的微调方法有哪些说下原理并对比

    更多实时面试题总结请关注我的公众号"算法狗" 或移步至 https://pica.zhimg.com/80/v2-7fd6e77f69aa02...

  • Encoder-only结构能适合于生成式任务吗

    Encoder-only结构能适合于生成式任务吗? 更多实时面试题总结请关注我的公众号"算法狗" 目前基于Enodee-only的结构主要用于编...

  • 大模型面试题:目前大模型中的位置编码有哪些?

    获取更多面试真题的集合,请移步至 https://pica.zhimg.com/80/v2-7fd6e77f69aa02c34ca8c3348...

  • 大模型面试题:LLAMA中的FFN层作用是什么?

    获取更多面试真题的集合,请移看参考链接3 总结上网上看到的一些分析,毕竟当时Transformer提出来的时候,可能也没考虑到会被研究的这么细。...

  • 大模型面试题:Prefix LM和Causal LM的区别是啥?

    获取更多面试真题的集合,请移步至 https://i.afbcs.cn/naPbNY[https://i.afbcs.cn/naPbNY] 说白...