尝到了gpt的甜头,觉得可以结合自己的任务训练下,因为用自己的服务器没有那么大的gpu,后来等到lora终于可以跑自己的数据了~不过安装过程中遇到了很多坑!!真的很多坑,安装了4天后来才搞定,觉得相当有价值记录下(主要是想吐槽下这个版本得问题)。
先从github上下载源代码,网址放这了https://github.com/tloen/alpaca-lora。然后照着写得pip install -r requirement.txt。 好的,一堆堆意外开始了。。。
1、网络太差下载不了peft 和transformer两个包
网速不好原因下载peft 和 transformer一直下不了,我是直接进的requirement.txt里面给的github地址下载并安装的。下载并解压到文件夹下手动安装,命令如下:
peft: python setup.py build
python setup.py install
transformer:cd transfomers
pip install . (注意这最后是一个点 . )
特别提示:当然如果你可以直接运行安装requirement最好,如果是手动安装的,一定要下它给的github的版本,我之前尝试直接pip install transfomers,下载出来的版本不对,导致不能和代码匹配,所以一定要下作者给的那个版本。
2. 在安装peft的时候报错有个包一直没找到
忘记具体错误是什么了不过我就记得安装的时候报了一个致命的错误(抱歉人老了记忆不太好),后来纠正是因为python的版本不匹配(又是版本)。python的版本我从3.10换到了3.7换到了3.9后来换到了3.8,真的是折磨人。个人测试 了3.8安装过程很顺,没有一点毛病,注意在安装3.7以及更高版本的python需要提前下载依赖包:
yum install zlib-devel bzip2-devel openssl-devel ncurses-devel \
sqlite-devel readline-devel tk-devel gcc make libffi-devel
如果没有提前下载就安装python的话会报错libff库的错误,所以不要偷这个懒。
3.下载对应的torch和vision以及audio包
去官网下载对应的torch包和另外两个包,一定要版本匹配,你的python是几就是几,cuda是多少就下对应的,我是cuda11.4版本的,我下的11.6,也是可以的。下载的3个地址贴在这里方便用:
torch: https://download.pytorch.org/whl/torch/
vision: https://download.pytorch.org/whl/torchvision/
audio: https://download.pytorch.org/whl/torchaudio/
下载的时候3个文件的cuda和python都要全部对应,还有torch版本对应的vision和audio,比如1.13的torch要下载0.14.1的vision和0.13.1的audio。大家可以在网上查一下再去下。
4. 报错needs_input函数没有找到
OK这个问题折磨了我很久,我记得是_lz开头的某个包里没有这个函数,后来查到是说pandas的版本问题,有的说降低版本,我降低到他的版本后也不行(后来我个人分析是因为pip的问题,pip的版本也会影响下载的版本,所以当时直接狠心全部重新装了一遍)。后来安装的3.8的pandas完全没有这个问题。(3.7,3.9,3.10都有,已经帮你们踩过坑了,真的要崩溃)
5.总结
以上是我遇到的一堆堆错误,反正后来总结出来就是版本匹配真的很重要。作者给的源代码里依赖了其他的库,其他库的版本也得对应才能运行,经过这次我也才发现pip版本都有影响,装大模型真的很麻烦。。好奇为什么其他人那么顺利,唰唰的就能玩了。OK安装问题到这就结束了,感觉我应该把坑都踩了一遍,有问题的可以留言交流。