结论:下载bert模型时候用的transformer版本也要是3.4.0, 3090 pytorch和别的不一样
记录一下这两天反复被bert, tranformers环境折磨的心路历程。
由于实验室这两天有线网出现一些问题,断断续续的连不上网,我决定租一台云GPU运行我的ablation实验。
费了老大功夫,把算法上传到云盘,命令行解压的时候各种告诉我找不到文件,结果发现是东西太大,还没压缩成功我就上传了😓。
好吧,在反复压缩-上传-解压,我还是打开了我的文件。
开始配置环境(好耶!😄)
我配置了和本地相同的环境(transformers 3.x),结果怎么都不能加载bert 报错说没有用tf==2.x
我又重新配置了transformer 2.8.0,结果说代码中的output_attention不存在😢
然后就开始了反复配置环境-出错-重新配置的过程
最终发现了这个解决方法
清空transformer缓存的bert模型,在transofrmer为3.4.0的配置下重新下载bert模型
终于是解决了问题😄