花了两天时间,终于搞好了travis的自动部署,总结一下。估计很多人也会遇到相似的问题。
travis工作原理
理解工作方式对解决后面的问题很重要
我也就大概理解了一下,发现后面的问题都清晰了很多
我一开始以为,travis是在你的本机做测试和部署,其实不是的。travis会在他的服务器为你跑个容器之类的东西,是不是docker我也没仔细查资料,这里就可以理解为什么要把私钥加密上传了。
ssh免密的原理就是简单的rsa签名认证,有了私钥就能签名了,所以你上传了加密私钥之后,travis会在容器中使用
openssl aes-256-cbc -K $encrypted_9635d272d587_key -iv $encrypted_9635d272d587_iv
-in id_rsa.enc -out ~/.ssh/id_rsa -d
这个命令把加密私钥解密到~/.ssh/id_rsa
目录.
注意这个~/.ssh/id_rsa
不是你的本地目录或者你的远程主机,是travis的容器。后面的一个问题就会涉及到这里。
理解上面的内容很重要,远程部署的坑基本就在这里面
我部署过程参考的资料是这个
Travis-ci 远程构建 + 自动化部署
一些基本的问题里面都有写,就不赘述了
Windows不兼容
这是最坑的地方!travis对Windows的支持很差很差,你可以在Windows上运行travis encrypt-file ~/.ssh/id_rsa --add
,但是生成的结果并不可用,在连接服务器时会出现Permission denied (publickey,gssapi-keyex,gssapi-with-mic).
就算是,在linux上面生成加密文件,再复制到Windows上,仍然会出现这样的情况。我认为可能是出现在Windows本身生成的.pub文件有兼容问题。
就这个连接服务器的问题,我折腾了一天。Windows上开发linux部署应该是很常见的场景才对。
解决方法
使用Win10的Ubuntu子系统
我感觉这可能是唯一的解决方法。看了很多人在github上面给官方提的issues,也没有可行的办法。
我为了把整个环境全部搞到WSL上,把vscode的git源也换成了WSL的,理论上这一步是不用的,只要你的私钥是在linux上生成就ok了。分开用总会有点强迫症...
顺便说一句,WSL配合cmder体验挺不错的,刚出来的时候挺多人喷,现在感觉还不错,这可能是目前Windows开发linux部署场景下最佳的解决方案了
文件权限不够
这个错误是很常见的
Warning: Permanently added '118.89.48.63' (ECDSA) to the list of known hosts.
@@@@@@@@@@@@@@@@@@@@@@@@@@@@@@@@@@@@@@@@@@@@@@@@@@@@@@@@@@@
@ WARNING: UNPROTECTED PRIVATE KEY FILE! @
@@@@@@@@@@@@@@@@@@@@@@@@@@@@@@@@@@@@@@@@@@@@@@@@@@@@@@@@@@@
Permissions 0664 for '/home/travis/.ssh/id_rsa' are too open.
It is required that your private key files are NOT accessible by others.
This private key will be ignored.
bad permissions: ignore key: /home/travis/.ssh/id_rsa
Permission denied (publickey,gssapi-keyex,gssapi-with-mic).
这就涉及到前面说的,travis怎么运行的问题了
我开始在本机上修改了文件权限,在云端修改了文件权限,都不行。
仔细一看/home/travis/.ssh/id_rsa
我哪里有这个目录啊,查了资料才意识到,特么这是跑在容器里的啊
解决方法
before_install:
- openssl aes-256-cbc -K $encrypted_9635d272d587_key -iv $encrypted_9635d272d587_iv
-in id_rsa.enc -out ~/.ssh/id_rsa -d
- chmod 600 ~/.ssh/id_rsa
- eval $(ssh-agent)
这样写就会在docker里面执行权限修改了
改了文件位置
切记travis encrypt-file ~/.ssh/id_rsa --add
后,不要改生成命令,生成的命令是运行在容器而不是本机的。改了之后会报错的。
执行build脚本
在服务器上肯定是要用shell脚本去执行build的,而在Windows上新建文件是用的CRLF的,直接source里面的语句会报错,改成LF即可。
after_success部分不能判断远程部署是否成功
这个我还没有实践,目前的想法是通过shell脚本的命令返回值来判断,并且把远程部署的部分写到script而不是after_success。试过了再来更新