单节点全部卡:--master_port=25684 --num_gpus=4
单节点部分卡:--include localhost:1,2,3
注意:不能使用CUDA_VISIBLE_DEVICES,无论使用 CUDA_VISIBLE_DEVICES=1,2,3 bash, 或者 CUDA_VISIBLE_DEVICES=1,2,3 deepspeed 都无效
单节点全部卡:--master_port=25684 --num_gpus=4
单节点部分卡:--include localhost:1,2,3
注意:不能使用CUDA_VISIBLE_DEVICES,无论使用 CUDA_VISIBLE_DEVICES=1,2,3 bash, 或者 CUDA_VISIBLE_DEVICES=1,2,3 deepspeed 都无效