THCudaBlas_SgemmBatched CALL cublasSgemmBatched
-
Function Code
cublasSgemmBatched(state, 'n',//不对a进行转置 'n',//不对b进行转置 m,//输出矩阵的行 n,//输出矩阵的列 k,//[nxk]x[kxm] 1.0f,//参数1 a_b,//矩阵b地址 lda,//列重排行数 b_b,//矩阵a的地址 ldb,//列重排行数 0.0f,//参数2 output_b,//输出的地址 ldc,//输出矩阵的列数 batch);//批大小
-
op='n',默认列存储模式
op_a op_b m n k lda ldb ldc n n 2 3 2 2 2 2 -
op为't',两次列存储
op_a op_b m n k lda ldb ldc n t 2 3 2 2 3 2 -
leading-dimension
op_a op_b m n k lda ldb ldc t n 4 2 1 1 1 4 -
参考文章