前言
几乎绝大部分图像操作的前置处理都会把rgb彩色图转为灰度图,然后再进行二值化操作等等。opencv读取图像,一般都是彩色图,即包含bgr三通道,而灰度图则只包含一个通道,只含亮度信息,不含色彩信息的图象,就象我们平时看到的黑白照片:亮度由暗到明,变化是连续的。因此,要表示灰度图,就需要把亮度值进行量化。通常划分成0到255共256个级别,其中0最暗(全黑),255最亮(全白)。在表示颜色的方法中,除了RGB外,还有一种叫YUV的表示方法,应用也很多。电视信号中用的就是一种类似于YUV的颜色表示方法。在这种表示方法中,Y分量的物理含义就是亮度,Y分量包含了灰度图的所有信息,只用Y分量就能完全能够表示出一幅灰度图来。
彩色图转灰度图方法
一般而言,将彩色图转换为灰度图有以下几种方法:
(1)最大值法
将彩色图像中每个像素的rgb分量中亮度的最大值作为灰度图的灰度值
(2)平均值法
将彩色图像中的每个像素的rgb三分量求平均得到一个灰度图的灰度值
(3)加权平均法
由于人眼对红绿蓝三种颜色的敏感程度不同,在灰度转换时,每个颜色分配的权重也是不同的,由此得到色彩心理学公式:
Gray=0.299red+0.587green+0.114*blue
第三种的加权平均法也是使用最为广泛的方法,本次试验也是使用这个方法
cuda试验
还是首先上代码
#include "cuda_runtime.h"
#include "device_launch_parameters.h"
#include <cuda.h>
#include <device_functions.h>
#include <opencv2\opencv.hpp>
#include <iostream>
using namespace std;
using namespace cv;
//输入图像为BGR图,将其转化为gray图
__global__ void rgb2grayInCuda(uchar3* dataIn, unsigned char* dataOut, int imgHeight, int imgWidth)
{
int xIndex = threadIdx.x + blockIdx.x * blockDim.x;
int yIndex = threadIdx.y + blockIdx.y * blockDim.y;
if (xIndex < imgWidth && yIndex < imgHeight)
{
uchar3 rgb = dataIn[yIndex * imgWidth + xIndex];
dataOut[yIndex * imgWidth + xIndex] = 0.299f * rgb.x + 0.587f * rgb.y + 0.114f * rgb.z;
}
}
int main()
{
Mat srcImg = imread("D:\\work\\code\\blog\\bin\\win64\\Release\\20140702104508726.jpg");//输入图片
int imgHeight = srcImg.rows;
int imgWidth = srcImg.cols;
Mat grayImg(imgHeight, imgWidth, CV_8UC1, Scalar(0));//输出灰度图
double time1 = static_cast<double>(cv::getTickCount());
cvtColor(srcImg, grayImg, CV_BGR2GRAY);
double time2 = static_cast<double>(cv::getTickCount());
std::cout << "cpu Time use: " << 1000 * (time2 - time1) / cv::getTickFrequency() << "ms" << std::endl;//输出运行时间
cv::imwrite("gray_cpu.jpg", grayImg);
//在GPU中开辟输入输出空间
uchar3* d_in;
unsigned char* d_out;
int* d_hist;
cudaMalloc((void**)&d_in, imgHeight * imgWidth * sizeof(uchar3));
cudaMalloc((void**)&d_out, imgHeight * imgWidth * sizeof(unsigned char));
//将图像数据传入GPU中
cudaMemcpy(d_in, srcImg.data, imgHeight * imgWidth * sizeof(uchar3), cudaMemcpyHostToDevice);
dim3 threadsPerBlock(32, 32);
dim3 blocksPerGrid((imgWidth + threadsPerBlock.x - 1) / threadsPerBlock.x, (imgHeight + threadsPerBlock.y - 1) / threadsPerBlock.y);
//记录起始时间
cudaEvent_t start, stop;
cudaEventCreate(&start);
cudaEventCreate(&stop);
cudaEventRecord(start, 0);
//灰度化
rgb2grayInCuda << <blocksPerGrid, threadsPerBlock >> > (d_in, d_out, imgHeight, imgWidth);
//将数据从GPU传回CPU
cudaMemcpy(grayImg.data, d_out, imgHeight * imgWidth * sizeof(unsigned char), cudaMemcpyDeviceToHost);
cudaEventRecord(stop, 0);
cudaEventSynchronize(stop);
float elapsedTime;
cudaEventElapsedTime(&elapsedTime, start, stop);
printf("gpu time cost: %3.5f ms", elapsedTime);
cv::imwrite("gray_gpu.jpg", grayImg);
cudaFree(d_in);
cudaFree(d_out);
cudaFree(d_hist);
return 0;
}
得出的cpu和gpu的灰度化图片肉眼可见的有些许差别,详细见下图
时间的测试如下:
基本上cpu所耗时间是gpu的21倍左右
对比cpu和gpu的输出的灰度图,可以发现,gpu的版本会略微暗一些,所以猜测opencv不是直接用的这个公式
Gray=0.299red+0.587green+0.114*blue
经过查阅,发现还有其他的灰度图计算公式,比如为了避免浮点运算,将上面的公式改为:
Gray=(30red+59green+11*blue + 50 )/ 100
将代码改成这个整数计算公式后,输出的gpu和cpu的灰度图则完全一模一样
最终gpu版本计算灰度值的代码改为(这里要注意opencv读取的图片,通道顺序为BGR):
dataOut[yIndex * imgWidth + xIndex] = (11 * rgb.x+ 59 * rgb.y + 30 * rgb.z + 50)/100;
最终输出效果图为: