天下武功,唯快不破
最近网友问了关于点云、倾斜摄影数据的性能优化问题。本来想刀枪剑戟、斧钺勾叉给弄了,但是后来想性能其实是个系统问题,要在第22节分成数小节扎扎实实的讲一讲。
鸣谢
非常感谢王锐王大神的cookbook,我准备主要参考它里面关于性能的一章。也就是第8章。本节讲述性能优化的最基本的手段:压缩纹理。
本节资源
本文集包括本节所有资源包括模型代码都在此下载,按节的序号有文件或文件夹:
注意:务必使用浏览器打开:
链接:https://pan.baidu.com/s/13gwJLwo_LbRnN3Bl2NXXXw
提取码:xrf5
理论知识
1.我们都知道,纹理的存储是RGBA,这四个数字假如不压缩的话其占用的存储空间是相当大的,每个通道按0~255 一个字节来计算,一个像素RGBA是4个字节(byte),一个1024x1024这么大的图片会占用1024x1024x4=4M。如果不经压缩,一个GPU显存在4GB的显卡,也只能存储1024张1024x1024的图片。这显然不合常理。有时候我们在处理tiff图像时,指定不使用压缩,则随便一个大小出来就是几十个GB,那就是什么显卡也存不了了。
2.所以无论是CPU还是GPU都支持对纹理进行压缩。压缩的算法也一大摞,它们是针对不同的场景来使用的。纹理压缩之后,要以有效的降低CPU的内存和CPU的显存的使用。最关键的是还能有效的减少模型占用的存储空间。
3.理论上,压缩与解压消耗的是CPU与GPU的使用率,所以使用压缩会使计算量增加,会使内存和显存使用率降低。以下是分配了20x20=400个512x512的RGB的压缩前后的CPU/GPU使用率与显存内存占用率的对比。理论上这么些图片和像素占用的存储是300M。
可以看到可以对CPU/GPU端的存储使用明显下降,CPU使用率略升高,GPU因为是并行处理且对于图像压缩更加成熟,其使用率和显存都降低了,因此没有理由不使用纹理压缩。
实际实践
- 我们只需要对texture使用以下语句就能按算法压缩的功能:
texture->setInternalFormatMode(osg::Texture2D::USE_S3TC_DXT1_COMPRESSION);
texture->setUnRefImageDataAfterApply(true);
第一句setInternalFormatMode是为了设置压缩格式。
第二句setUnRefImageDataAfterApply是图片传送到GPU端之后,CPU端就会释放掉。这也就是很多texture明明有东西,但是获取image想输出,结果发现image是0的原因。
- 我们使用随机颜色,放入到申请的纹理当中。
osg::ref_ptr<osg::Image> image = new osg::Image;
image->allocateImage(width, height, 1, GL_RGB, GL_UNSIGNED_BYTE);
unsigned char* data = image->data();
for (int y = 0; y < height; ++y)
{
for (int x = 0; x < width; ++x)
{
*(data++) = randomValue(0.0f, 255.0f);
*(data++) = randomValue(0.0f, 255.0f);
*(data++) = randomValue(0.0f, 255.0f);
}
}
return image.release();
以下是全部代码
/* -*-c++-*- OpenSceneGraph Cookbook
* Chapter 8 Recipe 2
* Author: Wang Rui <wangray84 at gmail dot com>
*/
#include <osg/Texture2D>
#include <osg/Geometry>
#include <osg/Group>
#include <osgDB/ReadFile>
#include <osgViewer/ViewerEventHandlers>
#include <osgViewer/Viewer>
#define COMPRESS_TEXTURE // Comment this to disable compressing textures
float randomValue(float min, float max)
{
return (min + (float)rand() / (RAND_MAX + 1.0f) * (max - min));
}
osg::Vec3 randomVector(float min, float max)
{
return osg::Vec3(randomValue(min, max),
randomValue(min, max),
randomValue(min, max));
}
osg::Matrix randomMatrix(float min, float max)
{
osg::Vec3 rot = randomVector(-osg::PI, osg::PI);
osg::Vec3 pos = randomVector(min, max);
return osg::Matrix::rotate(rot[0], osg::X_AXIS, rot[1], osg::Y_AXIS, rot[2], osg::Z_AXIS) *
osg::Matrix::translate(pos);
}
osg::Image* createRandomImage(int width, int height)
{
osg::ref_ptr<osg::Image> image = new osg::Image;
image->allocateImage(width, height, 1, GL_RGB, GL_UNSIGNED_BYTE);
unsigned char* data = image->data();
for (int y = 0; y < height; ++y)
{
for (int x = 0; x < width; ++x)
{
*(data++) = randomValue(0.0f, 255.0f);
*(data++) = randomValue(0.0f, 255.0f);
*(data++) = randomValue(0.0f, 255.0f);
}
}
return image.release();
}
osg::Node* createQuads(unsigned int cols, unsigned int rows)
{
osg::ref_ptr<osg::Geode> geode = new osg::Geode;
for (unsigned int y = 0; y < rows; ++y)
{
for (unsigned int x = 0; x < cols; ++x)
{
osg::ref_ptr<osg::Texture2D> texture = new osg::Texture2D;
texture->setImage(createRandomImage(512, 512));
#ifdef COMPRESS_TEXTURE
texture->setInternalFormatMode(osg::Texture2D::USE_S3TC_DXT1_COMPRESSION);
texture->setUnRefImageDataAfterApply(true);
#endif
osg::Vec3 center((float)x, 0.0f, (float)y);
osg::ref_ptr<osg::Drawable> quad = osg::createTexturedQuadGeometry(
center, osg::Vec3(0.9f, 0.0f, 0.0f), osg::Vec3(0.0f, 0.0f, 0.9f));
quad->getOrCreateStateSet()->setTextureAttributeAndModes(0, texture.get());
geode->addDrawable(quad.get());
}
}
return geode.release();
}
int main(int argc, char** argv)
{
osgViewer::Viewer viewer;
viewer.setSceneData(createQuads(20, 20));
viewer.addEventHandler(new osgViewer::StatsHandler);
return viewer.run();
}