弹性变换和镜像变换

    最近在看U-Net处理医学图像时,用到了弹性变换等,因为变异组织本身就是弹性变换的,可以通过这种方法进行数据扩增。

    对于图像而言,常用的增加训练样本的方法主要有对图像进行旋转、移位等仿射变换,也可以使用镜像变换等等。

(1)弹性变换

    这里介绍弹性变换(Elastic Distortion)。对原图像进行弹性变换的操作扩充样本以后,对于手写体数字的识别效果有明显的提升。

    首先来详细介绍一下算法流程:

        (1)首先需要对图像中的每个像素点(x,y)产生两个-1~1之间的随机数,Δx(x,y)和Δy(x,y),分别表示该像素点的x方向和y方向的移动距离;

        (2)生成一个以0为均值,以σ为标准差的大小为n*n的高斯核k_nn,并用前面的随机数与之做卷积,并将结果作用于原图像。

    作者在这里提出σ的大小与弹性变换的处理结果息息相关,如果σ过小,则生成的结果类似与对图像每个像素进行随机移动,而如果σ过大,则生成的结果与原图基本类似。不同的σ效果如下

n = 5,σ=4,8,16时


n = 21,σ= 4,8,16


n = 105,σ = 4,8,16时

可以看出来,只有在n足够大(与要处理的图像相比),且σ大小合适时才能够到合适的扭曲图像,如图所示,这里n = 105且σ=8时比较合适。

    部分参考:https://blog.csdn.net/lhanchao/article/details/54234490

(2)其他变换

    沿坐标轴缩放

    沿任意方向缩放

    正交投影

    镜像

    切变:切变是坐标系的变换,非均匀的拉伸。切变时候,角度变化,但是面积或体积不变。也可以理解为坐标轴间的角度变化,造成的扭曲。

    以上变换均属于矩阵变换。

(3)图像变换的一些代码

        x = 1150

        y = 15

        w = 150

        h = 30

        region = im.crop((x, y, x+w, y+h))

        region#图像裁剪 


        #图像resize

        import cv2

        im1 = cv2.imread('1.jpg')

        im2 = cv2.resize(im1, (1024,1024), interpolation=cv2.INTER_CUBIC)

        cv2.imwrite('3.jpg', im2)


        #图像批量操作

        import os

        fpath = "D:/Data/CAG/No"

        dpath = "D:/Data/CAG/1"

        for filename in os.listdir(fpath):   

        im1 = cv2.imread(fpath+"/"+filename)

        im2 = cv2.resize(im1, (1024,1024), interpolation=cv2.INTER_AREA)

        filename.replace('.jpg','.bmp')

        cv2.imwrite(dpath+'/'+filename, im2)

        print("1")


        #水平翻转

        import cv2

        import os

        fpath = "D:/Data/CAG/train1"

        dpath = "D:/Data/CAG/h_flip"

        for filename in os.listdir(fpath):   

            im1 = cv2.imread(fpath+"/"+filename)

            h_flip = cv2.flip(im1, 1)

            strlist = filename.split('.')

            m = int(strlist[-2])+600

            filename1 = strlist[0]+'.'+str(m)+'.bmp'

             cv2.imwrite(dpath+'/'+filename1, h_flip)

        print("1")


#垂直翻转

import cv2

import os

fpath = "D:/Data/CAG/train1"

dpath = "D:/Data/CAG/v_flip"

for filename in os.listdir(fpath):   

    im1 = cv2.imread(fpath+"/"+filename)

    h_flip = cv2.flip(im1, 0)

    strlist = filename.split('.')

    m = int(strlist[-2])+1200

    filename1 = strlist[0]+'.'+str(m)+'.bmp'

    cv2.imwrite(dpath+'/'+filename1, h_flip)

print("1")


#水平垂直翻转

import cv2

import os

fpath = "D:/Data/CAG/train1"

dpath = "D:/Data/CAG/hv_flip"

for filename in os.listdir(fpath):   

    im1 = cv2.imread(fpath+"/"+filename)

    h_flip = cv2.flip(im1, -1)

    strlist = filename.split('.')

    m = int(strlist[-2])+1800

    filename1 = strlist[0]+'.'+str(m)+'.bmp'

    cv2.imwrite(dpath+'/'+filename1, h_flip)

print("1")

最后编辑于
©著作权归作者所有,转载或内容合作请联系作者
【社区内容提示】社区部分内容疑似由AI辅助生成,浏览时请结合常识与多方信息审慎甄别。
平台声明:文章内容(如有图片或视频亦包括在内)由作者上传并发布,文章内容仅代表作者本人观点,简书系信息发布平台,仅提供信息存储服务。

推荐阅读更多精彩内容

  • 深入理解傅里叶变换Mar 12, 2017 这原本是我在知乎上对傅立叶变换、拉普拉斯变换、Z变换的联系?为什么要进...
    价值趋势技术派阅读 11,076评论 2 2
  • 直方图变换 灰度变换 点运算 几何变换 直方图变换 1.灰度直方图 灰度直方图:数字图像中每一灰度级像素出现的频次...
    hyfine阅读 10,397评论 0 0
  • 本章介绍了基于elastix的基本配准概念。 更高级的配准主题将在第6章中讨论。图像配准是医学影像领域的重要工具。...
    peterpan_hai阅读 13,454评论 1 10
  • 1.今日事今日畢,迴向給自己,建立對自己的信任感。為自己點贊。 收拾新家;給新客戶送國學機;老客戶問題國學機直接換...
    李豪亮阅读 1,342评论 0 0
  • 01 在百度里搜索无趣有以下几种意思: 没意思,没趣;缺乏悠闲、温雅、风韵、活泼、逼真、兴趣或风趣。 百度百科的意...
    辰苓阅读 4,500评论 0 0

友情链接更多精彩内容