CV算法岗面试常见问题

面试考的都是深度学习很基本的知识点,但是都理解的不透彻,借着这个机会查漏补缺。

1. 有哪些数据增强的方法

空间几何变换:裁剪,翻转,旋转,缩放,仿射变换,视觉变换(四点透视变换)
像素颜色变换:噪声,模糊,HSV对比度变换,RGB颜色扰动,随机擦除,超像素法,转换,边界检测,锐化与浮雕
多样本合成类
SMOTE(Synthetic Minority Over-sampling Technique),通过人工合成新样本来处理样本不平衡问题,提升分类器性能。
SamplePairing方法,从训练集中随机抽取两张图片分别经过基础数据增强操作(如随机翻转等)处理后经像素取平均值的形式叠加合成一个新的样本,标签为原样本标签中的一种。
mixup是基于邻域风险最小化(VRM)原则的数据增强方法,使用线性插值得到新样本数据。

mixup

总结:mixup、SMOTE、SamplePairing三者思路上有相同之处,都是试图将离散样本点连续化来拟合真实样本分布,但所增加的样本点在特征空间中仍位于已知小样本点所围成的区域内。

2. 如何解决样本不平衡问题

数据层面:数据重采样和产生新数据型(SMOTE)。
模型层面
代价敏感学习,为少数类样本赋予更大的权值
组合集成方法,将多数类数据随机分成少数类数据的量N份,每一份与全部的少数类数据一起训练成为一个分类器,最后再组合。
评价指标:F值,G-Mean,ROC曲线和AUC

3. 还有什么方式可以解决梯度消失问题(BN,LSTM)

BN层解决梯度消失:随着网络加深,数据整体分布逐渐往激活函数的取值区间的上下限两端靠近(sigmoid的饱和区域),导致后向传播时低层神经网络的梯度消失。而BN把越来越偏的分布强制拉回比较标准的分布,这样使得激活输入值落在非饱和区。

4. Dropout的原理和倒置随机失活

让某个神经元以概率p,停止工作。比如dropout比率选择0.4,那么这一层神经元经过drop后,1000个神经元中会有大约400个的值被置为0。
经过上面屏蔽掉某些神经元,使其激活值为0以后,我们还需要对余下的神经元输出进行rescale(扩大倍数),也就是乘以1/(1-p)。(如果你在训练的时候,经过置0后,没有进行rescale,那么你在测试的时候,就需要对权重进行rescale。)
在训练的时候直接将dropout后留下的权重扩大 1/1-p 倍,称为inverted dropout,该操作可以使结果的scale保持不变,而在预测的时候也不用做额外的操作了,更方便一些。

5. Relu永久死亡神经单元

它在输入为负的区段导数恒为零,而使得它对异常值特别敏感。这种异常值会产生很大的梯度,使得参数更新之后导致 ReLU 永久关闭,而杀死神经元。

6. 用softmax做分类函数

假如现在要对1w甚至10w类做分类会出现什么问题?-过拟合,怎么解决,面试官让自己想(不能使用softmax,使用三元组损失)
假如不用交叉熵函数,改用MSE会有什么问题呢?MSE不会收敛。第一、交叉熵函数计算loss是一个凸优化问题,MSE计算loss输出曲线是波动的,有很多局部极值点,变成一个非凸优化问题,不好收敛;第二、sigmod激活函数和mse一起使用时会出现梯度消失

7. 计算卷积/反卷积的感受野

7.1 感受野计算

*最后一层(卷积层或池化层)输出特征图感受野的大小等于卷积核的大小。
*第i层卷积层的感受野


感受野.png

7.2 空洞卷积感受野

stride=1时,相邻的神经元其感受野重合度很高,如果卷积核连续的遍历,就有了冗余。相比之下,空洞卷积,每隔几个选一个参与卷积运算,保证了各个感受野交集的最小化
空洞卷积核的dialate属性定义为卷积核的元素间距,如dialate=2 是每隔一个像素位置应用一个卷积元素,dialate=1就是普通的无孔卷积。
对于stride=k,dialate=d的空洞卷积,计算等价卷积作用大小,代入感受野计算公式。

空洞卷积等价卷积核大小

空洞卷积的优点在于不增加参数的情况下加大感受野。

7. 3 反卷积感受野

网上没有找到详细的资料。这个有点作用https://blog.csdn.net/jiachen0212/article/details/78548667。把反卷积看成stride<1的卷积。

8. 分类损失函数

二分类交叉熵损失.png
多分类交叉熵损失softmax_cross_entropy.png
focal loss.png
KL散度.png
合页损失hinge_loss.png

9. 分割模型

9.1 DeepLab系列

9.2 FPN

FPN提出了一种可有效在单一图片视图下生成对其的多维度特征表达的方法,从而实现对不同尺寸目标的检测。


FPN.JPG

9.3 DenseNet

DenseNet则是通过特征图重用的方式来探索网络的潜能。让网络的每一层的输入变成所有前面层的叠加(concat),然后把它的特征图传递给所有接下来的网络层。传统的CNN如果有L层则有L个连接,而DenseNet如果有L层,则有1/2 L(L+1)个连接。


DenseNet.png

10. CRFs

层层上采样部分,直接用bilinear interpolation(双线性插值)恢复到原状,(因为deconv逆置卷积没什么卵用),然后进行CRFs通过邻域之间的锐化,得到最终分割结果。


CRFs.jpeg

11. Kmeans的改进

  • Kmeans++:对Kmeans聚类中心的随机初始化做改进。基于已有的n个聚类中心选择第n+1个聚类中心。使的距离前n个中心更远的点有更高概率成为新的中心。
  • ISODATA:聚类中心数目k改进为非固定。当属于某个类别的样本数过少时把这个类别去除,当属于某个类别的样本数过多、分散程度较大时把这个类别分为两个子类别。
    ISODATA有分裂与合并两个操作。当某一类所属样本数目过多或者样本分散程度较大时,进行分裂操作。当两个类中心距离接近时,进行合并操作。

12. Python中深拷贝,浅拷贝和赋值

赋值:建立对象的引用,而不改变对象本身(存储位置)
浅拷贝:只复制最外层

浅拷贝.png

深拷贝:全部复制
深拷贝.png

一个不太恰当的比喻,两兄弟a,b和1000家产value
赋值:a=value,b=a,兄弟还没分家,这1000属于共同财产。无论任何一方花钱或者赚钱,都会使另一方受到影响。
浅拷贝:a=value,b=copy.copy(a),半分家状态,兄弟各有300私房钱,剩下400为共同财产。私房钱部分各自独立,二者互不干扰。
深拷贝:a=value,b=copy.deepcopy(a),完全分家,各有500。可能一个成为穷光蛋,一个成为富翁。

可变对象和不可变对象
不可变对象(值的不可变)包括int,float,long,str,tuple等。对于不可变类型的变量,如果要更改变量,则会创建一个新值,把变量绑定到新值上,而旧值如果没有被引用就等待垃圾回收。另外,不可变的类型可以计算hash值,作为字典的key。
可变对象包括list,set,dict等。可变类型数据对对象操作的时候,不需要再在其他地方申请内存,只需要在此对象后面连续申请(+/-)即可,也就是它的内存地址会保持不变,但区域会变长或者变短。

其他链接:从存储位置理解深拷贝浅拷贝

13. Python中0.35/0.05等于多少

十进制转二进制:整数部分用除2取余,小数部分乘2取整,直到小数部分为0。
发现0.05转二进制后是一个循环小数,没办法保存,最后的结果为6.9999。

最后编辑于
©著作权归作者所有,转载或内容合作请联系作者
  • 序言:七十年代末,一起剥皮案震惊了整个滨河市,随后出现的几起案子,更是在滨河造成了极大的恐慌,老刑警刘岩,带你破解...
    沈念sama阅读 212,294评论 6 493
  • 序言:滨河连续发生了三起死亡事件,死亡现场离奇诡异,居然都是意外死亡,警方通过查阅死者的电脑和手机,发现死者居然都...
    沈念sama阅读 90,493评论 3 385
  • 文/潘晓璐 我一进店门,熙熙楼的掌柜王于贵愁眉苦脸地迎上来,“玉大人,你说我怎么就摊上这事。” “怎么了?”我有些...
    开封第一讲书人阅读 157,790评论 0 348
  • 文/不坏的土叔 我叫张陵,是天一观的道长。 经常有香客问我,道长,这世上最难降的妖魔是什么? 我笑而不...
    开封第一讲书人阅读 56,595评论 1 284
  • 正文 为了忘掉前任,我火速办了婚礼,结果婚礼上,老公的妹妹穿的比我还像新娘。我一直安慰自己,他们只是感情好,可当我...
    茶点故事阅读 65,718评论 6 386
  • 文/花漫 我一把揭开白布。 她就那样静静地躺着,像睡着了一般。 火红的嫁衣衬着肌肤如雪。 梳的纹丝不乱的头发上,一...
    开封第一讲书人阅读 49,906评论 1 290
  • 那天,我揣着相机与录音,去河边找鬼。 笑死,一个胖子当着我的面吹牛,可吹牛的内容都是我干的。 我是一名探鬼主播,决...
    沈念sama阅读 39,053评论 3 410
  • 文/苍兰香墨 我猛地睁开眼,长吁一口气:“原来是场噩梦啊……” “哼!你这毒妇竟也来了?” 一声冷哼从身侧响起,我...
    开封第一讲书人阅读 37,797评论 0 268
  • 序言:老挝万荣一对情侣失踪,失踪者是张志新(化名)和其女友刘颖,没想到半个月后,有当地人在树林里发现了一具尸体,经...
    沈念sama阅读 44,250评论 1 303
  • 正文 独居荒郊野岭守林人离奇死亡,尸身上长有42处带血的脓包…… 初始之章·张勋 以下内容为张勋视角 年9月15日...
    茶点故事阅读 36,570评论 2 327
  • 正文 我和宋清朗相恋三年,在试婚纱的时候发现自己被绿了。 大学时的朋友给我发了我未婚夫和他白月光在一起吃饭的照片。...
    茶点故事阅读 38,711评论 1 341
  • 序言:一个原本活蹦乱跳的男人离奇死亡,死状恐怖,灵堂内的尸体忽然破棺而出,到底是诈尸还是另有隐情,我是刑警宁泽,带...
    沈念sama阅读 34,388评论 4 332
  • 正文 年R本政府宣布,位于F岛的核电站,受9级特大地震影响,放射性物质发生泄漏。R本人自食恶果不足惜,却给世界环境...
    茶点故事阅读 40,018评论 3 316
  • 文/蒙蒙 一、第九天 我趴在偏房一处隐蔽的房顶上张望。 院中可真热闹,春花似锦、人声如沸。这庄子的主人今日做“春日...
    开封第一讲书人阅读 30,796评论 0 21
  • 文/苍兰香墨 我抬头看了看天上的太阳。三九已至,却和暖如春,着一层夹袄步出监牢的瞬间,已是汗流浃背。 一阵脚步声响...
    开封第一讲书人阅读 32,023评论 1 266
  • 我被黑心中介骗来泰国打工, 没想到刚下飞机就差点儿被人妖公主榨干…… 1. 我叫王不留,地道东北人。 一个月前我还...
    沈念sama阅读 46,461评论 2 360
  • 正文 我出身青楼,却偏偏与公主长得像,于是被迫代替她去往敌国和亲。 传闻我的和亲对象是个残疾皇子,可洞房花烛夜当晚...
    茶点故事阅读 43,595评论 2 350