今天上班手上不用拿昨天的小草和水杯,就只背一个双肩背,真是太轻松啦hhh~不过每天来来回回背电脑还是挺沉的......
生活:
晒一下中午在所里食堂的午饭。。。真的挺难吃的(hhh终于发现比小破邮还难吃的食堂了),还贼贵,一顿饭20.5,实习工资还真是不够花、不够花...明天去中国科学院大学,试试那的食堂味道咋样~
科研:
1、阅读论文《ICNet for Real Time Semantic Segmentation on High-Resolution Images》
@1:更高的准确度意味着更多的计算,如今研究成果大部分能够大大的提高每秒钟处理图片的速度,但是准确度却大大不够(甚至不到60%),而本文中提到的ICNet则做到了实时(速度很快)的基础上,准确率在70%左右,非常厉害。
@2:文中提到尝试的3种加快速度的方法,分别是Downsampling Input(降低输入图片的分辨率),Downsampling Feature(降低特征图的分辨率),and Model compression(减少卷积核),但都不能令人满意。于是,有了本文的方法
@3:将输入图片,降低分辨率,得到三张low,median,high的图片,然后如下图所示,分别在网络中运行,最终通过CFF技术进行合并。这样的好处是,uses the low-resolution input to go through the main semantic segmantation branch and adopts the high-resolution information to help refinement,从而提高速度的同时,又不失准确率。
并且,low和median在网络中可以共享卷积计算,节省了时间。
@4:CCF技术:
合并不同resolution图片的一种方法。如下图所示:
2.找到了PSPNet的prototxt文件,用神器画出了架构图~
这是关键思想部分:(四种大小)
疑惑:
总觉得PSPNet和ICNet的方法有相似之处,但是又不是能弄得很清楚...
明天下午去听第一次组会,听一下学长学姐的理解再看看~