对于一个模型,来新数据后需要将新数据加入训练集。如果重新训练,相当于扔掉了之前的训练,这样是比较浪费的。更好的做法是什么?
可以从最大似然估计的角度理解交叉熵:例如一个图片,该图片的类别服从一个分布P(x),在N次独立同分布实验中(例如让N个人去判断这个图片的类别),...
一、信息量一个事件发生的概率为p,则该事件的信息量为-logp,概率高的事件,其信息量低。二、熵熵为一个随机变量(分布)信息量的期望:三、KL散...
当linux服务器无法访问外网时,docker pull等命令无法使用,可以通过设置docker代理实现:创建以下文件夹: 编辑以下文件: 文件...
linux服务器无法连接外网时,需要通过代理连接外网,设置方式:修改/etc/apt/apt.conf, 参考:链接[https://blog....
1、查看文件的权限以及所属的用户名和用户组: 输出的含义参见链接[https://www.cnblogs.com/zhi-leaf/p/1144...
设input tensor的shape为N, c_in, h_in, w_in,output tensor的shape为N, c_out, h_...
cls head 和 reg head 在四个stage的feature map是共享的,然而,这些feature map的分布是不同的,可不可...
假设kernel size为k,dilation为d,则加上dilation后的kernel size为d * (k - 1) + 1,可以这么...