Y = wx + b
由于cosθ在[ 0 , π ] 上单调递减,因此θ 有上界,为了使得这个函数随角度单调递减,作者构造一个函数去代替cosθ。
与SphereFace相比,CosineFace最明显的变化就是将cos(t⋅θ)中的t提出来变成cos(θ)-t
优点:更易实现,计算简便、更易收敛(没有softmax的约束)
对于cos(θ+t)可以得到cos(θ+t)=cosθcost−sinθsint,对比CosineFace的cos(θ)−t,ArcFace中的cos(θ+t)不仅形式简单,并且还动态依赖于sinθ,使得网络能够学习到更多的角度特性。
这一过程与“从hardmax的 x到softmax的 ex非线性放大了输出,减小训练难度,使分类问题更容易收敛”正好相反,从 cos(θ+t) 到cos(mθ)] 、 cos(mθ)+ t或cos(mθ)- t,都非线性减小了输出,增加训练难度,使训练得到的特征映射更好
还有一个知乎来着忘记在哪里了
参考链接: