1. 实验设置
数据:训练阶段使用MNIST训练集中的0-4类,测试阶段使用MNIST测试集中所有类,观察分类器在已知类(5139)和未知类(4861)上的结果。
模型:使用AAE模型,含4个子模块:分类器,编码器,解码器,判别器。分类器使用fc,编码器使用cov,解码器使用dcov,判别器分别使用ls(平方损失),sn,snw(w距离下的sn)。AAE的隐变量先验为混合高斯。
损失类型:a)分类损失,b)重构损失,c)先验损失,d)熵正则化。对比模型:(1)a+b+c;(2)a+b+c+d。
结果:使用已知和未知类类熵的总体分布,低值区域,top2的差3个结果来对比;解码器对应增加测试集生成图;判别器增加t-sne低维流形可视化。
2. 结果
500个样本隐变量t-sne可视化,按照训练集标签,训练集嵌入,测试集嵌入:
ls判别器的:
sn判别器的:
snw判别器的:
从隐变量sample的生成图像(ls,sn,snw):
从测试集重构的图像(ls,sn,snw):
熵总体分布(ls,sn,snw):
熵低值分布(ls,sn,snw):
top2差值分布(ls,sn,snw):