Visual illusion cognition dataset construction and recognition performance by deep neural networks

背景(Background)

创新点(Highlights)

结合场景模拟的方式,在Unity3D中构建两类典型的视错觉场景,设计二维图像模拟生成策略,获取视错觉场景数据集。然后运用UNet、SegNet、PSPNet、DeepLabv3+多种语义分割深度神经网络训练及测试,根据视错觉图像的分割性能结果获得人眼视错觉认知在深度神经网络上的建模表达情况。

方法(Methodology)

结合场景模拟的方式,在Unity3D中构建两类典型的视错觉场景,设计二维图像模拟生成策略,获取视错觉场景数据集。然后运用UNet、SegNet、PSPNet、DeepLabv3+多种语义分割深度神经网络训练及测试,根据视错觉图像的分割性能结果获得人眼视错觉认知在深度神经网络上的建模表达情况。

实验(Experiments)

(1) 在Unity3D中,结合场景中的光照、阴影、形状、视角、位置、大小等物理属性,构建了立体图形棋盘阴影视错觉场景和平面图形同时对比视错觉场景;

(2) 在三维空间中结合几何形状布局和几何图形叠加的场景拓展策略,对两类视错觉场景分别进行数据增强并实时给图像标注语义标签,生成了大约含有20000张二维图像的视错觉场景数据集。

(3) 根据语义分割模型评价指标,分别运用UNet、SegNet、PSPNet、DeepLab-V3+语义分割深度神经网络进行视错觉识别分割性能实验,并分析实验结果得到结论。

结论(Conclusion)

(1) 人眼视错觉的认知结果在整体上同样可以由深度神经网络较好地得到建模表达;

(2) 人眼视错觉的认知过程仍然能够直接被深度卷积神经网络处理,而不需要其他的神秘机制;

(3) 在对视错觉图像的理解上,人眼视觉认知与机器视觉认知具有人机语义一致性,为发展更强壮的机器视觉模型提供了启发价值。

相关链接(Links)

Li T, Wang F, Zhou Y, et al. Visual illusion cognition dataset construction and recognition performance by deep neural networks[C]//2022 IEEE 8th International Conference on Cloud Computing and Intelligent Systems (CCIS). IEEE, 2022: 90-94.

http://ieeexplore.ieee.org/abstract/document/10016369