近日,中国科学院合肥物质院智能所智慧农业研究中心王儒敬研究员团队提出了一种可学习全频变压器双生成对抗网络方法,可显著提升水下成像质量。相关研究成果发表在海洋科学领域TOP期刊Frontiers in marine science上。
水下成像面临着一系列严峻的挑战,如颜色失真、噪声干扰和低对比度问题,这些问题极大地削弱了图像的视觉质量。为了攻克这些难题,科研团队提出了一种创新的方法——可学习全频变压器双生成对抗网络(LFT-DGAN)。该方法首先引入了一种基于可逆卷积的图像分解技术,能够将水下图像的信息精准地分解为低频、中频和高频域,有助于更全面地提取图像特征;然后,利用图像通道和空间之间的相似性,构建了一个可学习的全频域变压器,促进不同信息分支之间的交流与融合;最后,开发了一种功能强大的双域鉴别器,具备学习水下图像空间特征的能力,能够深入捕捉其频域特征。在UIEB数据集上,通过LFT-DGAN方法增强后的图像质量在PSNR、SSIM、UQIM、UCIQE指标上比最先进算法(CWR、Semi-UIR、RCT等)分别平均提高4.3%、9.4%、21.6%、24.7%。
郑世健博士生为论文第一作者,汪六三副研究员为论文通讯作者。该项研究工作得到了国家自然科学基金、国家重点研发计划的支持。
论文链接为:https://www.frontiersin.org/articles/10.3389/fmars.2024.1321549/full
LFT-DGAN网络的整体架构
生成器框架