近日,中国科学院合肥物质院智能所两篇科研论文同时被人工智能领域顶级会议AAAI 2024接收。两篇论文均出自谢成军与张洁团队,第一作者为硕士生何炫华,团队成员李瑞、颜科宇、胡涛等为论文算法设计思路、部分实验和论文撰写做出了贡献。
多光谱高分辨率的遥感图像对于农业生产监测、灾害监测评估、环境保护等领域具有重要意义。然而,现有基于深度学习的全色锐化算法受到神经网络频率偏好的影响,难以处理图像中的高频信息,并且固定的网络结构难以处理遥感图像中内容变化巨大的情况。为提高全色锐化模型的性能,使其更好地关注高频信息并自适应地处理不同的图像内容,团队提出了频率自适应多专家网络FAME-Net,该方法受到离散余弦变换和多专家网络的启发,通过频率掩码预测器,自适应生成高低频掩码,并将高低频特征分别送入不同的专家网络进行处理,使网络能够分别关注高低频部分,通过门控机制聚合多专家输出,实现对不同图像内容产生动态网络结构。在多个公开数据集上的实验结果表明,FAME-Net具有卓越的性能。相关研究以“Frequency-Adaptive Pan-Sharpening with Mixture of Experts“为题发表。
RAW-to-sRGB是一种颜色空间转换方法,用于将相机捕捉到的原始RAW格式图像数据转换为标准RGB颜色空间,该项研究在计算机底层视觉领域具有重要研究价值与意义。现有的方法往往将RAW-to-sRGB的任务简化为回归问题,忽视了两种图像在空间结构和色彩信息上存在的内在差异,导致这些方法难以产生令人满意的结果。基于RAW图像和sRGB图像之间差异的深入分析,并受到傅立叶变换先验的启示,团队提出了使用频域解耦合的RAW-to-sRGB新方法,设计了一种轻量级的FourierISP网络,该网络通过分别在相位和振幅分量上学习空间和色彩信息的增强,然后将这两种信息进行融合,从而实现了高质量的Raw-to-sRGB转换。实验证明了所提出方法在多个公开数据集上的有效性。相关研究以“Enhancing RAW-to-sRGB with Decoupled Style Structure in Fourier Domain”为题发表。
两项研究工作得到了国家自然科学基金、安徽省自然科学基金、合肥物质研究院院长基金支持。
据悉,AAAI是由国际人工智能促进协会主办的年会,是人工智能领域中历史最悠久、涵盖内容最广泛的国际顶级学术会议之一,也是中国计算机学会(CCF)推荐的A类国际学术会议。本届AAAI会议共有12100篇投稿,打破历史纪录,经过全面严格的审查程序,共有2342篇论文脱颖而出,录取率23.75%。
谢成军与张洁团队长期从事计算机视觉、模式识别等人工智能领域基础理论研究及其在智慧农业、智慧能源、工业自动化及公共安全领域中的应用研究。团队始终坚持面向世界科技前沿、面向国民经济主战场,不断加强基础理论研究和原始技术创新与产业化应用。近年来,团队在人工智能领域顶级会议NeruIPS、CVPR、ICCV、ECCV、AAAI、ACM MM以及IEEE Transaction等期刊上发表论文二十余篇,涵盖遥感图像处理、小样本图像分类、图像生成、因果推理、小目标检测、多模态大模型等技术领域。在工程化实践与成果转化方面,面向农业病虫害监测、能源智能巡检、工业缺陷检测、安全智慧管控等行业数字化、智能化转型需求,开展原创性、引领性人工智能技术赋能行业应用核心技术攻关,形成系列自主知识产权产品及解决方案,相关技术产品在全国范围内进行推广应用。
论文链接:https://arxiv.org/abs/2401.02161
论文链接:https://arxiv.org/abs/2401.02151
图1 FAME-Net网络结构
图2 WorldView-III数据集上不同全色锐化算法对比结果图
图3 FourierISP网络结构
图4 ZRR数据集上不同RAW-to-sRGB方法对比结果图