详情

快速图像补全算法研究

申报人:莫佳婷 申报日期:2024-11-02

基本情况

2025年度大学生创新创业训练计划
快速图像补全算法研究 学生选题
创新训练项目
理学
数学类
学生自主选题
一年半期
本项目从图像补全这个实际应用出发,将该问题建模张量补全问题,并挖掘张量数据的低秩性质, 从而设计凸与非凸求解算法。
  • 2021-2023   国家自然科学基金青年基金   “基于矩阵低秩结构谱稀疏信号恢复和盲反卷积”   在研   主持

- 在问题建模方面给予指导,完成图像补全的数学建模,建立数学优化问题模型

- 在算法设计方面给予指导,完成快速求解算法设计

校级

项目成员

序号 学生 所属学院 专业 年级 项目中的分工 成员类型
莫佳婷 数学学院 信息与计算科学 2023 撰写者
桑伊诺 数学学院 数学与应用数学 2023 输出者
陈心雨 数学学院 信息与计算科学 2023 设计者

指导教师

序号 教师姓名 教师账号 所属学院 是否企业导师 教师类型
陈金池 09225 数学学院

立项依据

随着人工智能和大数据时代的到来,张量(多维数组)被广泛应用于图像处理、信号处理、推荐系统和机器学习等领域。然而,实际应用中,张量数据常常因缺失数据而导致信息的不完整,影响了后续的分析和决策。

研究低秩张量补全能够有效地恢复缺失的数据信息,利用张量的低秩性质(即在适当的基下,张量可以用较少的非零元素表示)来提升数据的完整性和准确性。这不仅能够改善模型的性能,还可以在数据稀疏或噪声环境中,提供更可靠的结果。

此外,低秩张量补全在跨模态学习和多视角数据融合等应用中,能够帮助我们更好地理解和挖掘复杂数据结构之间的关系,促进智能系统的自动化和智能化。因此,研究这一领域具有重要的理论价值和广泛的实际应用前景,推动了相关技术的发展和创新。

本项目从图像补全这个实际应用出发,将该问题建模张量补全问题,并挖掘张量数据的低秩性质,从而设计凸与非凸求解算法。


国外研究现状:
在国外,传统的图像补全方法主要依赖于纹理合成和边缘引导技术,如基于PatchMatch的算法,这类方法通过寻找相似的图像块来填补缺失区域。近年来,基于深度学习的图像补全方法逐渐成为主流。例如,Generative Adversarial Networks (GANs)被广泛应用于图像补全任务,其中Contextual Attention Network和DeepFill等方法利用深度卷积神经网络(CNN)和生成对抗网络(GAN)进行图像修复,通过上下文信息和局部特征的学习提高了补全效果。此外,U-Net架构也被用于图像修复,借助其强大的特征提取和上下文信息整合能力,有效提升了修复质量。
国内研究现状:
国内的研究主要集中在基于深度学习的图像补全算法,许多研究借鉴了国外的成功经验并进行本土化创新。国内研究者提出了多种基于CNN和GAN的图像补全模型,如采用生成对抗网络进行缺失区域预测和修复,或者结合自注意力机制提高补全效果。近年来,基于深度神经网络的图像补全方法在速度和精度上都取得了较大提升,尤其是在面对复杂的缺失模式和大规模数据集时,表现出了较强的泛化能力。
研究动态:
当前图像补全领域的研究趋势主要包括提高算法的速度和精度,例如通过改进网络结构减少计算复杂度;进一步提高算法在大规模数据上的应用能力;以及探索基于少量标注数据的图像补全方法。另一重要方向是多模态图像补全,即结合文本或其他模态信息来增强图像修复效果。
总体来看,图像补全技术正朝着更高效、更精准的方向发展,并广泛应用于电影后期制作、医学影像、艺术修复等领域。

本项目的创新点包括如下2点:

1.将数学理论与实际应用相结合,将之前所学的线性代数、数值分析等知识用于解决具体的张量数据重构问题;

新的求解重构算法。

2.本项目从实际应用出发,针对图像处理中的张量补全问题提出新的求解算法,并适应于大规模数据集场景

该项目的难点是如何刻画张量的低秩性质以及如何设计快速求解算法。相比于矩阵的低秩性质,张量具有更加丰富的低秩刻画方式,包括CP-分解、Tucker分解等,因此如何利用图像数据潜在结构选择合适的低秩刻画方式是第一个难点。此外为了适应于大规模数据处理场景,本项目的另一个难点是如何设计计算复杂度比较低的快速求解算法。

针对上述难点,本项目的研究思路和方法包括如下亮点:

1.本项目深入挖掘图像数据的特征,从T-SVD出发,选择一种变换域下的低秩性质来刻画数据潜在低维结构。研究表明,该低秩结构能够更好的刻画图像数据的低维结构,同时还具有快速计算算法;通过从变换域的角度进行低秩性质刻画,能够为图像数据提供更加精确的表示方式,相比传统的矩阵低秩方法,提升了对复杂图像数据的建模能力,同时具备较低的计算复杂度和更高的处理效率。

2.本项目挖掘图像数据的T-SVD特征,从张量分解的角度设计快速求解算法,并通过数值仿真验证算法的可行性。结合高维统计与非凸优化理论,算法能够有效应对初始值选择对收敛性的影响,实现快速、稳定的求解过程, 进一步提升在实际应用中的可行性和应用价值。

1. 第一阶段

查阅资料:深入研究张量补全领域的相关文献,包括经典的CP - 分解、Tucker分解以及T-SVD等相关理论,了解现有算法的优缺点,为后续研究提供理论基础。

调研实际应用需求:针对图像补全在图像处理等领域的应用现状,收集相关数据和案例,分析实际应用中对张量补全算法的具体需求和挑战。

2. 第二阶段

设计项目研究方案:根据对文献和实际需求的调研,确定以图像补全为切入点,选择从T - SVD出发的变换域下的低秩性质来刻画图像数据的潜在低维结构,并设计基于此的凸与非凸求解算法框架。

完成算法初步设计:结合张量分解的原理,初步设计出能够利用图像数据T - SVD特征的快速求解算法,明确算法的主要步骤和计算流程。

3. 第三阶段

实验研究与数据收集:使用图像处理领域的标准数据集进行算法的实验研究,记录不同参数设置下算法的运行结果。

数据统计与初步分析:对实验收集的数据进行统计分析,观察找出可能存在的问题和改进方向。

4.  第四阶段

算法优化与改进:根据上一阶段的分析结果,针对算法的不足之处进行优化。

5. 第五阶段

填写结题表:按照学校要求,如实填写结题表,详细汇报项目的完成情况、研究成果、经费使用情况等信息。

撰写研究论文和总结报告:撰写学术论文,阐述项目研究的背景、意义、方法、成果及创新点,争取在相关领域的学术期刊上发表;同时撰写详细的项目总结报告,全面总结项目的研究过程、经验教训和成果应用前景。

参加结题答辩:制作结题答辩PPT,准备相关材料,参加学校组织的结题答辩。

团队成员具备扎实的数学理论基础和优异的成绩,这为深入研究图像补全算法的数学本质提供了坚实的基础。团队成员熟练运用Python和Matlab等编程语言,将极大地促进项目的顺利进行。同时,团队成员具备良好的逻辑思维能力和问题解决能力,能够迅速应对研究过程中出现的各种挑战。团队成员对图像处理领域充满浓厚兴趣,这将激发我们不断探索和创新的热情,我们有信心成功完成“快速图像补全算法研究”项目。

在快速图像补全算法的研究中,我们团队已经具备了扎实的理论基础、编程能力和解决问题的能力。然而,要真正实现快速且高效的图像补全,团队仍需面对数据集多样性、计算资源限制、算法速度和鲁棒性等挑战。通过使用深度学习模型、生成对抗网络、数据增强、迁移学习等技术,可以有效应对这些挑战,推动图像补全技术向着更加高效、准和实用的方向发展。

经费预算

开支科目 预算经费(元) 主要用途 阶段下达经费计划(元)
前半阶段 后半阶段
预算经费总额 9200.00 4250.00 4950.00
1. 业务费 8000.00 3750.00 4250.00
(1)计算、分析、测试费 1500.00 模型检测调试及所开发软件的内测费用等 800.00 700.00
(2)能源动力费 0.00 0.00 0.00
(3)会议、差旅费 2500.00 往返两个校区找老师讨论以及参加学术会议所需费用 1200.00 1300.00
(4)文献检索费 500.00 用于文献检索、调研 250.00 250.00
(5)论文出版费 3500.00 论文发表所需的版面费 1500.00 2000.00
2. 仪器设备购置费 0.00 0.00 0.00
3. 实验装置试制费 0.00 0.00 0.00
4. 材料费 1200.00 购买移动硬盘及演算所需文具等 500.00 700.00

项目附件

  • 大学生创新创业训练计划项目申报书-创新训练类..doc
    下载
结束