详情

基于YoloWorld的区域卫星地图分析系统

申报人:杨赫 申报日期:2024-11-05

基本情况

2025年度大学生创新创业训练计划
基于YoloWorld的区域卫星地图分析系统 学生选题
创新训练项目
工学
自动化类
学生自主选题
一年半期
在当今地理信息科学和空间分析领域,对于卫星地图的高效、精准分析有着迫切需求。本项目旨在开发一个创新的区域卫星地图分析系统,利用先进的 YoloWorld 技术,实现对区域内各类设施的准确搜索和分析,为城市规划、资源管理、应急响应等众多领域提供有力支持。

在高中时期参与第37届上海市青少年科技创新大赛,参与课题为“物联网水质检测无人艇”,并取得一等奖。在研究过程中,先后学习过模电、数电等控制技术和C、Python等编程语言,能够熟练运用python编写程序;同时,熟悉开题报告、研究日志、结题报告等文书编写;并且具有一定的课题答辩能力和较强的团队交流能力。在大一曾参加大创团队接触目标检测的Yolo技术。

博士,副教授,香港理工大学、加拿大卡尔加里大学访问学者。近年来,主要从事机器视觉、多模态图像分析、遥感影像分析和自动检测等方面的研究工作。授权国家发明专利 6项、发表期刊论文三十余篇;先后主持国家自然科学基金面上项目二项、国家自然科学基金青年项目一项,省部级项目二项。主持企业项目6项,其中包含中国民航科学技术研究院委托开发项目“机场道面可视化管理系统”、中国石化安全工程研究院委托开发项目“炼化装置表面温度成像预警系统优化”,积累了良好的理论基础和现场经验。作为负责人,目前正在主持国家自然科学基金面上项目可以为本次双创项目提供良好的研究基础和实验平台。
指导教师可以在开放词汇目标检测等所涉及的算法,及深度学习、机器学习等方面提供理论指导及实验讲解。课题组可以提供实验环境、计算资源及前期研究经验及数据。
校级

项目成员

序号 学生 所属学院 专业 年级 项目中的分工 成员类型
杨赫 信息科学与工程学院 人工智能 2023 项目分工;与指导老师联系;项目的算法研究与训练
丁奕轩 资源与环境工程学院 储能科学与工程 2023 原始数据的获取与处理;硬件设备调试
张治贤 信息科学与工程学院 人工智能 2023 用户交互页面的构建;分析算法研究
程郁博 信息科学与工程学院 机器人工程 2023 原始数据的获取与处理;特征识别算法研究

指导教师

序号 教师姓名 教师账号 所属学院 是否企业导师 教师类型
谷小婧 08241 信息科学与工程学院

立项依据

      如今,随着卫星遥感技术的普及与发展,诸如工程建造、智能城市管理、区域规划、地缘战略分析等各大重要领域,都已离不开对于卫星地图的高效和精准的分析。由于卫星遥感地图的易获取性,且信息含量巨大,对卫星遥感地图的分析工作也广受重视。然而,由于地面各类物体的复杂性和目标物体的微小性,人为对卫星遥感地图的直接分析难以实现。而且,在某些情况下,地面遥感数据也有人为、环境变化等等干涉因素,长期的数据获取与分析工作量大。而使用机器视觉和人工智能的技术,可以很大程度提高识别能力和准确性。因此,在机器视觉技术飞速发展的今天,将其引入卫星地图分析领域有很高价值。

      YoloWorld 是一种极具优势的开放词汇目标检测方法。它具备独特的特征处理能力,通过对多个特征的叠加,可以实现精准的目标识别。这种能力为卫星地图中复杂多样的设施检测提供了坚实的技术基础,能够有效应对不同类型、不同形态设施的识别挑战。

      本项目旨在开发一个创新的区域卫星地图分析系统,利用先进的 YoloWorld 技术,实现根据语言描述,对区域内各类设施的准确搜索和分析,为城市规划、资源管理、应急响应等众多领域提供有力支持。

我们的项目,以区域的卫星遥感地图为研究对象,通过重新训练的YoloWorld算法和其他自研配套的数据分析处理算法,识别地图上的设施信息,提取相关数据并分析、记录。同时,用户可以要求系统查找特定特征的设施,并加以分析。

具体思路如下:

第一,收集卫星遥感地图数据并进行标注。标注过程主要使用数据库技术对相关数据进行保存。鉴于YoloWorld技术基于开放词汇目标检测模型(简称OVD),重点在于利用图像文本数据扩展训练词汇量,因此其对原始数据集的规模需求较小。标注数据的主要作用就是向提示模型所需要学习的对象。

第二,用这些数据对 YoloWorld 模型进行重新训练。用创建的数据库数据,训练YoloWorld算法,使其能够学习到不同设施在卫星图像中的特征表现并能够准确识别全新的同类物体。包括基本的交通设施、住宅设施、商业设施、农田和各类其他基础设施等以及多特征组合的设施,以实现根据语言描述搜索分析的功能。

第三,编写数据分析算法和构建输入输出界面和端口。数据分析算法和人性化界面的构建都使用Python语言编写。这一步主要实现当系统接收到待分析的卫星图和特定设施描述后能够对设施进行识别和归纳,并能够导出相关数据。


为确保实时性能,优化算法和模型,可能考虑部分任务加载到云端,实现商用。

基于机器视觉的卫星遥感地图分析是当前的研究热点之一。目前,国内外学者针对地图上的设施识别的识别提出了许多方法,但由于传统机器视觉识别算法无法对多特征目标、新目标进行识别,所以仍存在诸多不足。而使用YoloWorld算法是一种较为有效的方法该方法通过对多个特征的叠加,可以实现精准的目标识别。这种能力为卫星地图中复杂多样的设施检测提供了坚实的技术基础,能够有效应对不同类型、不同形态设施的识别挑战。

第一个创新点:使用全新的YoloWorld技术,其对多特征叠加的分析能力有助于进一步提升对卫星地图的识别能力和对特定需要目标的定位能力,解决传统方法无法识别新类型设施和含有多特征的设施的问题。

第二个创新点:建立配套数据库,并给出模型微调方案,使得该系统可以根据特定领域需要而改良。

第三个创新点:通过引入全新的设施特征数据,增加原始数据的类别,由此编写对应的数据分析算法,实现对数据分析的细化和深化,并且做到清晰地展示,解决以往系统分析能力不能满足需求的问题。

我们的项目,以区域的卫星遥感地图为研究对象,通过重新训练的YoloWorld算法和其他自研配套的数据分析处理算法,识别地图上的设施信息,提取相关数据并分析、记录。项目主要解决传统方法无法识别新类型设施和含有多特征的设施的问题、泛用性不强的问题以及系统分析能力不能满足需求的问题。

具体思路如下:

第一,收集卫星遥感地图数据并进行标注。标注过程主要使用数据库技术对相关数据进行保存。鉴于YoloWorld技术基于开放词汇目标检测模型(简称OVD),重点在于利用图像文本数据扩展训练词汇量,因此其对原始数据集的规模需求较小。标注数据的主要作用就是向提示模型所需要学习的对象。

第二,用这些数据对 YoloWorld 模型进行重新训练。用创建的数据库数据,训练YoloWorld算法,使其能够学习到不同设施在卫星图像中的特征表现并能够准确识别全新的同类物体。包括基本的交通设施、住宅设施、商业设施、农田和各类其他基础设施等以及多特征组合的设施,以实现根据语言描述搜索分析的功能。

第三,编写数据分析算法和构建输入输出界面和端口。数据分析算法和人性化界面的构建都使用Python语言编写。这一步主要实现当系统接收到待分析的卫星图和特定设施描述后能够对设施进行识别和归纳,并能够导出相关数据。


为确保实时性能,优化算法和模型,可能考虑部分任务加载到云端,实现商用。

阶段进度  时间安排     工作安排

阶段一 2025年1月-2025年3月 根据分工,对python编程、YoloWorld算法进行初步的学习和实践应用,组装PC

阶段二 2025年4月-2025年6月 搜集卫星遥感地图数据,完成分割和标注工作并建立数据库

阶段三 2025年7月-2025年8月 设计并初步编写交互界面、训练YoloWorld算法

阶段四 2025年9月-2026年3月 编写数据处理算法,拓展交互界面实现人性化输入输出功能,对算法进行测试和调整

阶段五 2026年4月-2026年6月 测试系统、撰写论文,完成结题。项目产出数据库、模型和论文

研究积累:项目成员均熟练掌握C、Python等编程语言,能够独立完成相关的算法编程任务。同时,大部分项目成员对算法有系统性学习,同时拥有相关项目的开发经验。

已有:

Yoloworld目标检测算法的使用

缺少:

相关的硬件设备,以及测试数据;进一步开展研究的资金。

解决方法:

申请相关的经费,在互联网以及在导师的帮助下获取相关的测试集,对系统进行测试。


希望能在本次大创项目中得到学校的支持。

经费预算

开支科目 预算经费(元) 主要用途 阶段下达经费计划(元)
前半阶段 后半阶段
预算经费总额 10000.00 9600.00 400.00
1. 业务费 2800.00 2500.00 300.00
(1)计算、分析、测试费 800.00 项目需要 800.00 0.00
(2)能源动力费 300.00 项目需要 300.00 0.00
(3)会议、差旅费 900.00 项目需要 900.00 0.00
(4)文献检索费 500.00 项目需要 500.00 0.00
(5)论文出版费 300.00 项目需要 0.00 300.00
2. 仪器设备购置费 7000.00 项目需要 7000.00 0.00
3. 实验装置试制费 0.00 0.00 0.00
4. 材料费 200.00 项目需要 100.00 100.00

项目附件

  • 基于YoloWorld的区域卫星地图分析系统申报书.docx
    下载
结束