详情

AI赋能听障学生无障碍交流系统研发

申报人:侯恩赐 申报日期:2024-11-11

基本情况

2025年度大学生创新创业训练计划
AI赋能听障学生无障碍交流系统研发 学生选题
创新训练项目
工学
自动化类
学生自主选题
一年半期
基于AI技术研究听障学生无障碍交流系统,让听障者与健康人沟通交流更加便捷无障碍。该系统不仅能将语音转换成文字用于交流,而且能将语音转换成手语,从而更加方便直观地交流,基于现有手语数据库和多模态深度学习技术,实现语音与手语的快速转换。融入自然手语语序、表情、唇语、身体姿态等特性,提高翻译精准度。

1、主持科研项目产品生产管理系统设计与维护,上海涵迪电子科技有限公司,2023.4.1-2024.12.31。(12万元)

2作为主要参与人完成项目心理健康检测数据平台(一期),华体健康管理(上海)有限公司,2023.6.6~2024.1.31。(150万元)

给与必要的技术及经费支持。
校级

项目成员

序号 学生 所属学院 专业 年级 项目中的分工 成员类型
侯恩赐 信息科学与工程学院 自动化 2023 负责整体项目的规划与管理,协调团队成员之间沟通与协作。
李钦丞 信息科学与工程学院 自动化 2023 负责手语识别算法的研究与开发,攻克技术难题。
张锐 信息科学与工程学院 信息工程 2023 负责小程序的产品设计,包括界面布局、用户体验等。
张鑫超 信息科学与工程学院 自动化 2023 参与算法研究,负责用户反馈收集与分析,为产品优化提供依据。

指导教师

序号 教师姓名 教师账号 所属学院 是否企业导师 教师类型
叶西宁 06910 信息科学与工程学院

立项依据

我国是全球听障人士最多的国家,约有2780万人。然而,由于经济条件和当地卫生系统服务能力的差异,大多数听力受损者无法得到及时有效的干预治疗。专业手语翻译人员数量有限,且多数集中在大城市,导致许多听障人士在日常生活中面临沟通障碍,其中包括听力障碍的学生。为此,我们拟利用AI技术对听障学生无障碍交流系统进行研究,旨在让听障者与健康人之间的沟通交流更加便捷无障碍。

此前,我们了解到市面上虽然已有一些翻译工具,但仍存在APP操作不便、不支持手语翻译、程序内含有与主题无关的收费项目等缺陷。因此,我们团队致力于开发一个面向学生群体、操作简单、支持手语翻译的微信小程序,以求解决相关问题。

然而,该项目面临数据获取与处理复杂、实时手语识别困难、模型设计与训练难度高、用户个人隐私保护等挑战, 因此需要团队之间的共同努力来完成。

1.主要研究内容

(1)语音到文字的转换技术:开发高效准确的语音识别模块,能够将识别到的语音输入实时转换为文字,便于听障人士与健康人群的文字交流。

(2)语音到手语的转换技术:基于自建的手语数据库,利用深度学习算法,实现语音信号到手语动作的精确映射,生成流畅且符合自然手语习惯的手语视频或动画。

(3)多模态融合与理解提升系统对复杂交流情境的理解能力,确保转换内容的准确性和情境适应性。

(4)自然手语特性融入:深入研究自然手语的语序、表情、非言语信号等特点,并将其融入转换模型中,以增强手语表达的生动性和自然度。

(5)用户界面与交互设计:设计直观易用的用户界面,支持听障学生便捷地选择交流模式(文字、手语或混合),并提供即时反馈机制,优化用户体验。

2.重点和难点

(1)难点

手语数据库构建:构建一个全面、准确的手语数据库是一大挑战。

自然手语表达的自然度:确保生成的手语不仅准确,还要符合听障人士的自然交流习惯,增加表达的丰富性和情感传递。

(2)重点

提高转换精度与速度:确保语音识别、手语生成的准确性和实时性,是提升系统实用性的关键。

用户体验优化:设计符合听障学生使用习惯的用户界面,简化操作流程,提高系统的易用性和可接受度。

3.研究思路和方法

(1)文献调研与技术分析:通过查阅相关文献,了解国内外在语音识别、手语识别、多模态融合等领域的研究进展和技术现状,确定研究方向和技术路线。

(2)数据采集与预处理:收集并整理大量语音数据、手语视频、面部表情和身体姿态数据,进行清洗、标注和归一化处理,为模型训练奠定基础。

(3)模型构建与训练:利用深度学习框架,构建语音识别、手语生成及多模态融合的算法模型,并进行优化。

(4)实验验证与评估:设计一系列实验,包括准确性测试、实时性测试、用户体验测试等,通过对比实验数据,评估系统的性能,并根据反馈进行调整改进。

(5)用户反馈与迭代优化:邀请听障学生参与测试,收集用户反馈,针对发现的问题进行针对性优化,不断提升系统的实用性和用户体验。

(6)技术应用与推广:在验证系统有效性和可靠性后,探索将其应用于教育、社交、公共服务等多个场景,推动听障人士无障碍交流技术的发展与普及。

  《中国听障用户数字产品体验调研报告》指出,听障用户在沟通方面面临诸多挑战,尤其是在接打电话、紧急求助、社交聊天、工作和就医等场景下。报告还强调了听障用户对智能终端设备和听觉辅助设备的使用情况,以及这些设备在满足听障用户需求方面存在的不足。

   在技术发展方面,中国已经出现了一些创新性的应用。例如,AI手语主播在北京冬奥会期间的使用,展示了如何将科研成果应用于大型国际活动,以服务于听障观众。这背后是一个包含30余万条视频语料库的复杂场景下中国手语实时翻译系统。

多维度融合的自然手语生成技术:

本项目旨在实现语音到手语的转换,同时研究自然手语的特性,通过多模态深度学习技术将这些元素有机融合,使生成的手语更加自然、生动且富有情感,超越传统单一模态转换的局限。

自建高精度手语数据库:

本项目将自建一个覆盖广泛、标注精确的手语数据库,为模型的训练提供丰富多样的数据支持,提升手语生成的准确性和适用性。

融合教育与社交的创新应用:

除了基本的交流功能外,本项目还探索将无障碍交流技术应用于教育和社交领域的可能性。

强化隐私保护与数据安全:

在设计和实现过程中,本项目高度重视用户隐私和数据安全,确保用户数据在传输和存储过程中的安全性,同时提供透明的隐私政策,让用户能够充分了解自己的数据如何被使用和保护。

项目预期效果及成果形式:

学术论文:项目完成后,我们将撰写一篇关于"AI辅助听障学生无障碍交流系统:手语与普通话转换技术的实现与评估"的学术论文,详细阐述研究方法、技术创新和实际效果。这将发表在相关领域的顶级会议或期刊上,分享给学术界和同行。

专利申请:对于我们开发的核心技术,如手语识别算法和翻译模型,我们将进行专利申请。这将保护我们的技术创新,同时也是项目经济价值的重要体现。

开发软件或产品:开发一款用户友好的无障碍交流App,提供手语识别转文字、语音合成读出等功能,以实践我们的技术。这款App可以直接在市场上发布,供听障学生和相关人群使用。

项目鉴定:项目结束后,我们将邀请专业的评估机构或相关领域的专家进行项目鉴定,确认项目的创新性和实用性。

推广应用:通过与教育机构、特殊学校合作,以及在线平台推广,使产品和服务广泛惠及听障学生,提高他们的生活质量。

案例和用户反馈:收集用户的使用体验和统计数据,形成案例报告,作为改进产品和后续研究的重要依据。

以上成果形式将共同确保项目的实施质量和影响力。

第一阶段 准备阶段:2024年11月——2025年3月

1. 查阅相关文献,掌握一定基础知识;

2. 撰写申报书,制作PPT,准备并完成立项答辩

第二阶段 实施阶段:2025年4月——2025年12月

1. 选择适合开发的前端框架和工具;

2. 根据需求选择合适的后端服务、数据库和服务器;

3. 了解并选择合适的平台;

4. 进行性能测试和功能测试,确保程序运行流畅,邀请用户测试,收集反馈,优化产品;

5. 中期评估、竞赛及交流研讨等活动

第三阶段 结题阶段:2026年1月——2026年6月

1. 总结分析,修改不足之处,对程序的漏洞进行修正;

2. 完成总结报告,填写结题表,完成结题答辩;

3. 推广成果,撰写学术论文并投稿。

 

1)文献查询:查找了关于残障人士教育方面的相关文献,了解了听力障碍人士在学习生活方面的应用程序的缺陷。

2)用户调研:通过问卷、访谈等方式收集听力障碍学生在学习方面的具体需求和痛点。

3)团队合作:根据团队成员的优势和兴趣进行分工,确保每个人在各自的工作中能够发挥出最大效能。

1. 华东理工大学图书馆及线上图书馆馆藏丰富;

2. 依托现有手语数据库建立算法;

3. 配备高性能CPU(Intel Core i7或更高)、大容量内存(16GB及以上)及高性能显卡(NVIDIA GIX 1650或更高)用于算法训练和实时处理,必要时租用网络上的计算资源;

4.大学生创新创业训练计划项目提供足够的经费,给予本项目经济上的支持。


经费预算

开支科目 预算经费(元) 主要用途 阶段下达经费计划(元)
前半阶段 后半阶段
预算经费总额 20000.00 11000.00 9000.00
1. 业务费 15400.00 8200.00 7200.00
(1)计算、分析、测试费 2000.00 算法研究个人电脑资源不够需要租赁 1000.00 1000.00
(2)能源动力费 5000.00 聘请专业的手语表演者,在不同场景进行录制一次100,共50次 3000.00 2000.00
(3)会议、差旅费 8000.00 参加会议、市场调研、参加竞赛等, 4000.00 4000.00
(4)文献检索费 400.00 查阅文献 200.00 200.00
(5)论文出版费 0.00 0.00 0.00
2. 仪器设备购置费 3000.00 租用GPU服务器三个月每个月1000 2000.00 1000.00
3. 实验装置试制费 0.00 0.00 0.00
4. 材料费 1600.00 辅助器材(存储卡、三脚架等),文件资料复印 800.00 800.00

项目附件

  • 2025大学生创新创业训练计划项目申报书-创新训练类.doc
    下载
结束