1、主持科研项目“产品生产管理系统设计与维护”,上海涵迪电子科技有限公司,2023.4.1-2024.12.31。(12万元)
2、作为主要参与人完成项目“心理健康检测数据平台(一期)”,华体健康管理(上海)有限公司,2023.6.6~2024.1.31。(150万元)
1、主持科研项目“产品生产管理系统设计与维护”,上海涵迪电子科技有限公司,2023.4.1-2024.12.31。(12万元)
2、作为主要参与人完成项目“心理健康检测数据平台(一期)”,华体健康管理(上海)有限公司,2023.6.6~2024.1.31。(150万元)
| 序号 | 学生 | 所属学院 | 专业 | 年级 | 项目中的分工 | 成员类型 |
|---|---|---|---|---|---|---|
|
|
侯恩赐 | 信息科学与工程学院 | 自动化 | 2023 | 负责整体项目的规划与管理,协调团队成员之间沟通与协作。 |
|
|
|
李钦丞 | 信息科学与工程学院 | 自动化 | 2023 | 负责手语识别算法的研究与开发,攻克技术难题。 |
|
|
|
张锐 | 信息科学与工程学院 | 信息工程 | 2023 | 负责小程序的产品设计,包括界面布局、用户体验等。 |
|
|
|
张鑫超 | 信息科学与工程学院 | 自动化 | 2023 | 参与算法研究,负责用户反馈收集与分析,为产品优化提供依据。 |
|
| 序号 | 教师姓名 | 教师账号 | 所属学院 | 是否企业导师 | 教师类型 |
|---|---|---|---|---|---|
|
|
叶西宁 | 06910 | 信息科学与工程学院 | 否 |
|
我国是全球听障人士最多的国家,约有2780万人。然而,由于经济条件和当地卫生系统服务能力的差异,大多数听力受损者无法得到及时有效的干预治疗。专业手语翻译人员数量有限,且多数集中在大城市,导致许多听障人士在日常生活中面临沟通障碍,其中包括听力障碍的学生。为此,我们拟利用AI技术对听障学生无障碍交流系统进行研究,旨在让听障者与健康人之间的沟通交流更加便捷无障碍。
此前,我们了解到市面上虽然已有一些翻译工具,但仍存在APP操作不便、不支持手语翻译、程序内含有与主题无关的收费项目等缺陷。因此,我们团队致力于开发一个面向学生群体、操作简单、支持手语翻译的微信小程序,以求解决相关问题。
然而,该项目面临数据获取与处理复杂、实时手语识别困难、模型设计与训练难度高、用户个人隐私保护等挑战, 因此需要团队之间的共同努力来完成。
1.主要研究内容
(1)语音到文字的转换技术:开发高效准确的语音识别模块,能够将识别到的语音输入实时转换为文字,便于听障人士与健康人群的文字交流。
(2)语音到手语的转换技术:基于自建的手语数据库,利用深度学习算法,实现语音信号到手语动作的精确映射,生成流畅且符合自然手语习惯的手语视频或动画。
(3)多模态融合与理解;提升系统对复杂交流情境的理解能力,确保转换内容的准确性和情境适应性。
(4)自然手语特性融入:深入研究自然手语的语序、表情、非言语信号等特点,并将其融入转换模型中,以增强手语表达的生动性和自然度。
(5)用户界面与交互设计:设计直观易用的用户界面,支持听障学生便捷地选择交流模式(文字、手语或混合),并提供即时反馈机制,优化用户体验。
2.重点和难点
(1)难点
手语数据库构建:构建一个全面、准确的手语数据库是一大挑战。
自然手语表达的自然度:确保生成的手语不仅准确,还要符合听障人士的自然交流习惯,增加表达的丰富性和情感传递。
(2)重点
提高转换精度与速度:确保语音识别、手语生成的准确性和实时性,是提升系统实用性的关键。
用户体验优化:设计符合听障学生使用习惯的用户界面,简化操作流程,提高系统的易用性和可接受度。
3.研究思路和方法
(1)文献调研与技术分析:通过查阅相关文献,了解国内外在语音识别、手语识别、多模态融合等领域的研究进展和技术现状,确定研究方向和技术路线。
(2)数据采集与预处理:收集并整理大量语音数据、手语视频、面部表情和身体姿态数据,进行清洗、标注和归一化处理,为模型训练奠定基础。
(3)模型构建与训练:利用深度学习框架,构建语音识别、手语生成及多模态融合的算法模型,并进行优化。
(4)实验验证与评估:设计一系列实验,包括准确性测试、实时性测试、用户体验测试等,通过对比实验数据,评估系统的性能,并根据反馈进行调整改进。
(5)用户反馈与迭代优化:邀请听障学生参与测试,收集用户反馈,针对发现的问题进行针对性优化,不断提升系统的实用性和用户体验。
(6)技术应用与推广:在验证系统有效性和可靠性后,探索将其应用于教育、社交、公共服务等多个场景,推动听障人士无障碍交流技术的发展与普及。
《中国听障用户数字产品体验调研报告》指出,听障用户在沟通方面面临诸多挑战,尤其是在接打电话、紧急求助、社交聊天、工作和就医等场景下。报告还强调了听障用户对智能终端设备和听觉辅助设备的使用情况,以及这些设备在满足听障用户需求方面存在的不足。
在技术发展方面,中国已经出现了一些创新性的应用。例如,AI手语主播在北京冬奥会期间的使用,展示了如何将科研成果应用于大型国际活动,以服务于听障观众。这背后是一个包含30余万条视频语料库的复杂场景下中国手语实时翻译系统。
多维度融合的自然手语生成技术:
本项目旨在实现语音到手语的转换,同时研究自然手语的特性,通过多模态深度学习技术将这些元素有机融合,使生成的手语更加自然、生动且富有情感,超越传统单一模态转换的局限。
自建高精度手语数据库:
本项目将自建一个覆盖广泛、标注精确的手语数据库,为模型的训练提供丰富多样的数据支持,提升手语生成的准确性和适用性。
融合教育与社交的创新应用:
除了基本的交流功能外,本项目还将探索将无障碍交流技术应用于教育和社交领域的可能性。
强化隐私保护与数据安全:
在设计和实现过程中,本项目会高度重视用户隐私和数据安全,确保用户数据在传输和存储过程中的安全性,同时会提供透明的隐私政策,让用户能够充分了解自己的数据如何被使用和保护。
项目预期效果及成果形式:
学术论文:项目完成后,我们将撰写一篇关于"AI辅助听障学生无障碍交流系统:手语与普通话转换技术的实现与评估"的学术论文,详细阐述研究方法、技术创新和实际效果。这将发表在相关领域的顶级会议或期刊上,分享给学术界和同行。
专利申请:对于我们开发的核心技术,如手语识别算法和翻译模型,我们将进行专利申请。这将保护我们的技术创新,同时也是项目经济价值的重要体现。
开发软件或产品:开发一款用户友好的无障碍交流App,提供手语识别转文字、语音合成读出等功能,以实践我们的技术。这款App可以直接在市场上发布,供听障学生和相关人群使用。
项目鉴定:项目结束后,我们将邀请专业的评估机构或相关领域的专家进行项目鉴定,确认项目的创新性和实用性。
推广应用:通过与教育机构、特殊学校合作,以及在线平台推广,使产品和服务广泛惠及听障学生,提高他们的生活质量。
案例和用户反馈:收集用户的使用体验和统计数据,形成案例报告,作为改进产品和后续研究的重要依据。
以上成果形式将共同确保项目的实施质量和影响力。
第一阶段 准备阶段:2024年11月——2025年3月
1. 查阅相关文献,掌握一定基础知识;
2. 撰写申报书,制作PPT,准备并完成立项答辩
第二阶段 实施阶段:2025年4月——2025年12月
1. 选择适合开发的前端框架和工具;
2. 根据需求选择合适的后端服务、数据库和服务器;
3. 了解并选择合适的平台;
4. 进行性能测试和功能测试,确保程序运行流畅,邀请用户测试,收集反馈,优化产品;
5. 中期评估、竞赛及交流研讨等活动
第三阶段 结题阶段:2026年1月——2026年6月
1. 总结分析,修改不足之处,对程序的漏洞进行修正;
2. 完成总结报告,填写结题表,完成结题答辩;
3. 推广成果,撰写学术论文并投稿。
(1)文献查询:查找了关于残障人士教育方面的相关文献,了解了听力障碍人士在学习生活方面的应用程序的缺陷。
(2)用户调研:通过问卷、访谈等方式收集听力障碍学生在学习方面的具体需求和痛点。
(3)团队合作:根据团队成员的优势和兴趣进行分工,确保每个人在各自的工作中能够发挥出最大效能。
1. 华东理工大学图书馆及线上图书馆馆藏丰富;
2. 依托现有手语数据库建立算法;
3. 配备高性能CPU(Intel Core i7或更高)、大容量内存(16GB及以上)及高性能显卡(NVIDIA GIX 1650或更高)用于算法训练和实时处理,必要时租用网络上的计算资源;
4.大学生创新创业训练计划项目提供足够的经费,给予本项目经济上的支持。
| 开支科目 | 预算经费(元) | 主要用途 | 阶段下达经费计划(元) | |
|---|---|---|---|---|
| 前半阶段 | 后半阶段 | |||
| 预算经费总额 | 20000.00 | 无 | 11000.00 | 9000.00 |
| 1. 业务费 | 15400.00 | 无 | 8200.00 | 7200.00 |
| (1)计算、分析、测试费 | 2000.00 | 算法研究个人电脑资源不够需要租赁 | 1000.00 | 1000.00 |
| (2)能源动力费 | 5000.00 | 聘请专业的手语表演者,在不同场景进行录制一次100,共50次 | 3000.00 | 2000.00 |
| (3)会议、差旅费 | 8000.00 | 参加会议、市场调研、参加竞赛等, | 4000.00 | 4000.00 |
| (4)文献检索费 | 400.00 | 查阅文献 | 200.00 | 200.00 |
| (5)论文出版费 | 0.00 | 无 | 0.00 | 0.00 |
| 2. 仪器设备购置费 | 3000.00 | 租用GPU服务器三个月每个月1000 | 2000.00 | 1000.00 |
| 3. 实验装置试制费 | 0.00 | 无 | 0.00 | 0.00 |
| 4. 材料费 | 1600.00 | 辅助器材(存储卡、三脚架等),文件资料复印 | 800.00 | 800.00 |