面向收益最大化的云计算资源动态配置策略研究

申报人：平哲旭申报日期：2024-11-04

基本情况

所属批次:

2025年度大学生创新创业训练计划

项目名称:

面向收益最大化的云计算资源动态配置策略研究学生选题

项目类型:

创新训练项目

所属一级学科:

管理学

所属二级学科:

管理科学与工程类

项目来源名称:

学生自主选题

项目归属学院:

项目期限:

一年半期

项目简介:

本项目致力于提升云计算资源管理效率与收益。通过云收益分析和马尔可夫决策（MDP）模型，结合强化学习算法（如Q-learning、DQN），实现精准的资源预测与动态分配。我们设计了云模拟平台验证控制策略，并引入“超售”和“柔性调度”方法，提高资源利用率、降低违约风险，为云服务商提供高效、稳定的资源管理解决方案。

负责人曾经参与科研的情况:

负责人曾参与市级大学生创新创业训练计划项目——“基于语料库的意识流小说翻译风格研究”的研究，负责使用工具对文本进行清洁、分词和对齐的内容；此外，成员多次参加计算机+商业相关的竞赛，包括但不限于“银商·华理”第三届AIGC智慧支付挑战赛、华创杯等竞赛，并在校内ERP竞赛中取得过第二名的优异成绩；同时也利用市场调研的方法在“东岳杯”中形成了两万余字的商业分析报告，为课题的研究打下了坚实的基础。

指导教师承担科研课题情况:

国家自然科学基金面上项目：“混合收益模式下在线内容动态定价决策的仿真优化方法研究”，项目编号：71271087

指导教师对本项目的支持情况:

定期开会讨论项目进展

项目级别:

市级

项目成员

序号	学生	所属学院	专业	年级	项目中的分工	成员类型
1	平哲旭	商学院	信息管理与信息系统	2023	负责智能求解算法和平台开发	第一主持人
2	刘燊	商学院	信息管理与信息系统	2023	负责云收益分析和客户选择模型的建立	第二主持人

指导教师

序号	教师姓名	教师账号	所属学院	是否企业导师	教师类型
1	程岩	07469	商学院	否	第一指导教师

立项依据

研究目的:

本项目旨在通过创新的资源管理模型和智能算法，提升云计算服务的资源利用效率和经济效益。研究目标包括：1) 构建云收益分析模型，分析云计算环境中的运营规则，预测客户需求，并基于客户行为特征进行市场细分，从而优化资源分配；2) 设计基于动态资源管理模型，利用状态转移矩阵和奖励函数，动态调整资源分配策略，提升资源利用效率；3) 采用如Q-learning和Deep Q-Network（DQN）等强化学习算法和多智能体系统，实现MDP模型的智能求解和协同优化，提升决策准确性和实时响应能力；4) 开发云模拟平台，进行资源控制策略的验证与优化，评估资源利用率、用户满意度等多维度的效果。通过这些研究，项目旨在为云服务提供商提供高效、灵活的资源管理解决方案，以应对复杂多变的市场需求，优化成本效益并提升服务质量。

研究内容:

1.1 云收益分析

在云收益分析方面，成员将研究云计算环境下的运营规则，包括资源定价、服务级别协议（SLA）、资源分配和任务调度等。通过分析这些规则，建立一套完整的运营体系，确保云服务提供商能够高效地管理和分配资源。同时，成员将根据客户需求和行为特征，将客户分为不同的细分市场，通过客户细分，可以更好地理解不同客户群体的需求和偏好，从而制定更有针对性的资源分配策略。在此基础上，项目组成员将基于客户细分，建立客户选择模型，预测客户的资源需求和使用行为。通过客户选择模型，可以提前预测资源需求，为资源分配提供数据支持。

1.2 元计算资源动态管理模型

在元计算资源动态管理模型方面，本项目将建立基于马尔可夫决策过程的资源动态管理模型。MDP模型可以有效地处理资源需求的随机性和波动性，通过动态调整资源分配策略，实现资源的高效利用。项目将定义状态转移矩阵，描述不同资源状态之间的转换概率。通过状态转移矩阵，可以预测未来的资源需求，为资源分配提供依据。此外，该项目还将设计奖励函数，评估不同资源分配策略的效果。通过奖励函数，可以优化资源分配策略，实现收益的最大化。

1.3 MDP的智能求解算法

在MDP的智能求解算法方面，项目组成员将研究和应用强化学习算法，如Q-learning和Deep Q-Network（DQN）等，解决MDP模型的求解问题。通过强化学习算法，可以自动学习最优的资源分配策略。我们将结合多智能体系统（MAS），实现多个资源管理节点之间的协同优化。通过多智能体系统，可以提高资源分配的效率和准确性。此外，我们将研究实时优化算法，实现在动态环境中实时调整资源分配策略。通过实时优化算法，可以快速响应资源需求的变化，提高资源利用率。

1.4 云模拟平台

在MDP的智能求解算法方面，本项目将研究和应用强化学习算法，如Q-learning和Deep Q-Network（DQN）等，解决MDP模型的求解问题。通过强化学习算法，可以自动学习最优的资源分配策略。我们将结合多智能体系统（MAS），实现多个资源管理节点之间的协同优化，从而提高资源分配的效率和准确性。此外，成员将研究实时优化算法，实现在动态环境中实时调整资源分配策略，通过实时优化算法，可以快速响应资源需求的变化，提高资源利用率。

国、内外研究现状和发展动态:

国内外对云计算资源控制策略的研究已经取得了显著进展，这些研究主要集中在资源供应、任务调度和服务定价几个关键方面。在资源供应方面，研究者们探索了动态资源供应和混合资源供应的不同策略。在动态资源供应领域，针对工作流应用，Faragardi等人^[1]开发了一种基于最小完成时间的贪心资源供应算法，该算法能够在不违背资源预算的前提下有效减少工作流的完成时间。此外，Zhou等人^[2]基于概率优化的方法提出了资源优化供应算法，能够在确保资源预算的同时提高服务性能。对于混合资源供应，郑冰冰^[2]等人设计了一种混合资源供应在线社会整体收益优化算法，该算法不仅考虑了资源供应的成本，还关注用户满意率，通过多目标优化方法实现了资源的高效利用。与此同时，王念新等人^[3]则提出了一种面向按需资源的资源供应和任务调度算法，利用在线学习技术实时调整资源供应策略，进一步提高了资源利用率和用户满意度。这些研究共同推动了云计算资源管理技术的进步，为实现更高效、更具成本效益的资源分配提供了新的思路和解决方案。

在任务调度方面，许多研究者设计了在线算法以实现实时调度用户的服务请求。例如，Zhang^[4]等人从云代理的角度出发，提出了一种成本高效的在线调度算法，通过收集客户的资源请求来利用数量折扣从而降低成本。Bao等人^[5]设计了在线任务调度算法，目标是最大化完成任务的整体收益。此外，Li等人^[6]提出了一种面向多目标优化的资源供应和任务调度算法，通过加权和方法将多个目标转化为一个整体目标，实现了资源供应和任务调度的综合优化。

至于服务定价，是云计算资源控制策略中的另一个重要方面。许多研究者通过机制设计原理研究服务定价问题，以提取用户的真实估值信息并高效地提供服务。例如， Wang等人^[7]提出了一种在线拍卖机制，通过动态调整资源价格来实现资源的有效分配。Shi等人^[8]则设计了一种面向动态资源供应的在线拍卖框架，通过实时调整资源价格和供应量，提高了资源利用率和用户满意度，体现了服务定价策略在提升云计算市场灵活性和竞争力方面的关键作用。

[1] H. R. Faragardi, M. R. Saleh Sedghpour, S. Fazliahmadi, T. Fahringer and N. Rasouli, "GRP-HEFT: A Budget-Constrained Resource Provisioning Scheme for Workflow Scheduling in IaaS Clouds," in IEEE Transactions on Parallel and Distributed Systems, vol. 31, no. 6, pp. 1239-1254, 1 June 2020, doi: 10.1109/TPDS.2019.2961098.

[2] Amelie Chi Zhou, Yao Xiao, Bingsheng He, Shadi Ibrahim, and Reynold Cheng. 2019. Incorporating Probabilistic Optimizations for Resource Provisioning of Data Processing Workflows. In Proceedings of the 48th International Conference on Parallel Processing (ICPP '19).（Zhou的）

[3] 郑冰冰. 面向社会整体收益最大化的服务资源供应和任务调度算法研究[D]. 山东:山东大学,2021.

[4] 袁泽凯,葛世伦,王念新. 基于BSM模型的IaaS云计算服务定价[J]. 计算机应用研究,2014(11):3344-3348,3356. DOI:10.3969/j.issn.1001-3695.2014.11.033.

[5] Li Zhang and Danilo Ardagna. 2004. SLA based profit optimization in autonomic computing systems. In Proceedings of the 2nd international conference on Service oriented computing (ICSOC '04). Association for Computing Machinery, New York, NY, USA, 173–182.

[6] Y. Bao, Y. Peng, C. Wu and Z. Li, "Online Job Scheduling in Distributed Machine Learning Clusters," IEEE INFOCOM 2018 - IEEE Conference on Computer Communications, Honolulu, HI, USA, 2018, pp. 495-503, doi: 10.1109/INFOCOM.2018.8486422.

[7] 孙红,屠佥炜,王晓婉,等. 基于数学模型的云计算SaaS定价的研究与实现[J]. 上海理工大学学报,2014,36(2):199-204. DOI:10.13255/j.cnki.jusst.2014.02.018.

创新点与项目特色:

1. 针对新的收益模式，在混合收益模式下探究资源控制机制

在云计算环境中，混合收益模式的实施是一项复杂而精细的任务，它不仅要求对资源控制机制有深刻的理解，还需要在多个维度上进行创新研究。

首先，资源分配策略是核心，旨在根据用户需求和市场变化动态调整资源分配，以适应现货市场模式、订阅模式和按需模式的不同需求。这一过程涉及如何平衡资源供应与需求，并依据价格信号和用户行为灵活调整资源配置，确保服务质量和用户体验的同时，实现资源利用的最大化。

其次，构建收益优化模型对于提高经济效益至关重要。该模型旨在通过分析和优化在线内容的免费数量、广告强度和服务等级的组合，来达到最大收益的目标。这需要在维持高用户满意度的基础上，寻找从现货市场、订阅服务和按需服务中获取收入的最佳途径。

此外，深入的用户行为分析也是不可或缺的一环。通过对用户消费习惯的研究，特别是他们对免费内容和付费内容的选择偏好，可以为资源控制策略提供有力的数据支持。了解用户在不同收益模式下的行为特征及其对资源需求和收益的影响，有助于制定更加精准的服务策略。

最后，风险管理在混合收益模式中占据重要位置。有效的风险管理策略能够帮助云服务提供商应对现货市场价格波动、订阅模式的稳定性挑战以及按需模式带来的不确定性，从而保障企业的长期稳定发展。综合考虑以上各个方面，可以为云计算环境下的混合收益模式设计出一套既高效又稳健的资源控制机制。

2. 探索面向复杂巨空间MDP的实时求解的智能算法

面对复杂巨空间的马尔可夫决策过程（MDP）问题，实时求解算法的开发成为提高决策效率的关键。本研究将聚焦于几个创新点，包括智能求解算法的开发与优化，如值迭代、策略迭代和Q学习等，以适应复杂巨空间MDP问题，特别是在现货市场模式、订阅模式和按需模式下的快速有效资源分配决策；算法效率的提升，通过算法改进和并行计算技术，确保MDP问题的求解能实时响应环境变化，快速适应市场变动和用户需求；算法的泛化能力研究，探索算法在不同规模和类型MDP问题中的适用性，确保其在各种收益模式和市场条件下的稳定性和有效性^[3]；以及模拟和实验验证，利用云模拟平台测试和验证智能求解算法，评估其在实际应用中的性能表现，尤其是在模拟现货市场、订阅模式和按需模式环境下的效果。这些研究点均聚焦于云计算资源管理的前沿问题，旨在通过理论创新和算法开发，提升云计算服务的经济效益和决策效率，为云服务提供商提供强大的决策支持工具，从而更好地理解和优化云计算资源的动态管理。

3. 动态控制策略的创新融合

本项目提出的动态控制策略将航空领域的“超售”策略与生产计划领域的“柔性调度”策略相结合，形成了一种全新的资源管理方法。通过实时跟踪计算载荷轨迹，动态调整资源分配，该策略能够在确保服务质量的前提下，显著提高资源利用率，同时有效降低高昂的SLA违约赔付风险。这种方法创新性地解决了云服务中资源利用率低和高额违约赔付这两个长期存在的难题，实现了资源利用效率与服务质量的双重提升。

4. 多情景下的资源控制策略建议

针对云服务在不同运营情景下的需求，本项目提供了全面且有效的资源控制策略建议。这些策略不仅涵盖了日常运维的常规工作负载，还包括了高峰期、低谷期以及突发流量激增等多种特殊情况。通过细致的情景分析，项目能够为云服务提供商在不同运营情景下提供个性化的资源控制方案，确保资源的合理配置和高效利用。这种灵活性和适应性大大增强了系统的整体性能，提高了云服务的市场竞争力。

技术路线、拟解决的问题及预期成果:

1. 研究思路和方法

1.1 理论研究

在理论研究方面，我们将系统地阅读和分析国内外相关文献，总结现有研究的主要成果和不足之处。基于这些理论研究，我们将建立云收益分析模型、MDP模型和客户选择模型，为后续研究提供坚实的理论基础。

1.2实验研究

在理论研究方面，我们将系统地阅读和分析国内外相关文献，总结现有研究的主要成果和不足之处。基于这些理论研究，我们将建立云收益分析模型、MDP模型和客户选择模型，为后续研究提供坚实的理论基础。。

1.3算法研究

在MDP的智能求解算法方面，我们将研究和应用Q-learning、DQN等强化学习算法，解决MDP模型的求解问题。我们将结合多智能体系统，实现多个资源管理节点之间的协同优化。此外，我们将研究实时优化算法，实现在动态环境中实时调整资源分配策略。通过这些方法，可以提高资源分配的高效性和准确性。

1.4平台开发

在云模拟平台方面，我们将设计和开发一个高可扩展性和灵活性的云模拟平台，用于验证和测试资源控制策略。通过仿真测试，评估不同资源控制策略的效果，发现和解决实际应用中的问题。我们将建立性能评估指标体系，评估资源控制策略的性能，包括资源利用率、用户满意度、成本效益等多方面内容。通过这些措施，确保平台的实用性和可靠性。

项目研究进度安排:

一、项目初期（2024年11月2025年1月）

1 文献梳理：查阅与云服务收益最大化以及动态资源控制策略计算相关的文献与资料；

2 确定项目研究方案；

3 学习并掌握动态收益控制相关知识技能。

二、项目中期（2025年1月-2025年10月）

1 开发出云计算仿真平台

2 构建出问题模型

3 设计出模型求解算法

三、项目后期（2025年10月-2026年5月）

1 完成论文写作并发表；

2 参加“互联网+”大学生创新创业大赛；

3 准备结题答辩材料。

已有基础:

与本项目有关的研究积累和已取得的成绩:

本项目依托于已有的云计算资源管理、MDP建模和强化学习算法的研究成果，积累了大量的理论基础。相关领域的文献研究为云收益分析、客户需求预测、资源动态管理等提供了坚实的支持。同时，强化学习算法（如Q-learning、DQN）在动态资源分配中的应用已有一定实践，云模拟平台（如CloudSim）为本项目的仿真测试提供了技术参考。此外，混合收益模式的研究也为优化资源分配策略和最大化收益提供了理论指导。

已具备的条件，尚缺少的条件及解决方法:

已具备的条件：

1 已有云计算资源管理、强化学习算法和MDP模型的研究基础。

2 项目组具备使用开源框架（如TensorFlow）和仿真工具（如CloudSim）的能力。

3 分工明确，成员在理论研究、算法实现和平台开发上具备相应经验。

尚缺少的条件及解决方法：

1 数据支持：需要获取真实云计算环境中的客户行为数据，计划通过合作或仿真生成数据。

2 算法实时性和稳定性：强化学习算法可能面临效率问题，将采用并行计算技术和优化算法加速求解过程。

3 平台扩展性：现有平台需要定制开发，以支持更高并发和灵活调度，计划进行二次开发。

4 优化算法：针对混合收益模式下的资源波动，需设计新的优化算法，结合强化学习和数据分析方法加以解决。

经费预算

开支科目	预算经费（元）	主要用途	阶段下达经费计划（元）
开支科目	预算经费（元）	主要用途	前半阶段	后半阶段
预算经费总额	8800.00	云平台使用费、调研费用、收集文献及数据资料、论文发表费用；收集文献资料以及复印、打印相关资料	1400.00	7400.00
1. 业务费	8300.00	云平台使用费、调研费用、收集文献及数据资料、论文发表费用	1200.00	7100.00
（1）计算、分析、测试费	1100.00	云平台使用费	600.00	500.00
（2）能源动力费	0.00	无	0.00	0.00
（3）会议、差旅费	400.00	调研费用	200.00	200.00
（4）文献检索费	800.00	收集文献及数据资料	400.00	400.00
（5）论文出版费	6000.00	论文发表费用	0.00	6000.00
2. 仪器设备购置费	0.00	无	0.00	0.00
3. 实验装置试制费	0.00	无	0.00	0.00
4. 材料费	500.00	收集文献资料以及复印、打印相关资料	200.00	300.00

项目附件

2025年大创申报书.docx

下载

结束

大学生创新创业训练计划管理系统

创新创业管理系统

详情