喻园管理论坛 | 北京大学光华管理学院副教授彭一杰做学术分享
Multi-Agent Deep Reinforcement Learning for Multi-Echelon Inventory Management Problems: Enhancing Profits and Alleviating Bullwhip Effect
7月1日,喻园管理论坛2022年第28期(总第797期)在管理学院119教室成功举行。北京大学光华管理学院副教授彭一杰以“Multi-Agent Deep Reinforcement Learning for Multi-Echelon Inventory Management Problems: Enhancing Profits and Alleviating Bullwhip Effect”为主题,与参会人员进行了交流探讨。本次论坛由管理学院副院长李建斌教授主持,生产运作与物流管理系邓世名教授、李锋副教授参加本次活动。
彭一杰教授结合文献和讲座主题,带领大家了解了多智能体深度强化学习的实际应用,并且分享了他多年来在人工智能领域的一些经验。彭教授首先介绍了当前库存管理的发展情况和遇到的困难,强调了在后疫情时代背景下,库存管理变得更加复杂,例如单一参与者面临销售损失,多方参与者面临多梯度问题。彭教授分析了产生牛鞭效应的原因,并由此提出了中心化训练和分布式学习方法。随后,彭教授详细分享了串行供应链与供应链网络的模型构建、数值实验和结果,并提出关键算法HAPPO。与单智能体深度强化学习和最先进的启发式策略相比,用HAPPO构建的策略可以获得更高的总体利润,多智能体深度强化学习有助于处理多级库存管理问题、缓解牛鞭效应等。
过程中,与会师生与彭一杰教授关于顾客需求是常量还是随时间变化、智能体对上游与下游的决策和利润是否有影响等问题进行了热烈的讨论。最后,彭一杰教授针对大家关心的人工智能相关研究疑问进行一一解答,强调人工智能领域的热点会在短期发生变化,因此对一个问题的研究要及时。
//
来源:新闻宣传中心
审核:李建斌
(本文转载自华中科技大学管理学院 ,如有侵权请电话联系13810995524)
* 文章为作者独立观点,不代表MBAChina立场。采编部邮箱:news@mbachina.com,欢迎交流与合作。
备考交流
最新动态
推荐项目
活动日历
- 01月
- 02月
- 03月
- 04月
- 05月
- 06月
- 07月
- 08月
- 09月
- 10月
- 11月
- 12月
- 11/03 上海线下活动 | 港中大MBA课程2025级招生宣讲暨校友分享会
- 11/03 上海站 | 港中大MBA宣讲会暨校友分享会
- 11/03 学长学姐校区见面会 | 香港大学在职MBA(大湾区模式) 十一月线下咨询会报名
- 11/03 下週日見!2025年入學交大安泰MBA第一場港澳台申請者沙龍重磅來襲!
- 11/06 讲座报名 | 房地产市场的破局与重构
- 11/12 统考倒计时45天 | 清华科技创新MBA学姐备考分享&答疑等你来!
- 11/13 线上活动|备考经验高密度输出,招生动态前瞻解析,11月13日交大安泰MBA考情解析+笔试技巧分享会开启报名!
- 11/14 公开课抢位|人工智能、数据和人才@北京
- 11/14 申请冲刺 | 港中大(深圳)MBM2025级第四批次招生启动!
- 11/14 活动日程 | 11月14日港中大(深圳)MBM2025级招生说明会