太阳城娱乐工程师创造更智能的人工智能,重新定义复杂系统中的控制
by Gisele Galoustian | 星期五,2025年9月26日
A new artificial intelligence breakthrough developed by researchers in the 工程与计算机科学学院 at 太阳城娱乐 offers a smarter, more efficient way to manage complex systems that rely on multiple decision-makers operating at different levels of authority.
This novel framework, recently published in IEEE系统、人与控制论汇刊:系统, could significantly impact the future of smart energy grids, traffic networks and autonomous vehicle systems – technologies that are becoming increasingly central to daily life.
在许多现实世界的系统中,决策不会同时或平等地发生。 公用事业公司可以决定何时在高峰时段切断电力,而家庭必须相应地调整他们的能源使用。 在交通系统中,中央控制器指示信号,车辆相应地调整。
“These types of systems operate under a power hierarchy, where one player makes the first move and others must follow, and they’re more complicated than typical AI models assume,” said 甄倪, Ph.D., senior author, IEEE senior member and an associate professor in the 电气工程与计算机科学系. “传统的人工智能方法通常平等对待每个决策者,在同一时间以相同的影响力进行操作。 虽然这有助于清晰的模拟,但它并不能反映现实世界中决策的实际情况,尤其是在充满不确定性、带宽有限和信息获取不均匀的环境中。”
To address this, Ni and Xiangnan钟, Ph.D., first author, IEEE member and an associate professor in the 电气工程与计算机科学系, designed a new AI framework based on reinforcement learning, a technique that allows intelligent agents to learn from interacting with their environment over time.
他们的方法增加了两个关键创新。 首先,它使用一种称为Stackelberg-Nash博弈的博弈论模型来构建决策过程,其中“领导者”代理首先采取行动,“追随者”代理以最优方式做出反应。 这种等级制度更好地反映了能源管理、互联交通和自动驾驶等系统。 其次,研究人员引入了一种事件触发机制,以减少计算负担。
他说:“我们的方法不像许多人工智能系统那样在每个时间步都不断更新决策,而是只在必要时更新决策,在保持性能和稳定性的同时节省能源和处理能力。”
其结果是,一个系统不仅可以处理决策者之间的权力不对称,还可以处理不匹配的不确定性——不同的参与者在不同程度的信息和可预测性下运作。 这在智能电网或交通控制系统等环境中尤其重要,因为这些环境条件变化迅速,资源往往有限。 该框架允许更强大、自适应和可扩展的人工智能控制形式,可以更好地利用有限的带宽和计算资源。
“这项工作填补了当前人工智能领域的一个关键空白。 By developing a method that reflects real-world decision hierarchies and adapts to imperfect information, Professors Zhong and Ni are helping us move closer to practical, intelligent systems that can handle the complexity of our modern infrastructure,” said Stella Batalama, Ph.D., dean of the 工程与计算机科学学院. “这项研究的意义深远。 无论是优化城市间的电力消耗,还是使自动系统更可靠,这种创新都是智能技术太阳城娱乐的基础。 它不仅代表了人工智能研究的进步,也代表了我们所依赖的日常系统的进步。”
经过严格的理论分析和仿真研究的验证,Zhong和Ni证明了他们的事件触发强化学习方法保持了系统的稳定性,确保了最优的策略结果,并有效地减少了不必要的计算。 该方法将深度控制理论与实际机器学习相结合,为不对称、不确定环境中的智能控制提供了一条引人注目的道路。 两篇相关的期刊文章最近也发表在IEEE人工智能学报上。 研究工作主要得到了美国国家科学基金会和美国交通部的支持。
研究小组目前正致力于扩展他们的模型,以便在现实世界中进行更大规模的测试。 他们的长期愿景是将这种人工智能框架整合到为城市供电、管理交通和协调自动机器车队的运营系统中,从而使更智能的基础设施的承诺更接近现实。