失眠网 > 论坛报名 | 从捉迷藏星际争霸到新一代人工智能：多智能体深度强化学习的理论与实践...

论坛报名 | 从捉迷藏星际争霸到新一代人工智能：多智能体深度强化学习的理论与实践...

时间：2019-01-10 16:44:27

与6位图灵奖得主和100多位专家

共同探讨人工智能的下一个十年

长按图片或点击阅读原文，内行盛会，首次免费注册

6月21-24日，第二届北京智源大会（官网：https://.）将邀请包括6位图灵奖获得者在内的上百位人工智能领袖，一起回顾过去，展望未来，深入系统探讨“人工智能的下一个十年”。本次大会将开设19个专题论坛，主题涵盖人工智能数理基础、自然语言处理、智能体系架构与芯片、人工智能伦理治理与可持续发展、机器学习、智能信息检索与挖掘、认知神经基础、机器感知、决策智能、AI医疗、AI创业、AI交通、AI+大数据+防疫、AI框架、图神经网络、知识智能、强化学习、青年科学家机器学习前沿，以及AI科技女性，遍历人工智能基础研究及创新应用，结合时局解析人工智能最新动态，探索未来发展方向。

我们将带你走进各个分论坛，领略嘉宾风采、洞悉前沿趋势。今天介绍的是将于6月23日上午举行的决策智能论坛。

论坛主题：决策智能

感知与决策一直是人工智能领域的两个关键问题，尤其是近五年来深度强化学习在视频游戏和棋类问题上展现出超越人类的最高水平，表明了人工智能在复杂问题上的强大决策能力。与此同时，近几年在诸如德州扑克、多人在线战术竞技游戏、星际争霸等多智能体问题上人工智能也表现出了相当高的决策性能。现实世界广泛存在多智能体系统，与单智能体相比，智能体数量的增长带来的群体效应要远超倍数增长关系。但与此同时带来的状态空间和动作空间的组合爆炸，限制了多智能体的决策智能。因此从理论、方法、架构、硬件、运算等角度推动多智能体强化学习的发展，提高大规模多智能体系统和群体系统的智能决策能力，是人工智能下一个十年的集中发展方向。

本论坛我们将会对当前人工智能领域决策智能的进展进行深入交流，探讨未来发展趋势。我们有幸邀请了中科院自动化所的徐波所长作为分论坛主席，基于其从事人工智能研究二十多年的经验，点评各位专家学者的报告内容。

清华大学张崇洁将会分享多智能体系统协同问题的挑战和最新研究成果；

OpenAI吴翼将会展示在捉迷藏问题上人工智能涌现出的各种复杂策略；

北京大学卢宗青将会展现交流和通信在多智能体合作上的作用；

启元世界袁泉将会带来他们“星际指挥官”在达到人类宗师水平背后的训练云平台和关键技术；

中科院自动化所赵冬斌将会分享深度强化学习从仿真到实体应用的初步探索，包括机器人、智能驾驶、博弈对抗等方面的研究成果。

决策智能论坛议程

论坛主席

徐波

中科院自动化所所长、中国科学院大学人工智能学院院长。兼任国家新一代人工智能战略咨询委员会委员，中国人工智能产业发展联盟副理事长，中国人工智能技术标准总体组副组长等。北京智源人工智能研究院理事。长期从事智能语音处理和人工智能技术的研究和应用。近年围绕听觉模型和类脑认知计算等进行前瞻性探索。

演讲主题及嘉宾介绍

1.Efficient Collaborative Multi-Agent Reinforcement Learning

议题简介：Due to the complex and combinatorial nature of real-world applications, deep reinforcement learning is shifting from single-agent to multi-agent settings. This talk will discuss challenges in cooperative multi-agent reinforcement learning and present approaches that exploit common interaction structures and enable efficient learning for multi-agent collaboration.

演讲嘉宾：张崇洁

Assistant Professor in the Institute for Interdisciplinary Information Sciences at Tsinghua University. Before joining the faculty, he was a postdoctoral associate in the Computer Science and Artificial Intelligence Lab (CSAIL) at MIT. He received his Ph.D. in Computer Science from the University of Massachusetts at Amherst. His research interests span deep reinforcement learning, multi-agent systems, robotics, and their interps.

2.Emergent Tool Use From Multi-Agent Autocurricula

议题简介：We show that through deep reinforcement learning and simple hide-and-seek objectives, simulated agents co-evolve jointly in an open-ended physical environment and create an autocurriculum inducing multiple distinct rounds of emergent strategies, many of which require sophisticated tool use and coordination resembling human beings. We believe such an automatic evolution procedure provides evidence towards Artificial General Intelligence (AGI). OpenAI blog about this work: /blog/emergent-tool-use

演讲嘉宾：吴翼

Researcher in the multi-agent team at OpenAI Inc.and will join the institute of interdisciplinary information sciences (IIIS), Tsinghua University, as an assistant professor in fall. He earned his PhD degree from UC Berkeley under the supervision of Prof. Stuart Russell. His research focuses on improving the generalization ability of artificial agents. He is broadly interested in a variety of topics in AI, including deep reinforcement learning, multi-agent systems, natural language understanding and probabilistic programming. His work, Value Iteration Network, won the only best paper award at NeurIPS .

3.通信驱动的合作学习

议题简介：在自然界中，交流与合作密切相关，且可能源于合作。例如，黑长尾猴可以发出不同的声音来提醒族群中其他成员附近的不同掠食者。同样的，交流/通信对于多智能体合作也至关重要。如何才能通过智能体通信实现高效的合作？本报告介绍对这个问题的一些探索和相关研究成果。

演讲嘉宾：卢宗青

北京大学计算机系研究员、博士生导师。担任Workshop on Network Intelligence 会议主席，NeurIPS、IJCAI、INFOCOM等国际会议的程序委员会委员，Nature Machine Intelligence等期刊审稿人。目前主要研究领域为（多智能体）深度强化学习、边缘智能系统。

4.StarCraft Commander:GrandmasterlevelReinforcement Learning Agent Trained fromHyperEfficientAIPlatform

议题简介：《星际争霸》是有史以来最成功的即时策略游戏，也是人工智能研究领域的重大挑战之一。它蕴含了长期策略规划、非完全信息博弈、超大规模动作空间等复杂决策问题，是研究深度学习、强化学习、分布式训练云平台等智能体关键技术的绝佳试炼场。DeepMind训练出了能够击败99.8%人类选手的人工智能体AlphaStar，但所用算力巨大。启元世界经过近3年的努力，在AlphaStar近1%的算力上成功训练了”星际指挥官”智能体，并达到了人类宗师选手水平，使其商业应用成为可能。本次报告将分享“星际指挥官“背后的工业级大规模智能体训练云平台以及智能体演化计算等关键技术。

演讲嘉宾：袁泉

启元世界（inspir.ai）创始人兼CEO，前阿里认知计算实验室资深总监，淘宝推荐算法创始人，曾获双11 CEO特别贡献奖。加入阿里之前，袁泉是IBM中国研究院的研究员，从事个性化推荐等智能算法的研究，在ACM RecSys、SIGKDD等顶级会议发表文章和专利数十篇。目前主要研究方向包括深度强化学习、通用决策智能及智能体人机交互技术。

5.深度强化学习-从仿真到实体

议题简介：深度强化学习方法在棋牌类、视频游戏等领域取得了人工智能里程碑式的成果，在实际系统的应用还刚刚起步。本报告给出深度强化学习方法从仿真到实体应用的初步探索，包括机器人、智能驾驶、博弈对抗等方面的研究成果。

演讲嘉宾：赵冬斌

中国科学院自动化研究所研究员、中国科学院大学岗位教授、博士生导师、IEEE Fellow。任计算智能领域权威期刊IEEE TNNLS (Trans. Neural Networks and Learning Systems), IEEE TCyb (Trans. Cybernetics), IEEE TAI (Trans. Artificial Intelligence), IEEE CIM (Computational Intelligence Magazine)编委等，任IEEE TNNLS、IEEE CIM等国际期刊特邀编辑10余次。任权威国际会议的程序委员会主席（IJCNN ）等多次。任IEEE计算智能学会杰出讲座计划主席，曾任技术发展战略规划委员会主席，北京分会主席、自适应动态规划和强化学习技术委员会主席等。出版学术著作5本、译著1本。在国内外重要期刊会议上发表论文300余篇（SCI收录90余篇）。获北京市科学技术奖等省部级奖励6项等，获中国智能车未来挑战赛2项第一名等10余项竞赛奖励，获IEEE Trans. Cognitive Development Systems优秀论文奖等10项论文奖励。目前主要研究方向为计算智能、深度强化学习、自适应动态规划理论和方法，及其在智能车辆、机器人、自动机器学习、智能交通、能源系统等方面的应用。

- 点击阅读原文，内行盛会，首次免费注册-

如果觉得《论坛报名 | 从捉迷藏星际争霸到新一代人工智能：多智能体深度强化学习的理论与实践...》对你有帮助，请点赞、收藏，并留下你的观点哦！

本内容不代表本网观点和政治立场，如有侵犯你的权益请联系我们处理。

网友评论

网友评论仅供其表达个人看法，并不表明网站立场。