您现在的位置是:首页 > 正文

ucl计算机教授汪军,UCL汪军教授开课:带你入坑多智能体机器学习(免费)!

2024-04-01 07:16:47阅读 2

人工智能已经在围棋、图像识别和语音识别等领域达到甚至超越了人类专家水平,但智能化的机器离我们仍然很远。要想实现通用智能,AI智能体必须学习如何在共享环境中与「他人」进行互动,由此产生了人工智能的一个前沿研究领域:多智能体学习。

很多领域中都存在多智能体学习的问题,在这些问题中,多个智能体不仅能与环境相互作用,而且彼此相互作用,由此造成的复杂和多变也为研究带来了诸多挑战。多智能体学习在现实生活中有着广泛的应用,比如无人机群的控制、仓库机器人的合作、分布式传感器网络/交通的优化、机器竞标,等等。

课程介绍

本课程基于伦敦大学学院(UCL)计算机系2020-2021学年度课程Multi-agent Artificial Intelligence (20/21),主要介绍多智能体机器学习。课程将机器学习的研究与博弈论和经济学的研究相结合,包括博弈论、拍卖理论、算法机制设计、多智能体(深度)强化学习等主题,同时还将讨论相关的实际应用,包括在线广告、在线拍卖、生成模型的对抗训练、机器人规划,以及玩在线游戏的智能体。

本课程适合计算机科学以及机械和航空工程等专业的本科生、研究生,从事机器学习、多智能体协同控制等领域的工程技术人员。

本课程完全免费,为英文授课,与UCL授课进度同步,每周五更新。

讲师简介

caa6bc7a1f74dd2265089f3ccd98aa82.png

汪军,伦敦大学学院(UCL)计算机系教授,阿兰·图灵研究所 Turing Fellow,华为诺亚方舟实验室决策推理首席顾问。主要研究智能信息系统,包括机器学习、强化学习、多智能体,数据挖掘、计算广告学、推荐系统等。已发表了 120 多篇学术论文,出版两本学术专著,多次获得最佳论文奖。

课程目录

一、博弈论基础介绍

1.1 博弈论的基本概念

1.2 纯策略纳什均衡

1.3 混合策略纳什均衡

1.4 纳什均衡的存在性证明

1.5 古诺双寡头模型

二、更多博弈形式

2.1 重复博弈(Repeated Games)

2.2 拓展形式的博弈(Extensive-form game)

2.3 位势博弈(Potential Game)

三、纳什均衡

3.1 零和博弈及纳什均衡计算

3.2 极大极小博弈(Minmax Game)介绍

3.3 纳什均衡的线性规划解法

3.4 线性互补问题

3.5 Lemke–Howson 算法求解线性互补问题

四、贝叶斯博弈与拍卖理论

4.1 贝叶斯博弈(Bayesian Game)

4.2 在线拍卖的设置与步骤

4.3 拍卖模式:一口价拍卖与密封式拍卖

4.4 竞价策略与纳什均衡

五、神经网络与深度学习

5.1 深度学习基础

5.2 词嵌入

5.3 深度神经网络层

5.4 卷积神经网络

5.5 循环神经网络

5.6 网络信息检索

5.7 表征学习

5.8 深度强化学习

六、基于值函数的单智能体强化学习

6.1 强化学习基础

6.2 Model-based 方法:马尔科夫决策过程,动态规划求解

6.3 Model-free方法:蒙特卡洛,时序差分,Q-learning

6.4 深度强化学习实例:Atari,Alpha Go

七、多智能体强化学习(一)

7.1 多智能体强化学习介绍及基本概念

7.2 值迭代与策略迭代

7.3 均衡学习:纳什-Q,Minmax-Q,Friend-Foe-Q

7.4 最佳对策:JAL与对手建模,梯度提升,Wolf-IGA

八、基于策略的单智能体强化学习

8.1 策略梯度

8.2 策略梯度理论证明

8.3 函数近似

九、多智能体强化学习(二)

9.1 策略预测的IGA

9.2 动态系统的梯度提升优化

9.3 虚拟博弈

9.4 理性学习

9.5 演化博弈论

9.6 复制动态方程

十、多智能体强化学习(三)

10.1 Emergent behaviours

10.2 智能体建模

10.3 多智能体通信

10.4 多智能体合作

10.5 Many-agent 学习

举报/反馈

网站文章

  • Win10电脑重装系统更新关闭了还自动打开怎么解决?

    Win10电脑重装系统更新关闭了还自动打开怎么解决?

    由于电脑系统更新有时候会遇到一些问题,例如会带来一些新的BUG,这使得有用户就会关闭系统更新,但是近期有用户反映更新服务禁止了还更新的情况,那么Win10电脑重装系统更新关闭了还自动打开怎么解决?3、...

    2024-04-01 07:16:06
  • 【gdb&core】Linux中gdb 查看core堆栈信息1

    【gdb&core】Linux中gdb 查看core堆栈信息1

    【GDB】GDB调试总目录_bandaoyu的笔记-CSDN博客【GDB】GDB 调试多线程和多进程总结报错记录(gdb) b mps_guide_db.c:1699No source file named mps_guide_db.c.可能是因为调用了动态库,要打断点的文件是动态库的可以通过 以下方式得到解决:(gdb) set breakpoi...

    2024-04-01 07:15:59
  • 架构思维——代码功能聚散之道

    架构思维——代码功能聚散之道

    2024-04-01 07:15:52
  • secureCRT没法输入(按回车键没反应)

    secureCRT没法输入(按回车键没反应)

    1.右击选择会话选项: 2.去掉RTS/CTS.然后重启软件。

    2024-04-01 07:15:43
  • nginx php mysql 编译安装

    linux 安装nginx+php+mysqlnginx安装本文是介绍使用源码编译安装,包括具体的编译参数信息。正式开始前,编译环境gcc g++ 开发库之类的需要提前装好。安装make:yum -y install gcc automake autoconf libtool make安装g++:yum install gcc gcc-c++一般我们都需要先装pcre, zlib,前者...

    2024-04-01 07:15:03
  • 学会这5招优化技巧,让你的 iPhone 变得更好

    学会这5招优化技巧,让你的 iPhone 变得更好

    你会使用 iPhone吗?掌握这10个技巧可以让你的 iPhone 变得更好。相信很多人喜欢iOS流畅的设计,但是它也有很多让人烦恼的小问题。现要只要你稍加用户得看完这篇文章,你可以很轻松地解决这些小...

    2024-04-01 07:14:56
  • kindle中html笔记,Kindle教程:如何导出笔记

    导语:一、什么是“我的剪贴”?(即 My Clippings.txt)凡是使用 Kindle 的小伙伴对“我的剪贴”,也就是那个沉默在 documents 文件夹中的文本文件“My Clippings...

    2024-04-01 07:14:48
  • I/O模型之一:Unix的五种I/O模型

    I/O模型之一:Unix的五种I/O模型

    Unix的五种I/O模型:阻塞I/O:应用程序调用一个IO函数,导致应用程序阻塞,如果数据已经准备好,从内核拷贝到用户空间,否则一直等待下去非阻塞I/O:I/O复用(select和poll)信号驱动I/O(SIGIO)异步I/O(Posix.1的aio_系列函数)Unix的一个输入操作一般有两个不同的阶段:1、等待数据准备好。2、从内核到进程拷贝数据。对于一个套接口上的输入操...

    2024-04-01 07:14:02
  • arthas 启动原理分析

    arthas 启动原理分析

    前言 经常在应用的启动或者运行过程中需要动态的查看数据,或者实时的验证我们写的代码的结构与执行过程,此时需要一种工具能够动态的检测程序运行的状态,内存数据,线程情况,最好能够动态的替换代码实时生效,方...

    2024-04-01 07:13:51
  • 【经验】超全面:这份设计师晋升答辩指南 值得收藏!

    【经验】超全面:这份设计师晋升答辩指南 值得收藏!

    最近收到好几位同学的问题:晋升述职ppt好难做、答辩要怎么说才能提高通过率、好几次晋升都失败了是什么原因……..有道是一文钱难倒英雄汉,几个字几句话难倒了大片设计师。设计师总是沉浸在设计技能的精通和创...

    2024-04-01 07:13:11