微软 AI 强化学习算法拿下吃豆人游戏最高分

微软收购的 Maluuba 深度学习公司近期尝试了一套人工智能系统,利用强化学习算法拿下了吃豆人(Ms. Pac-Man)游戏最高分,这款游戏看起来很简单,但复杂性足够来测试 AI 系统。

微软研究员称,他们将这套系统拆分为 150 多个 Agents,这些 Agents 并行处理不同的任务,每个 Agent 只做自己擅长的任务,并在成功吃豆、躲避幽灵等任务获得奖励,总 Agent 将汇总所有的信息来最终决定走位。

微软研究团队近期在 Minecraft 发起了 Malmo 协作 AI 挑战,主要是研究 AI Agents 之间如何协作,包括理解其他 AI 意图、理解如何协作完成统一目标、如何分配任务和共享信息。(via Microsoft

赞赏
发表评论