谷歌AI最新博文:视频模型中的模拟策略学习【马哥教育新闻快报387期】
各位小伙伴下午好,今天是2019年3月27日,这里是马哥教育新闻快报387期。
本期重点关注: 谷歌AI最新博文:视频模型中的模拟策略学习
1、谷歌AI最新博文:视频模型中的模拟策略学习
深度强化学习(RL)技术可用于从视觉输入中学习复杂任务的策略,并已成功应用于经典的 Atari2600 游戏中。最近在这一领域的研究表明,即使在像 Montezuma's Revenge 这样的游戏所展示的具有挑战性的探索机制中,它也可能获得超人的表现。然而,目前许多最先进方法的局限之一是,它们需要与游戏环境进行大量的交互,且这些交互通常比人类去学习如何玩得好要多得多。
近日,谷歌 AI 发布了一篇博文,讨论了他们的视频模型中的模拟策略学习模型,雷锋网(公众号:雷锋网) AI 科技评论编译整理如下。
解释为什么人们能更有效地学习这些任务的一个假设是,他们能够预测自己行动的效果,从而含蓄地学习一个模型,其行动顺序将导致理想的结果。其一般思想是,建立所谓的博弈模型并用它学习一个选择行为的良好策略,这是基于模型的强化学习(MBRL)的主要前提。
在「基于模型的 Atari 强化学习」中,我们引入了模拟策略学习(SimPLe)算法,这是一个 MBRL 框架,用于训练 Atari 游戏机的代理,其效率显著高于当前最先进的技术,只需要使用与游戏环境的约 100K 交互(相当于真人 2 小时的游戏时间)就能显示出有竞争力的结果。此外,我们已经将相关代码作为 Tensor2Tensor 开源代码库的一部分进行了开源。这个版本包含了一个预训练的 world 模型,可以用一个简单的命令行运行,也可以使用类似于 Atari 的界面来播放。
2、 百度大脑,“上新了”!
前不久,百度大脑推出了包括语音技术、视觉技术、自然语言处理、知识图谱等在内的通用 AI 能力,以及开源深度学习框架方面的优化升级。与此同时,人工智能已经连续三年进入政府报告、“智能+”成为 2019 年行业的新命题。
雷锋网了解到,百度大脑自 2016 年启动开放以来,目前已经是服务规模最大的 AI 开放平台。共计开放了 158 项 AI 能力,24 小时快速集成,开发者数量超过 100 万。面向广泛的企业和开发者提供最先进、最全面的 AI 能力,不断降低 AI 应用落地的门槛。
语音方面
在今年 1 月的百度输入法探索版发布会上,首次发布了领先国际的语音技术:在线语音领域全球首创的流式多级截断注意力模型 SMLT「Streaming trancated multi-layer attention」。值得注意的是,这是首次在大规模语音识别工业界采用注意力(attention)模型。
提升识别率的同时大幅优化了解码速度。“语音识别极速版”,拥有更快的响应速度,相对识别准确度提升 15%。此项语音能力在 API 调用方式下,实时率小于 0.1,意味着 5s 的音频不到 500ms 即可完成识别过程,减少了识别音频所需的耗时,提升语音交互的响应体验。
3、 欧盟版权改革 版权方与谷歌等巨头有喜有忧
欧洲立法者批准了一项有争议的版权立法的初步协议,该协议可能对谷歌和 Facebook 等科技巨头的商业模式产生深远影响。
该法案旨在将欧盟的版权规则带入 21 世纪,以帮助那些作品在互联网上广泛传播的艺术家和出版商。
欧洲议会于周二在法国斯特拉斯堡通过了新版权指令的初步文本。但这仍然需要得到欧洲委员会部长们的批准。该委员会机构根据职责和角色将欧盟中的不同部长聚集在一起。
这项改革计划,自 2016 年以来就一直在酝酿。该计划使得包括 Facebook、Twitter 和谷歌在内的大型科技公司与艺术家和媒体公司展开了激烈的竞争。
谷歌的回应
据外媒报道,欧洲议会投票后,谷歌表示,周二通过的版本是对原有法律的改进。但谷歌还补充说,这仍将导致法律不确定性,并损害创意产业。
该法案中的一项条款可能导致(监管方)实施预过滤系统,阻止互联网用户分享包含受版权保护材料的潮流语、表情包和其他内容。
版权改革的另一部分将要求像谷歌这样的新闻聚合服务平台与出版商协商商业许可,以便发布文章的片段或链接。
在技术公司一方,谷歌和多位知名人士,如互联网先驱蒂姆·伯纳斯·李、维基百科创始人吉米·威尔士,都对新的欧盟版权指令表示不满。在媒体一方,像前披头士乐队成员保罗·麦卡特尼和歌手黛比·哈里等知名艺术家都表示支持。
4、 Spotify今日宣布将收购洛杉矶播客工作室Parcast
Spotify 今天表示,将收购 Parcast,这是该公司在两个月内收购的第三家播客公司,该公司正在努力转型为音频领域的奈飞。
Spotify 没有透露交易条款,但早些时候表示,公司已在 2019 年拨出高达 5 亿美元用于收购。
Parcast 成立于 2016 年,专注于“犯罪”和“神秘”主题的音频内容。该公司推出了 18 个高级播客系列,包括“连环杀手”(Serial Killers)、“悬案谋杀”(Unsolved Murders)等主题内容。
今年 2 月,全球最受欢迎的音乐流媒体服务平台 Spotify 同意收购播客生产商 Gimlet Media 和播客服务公司 Anchor。
【快报内容】
【今日学习必备】
【Linux面试真题】- 当用户在浏览器当中输入一个网站,说说计算机对dns解释经过那些流程?注:本机跟本地dns还没有缓存。
答:
a.用户输入网址到浏览器;
b.浏览器发出DNS请求信息;
c.计算机首先查询本机HOST文件,看是否存在,存在直接返回结果,不存在,继续下一步;
d.计算机按照本地DNS的顺序,向合法dns服务器查询IP结果;
e.合法dns返回dns结果给本地dns,本地dns并缓存本结果,直到TTL过期,才再次查询此结果;
f.返回IP结果给浏览器;
【Python面试真题】- 简单谈下GIL -Global Interpreter Lock(全局解释器锁)
Python代码的执行由Python 虚拟机(也叫解释器主循环,CPython版本)来控制,Python 在设计之初就考虑到要在解释器的主循环中,同时只有一个线程在执行,即在任意时刻,只有一个线程在解释器中运行。对Python 虚拟机的访问由全局解释器锁(GIL)来控制,正是这个锁能保证同一时刻只有一个线程在运行。
>【就业喜讯】
【学员喜讯-798期】- 从建筑工程到Linux运维工程师,马哥教育助力学员成功转行 !
【近期开班】
Linux面授班:2019年4月29日(北京)
Linux网络班:2019年5月4日(网络)
Python面授班:2019年6月24日(北京)
Python网络班:2019年3月30日(网络)