start_time: 2024-04-25 17:25:24 +0800

OpenAI Gym学习（三）：OpenAI Gym评估平台

huyuanda

IP属地: 加州

0.1 2017.08.27 16:59 字数 517

上一篇博客中写到OpenAI Gym的安装与基本使用，接下来介绍OpenAI Gym评估平台。

记录结果

OpenAI Gym平台可以很方便的测试自己的强化学习的模型，记录自己算法在环境中的表现，以及拍摄自己算法学习的视频，如下所示：

import gym
from gym import wrappers
env = gym.make('CartPole-v0')
env = wrappers.Monitor(env, '/tmp/cartpole-experiment-1')
for i_episode in range(20):
    observation = env.reset()
    for t in range(100):
        env.render()
        print(observation)
        action = env.action_space.sample()
        observation, reward, done, info = env.step(action)
        if done:
            print("Episode finished after {} timesteps".format(t+1))
            break

使用Monitor Wrapper包装自己的环境，在自己定义的路径下将记录自己模型的性能。支持将一个环境下的不同模型性能写在同一个路径下。

在官网注册账号后，可以在个人页面上看到自己的API_Key，接下来可以将结果上传至OpenAI Gym：

import gym
gym.upload('/tmp/cartpole-experiment-1', api_key='YOUR_API_KEY')

然后得到如下结果：

打开链接会有当前模型在环境下的评估报告，并且还录制了小视频：

评估

每次上传结果，OpenAI Gym都会对其进行评估。

创建一个Github Gist将结果上传，或者直接在upload时传入参数：

import gym
gym.upload('/tmp/cartpole-experiment-1', writeup='https://gist.github.com/gdb/b6365e79be6052e7531e7ba6ea8caf23', api_key='YOUR_API_KEY')

评估将自动计算得分，并生成一个漂亮的页面。

在大多数环境中，我们的目标是尽量减少达到阈值级别的性能所需的步骤数。不同的环境都有不同的阈值，在某些环境下，尚不清楚该阈值是什么，此时目标是使最终的表现最大化。在cartpole这个环境中，阈值就是立杆能够直立的帧数。

Review

OpenAI Gym打算在每个环境下提供一个reviewed evaluations.，类似其他比赛的评审机制，不过OpenAI的态度并不是为了将每个环境变成比赛，而是方便大家更好的进行协作研究。不过目前只有OpenAI的工作人员才能提交list，完善之后大家可以作为contributor提交自己的模型为社区做贡献。由于还未完善，这里就不过多介绍。

最后编辑于：2017-12-10 04:23:39

©著作权归作者所有,转载或内容合作请联系作者

© 著作权归作者所有

E06d4ad9 5911 48ef 88cd 76d5c467455f

huyuanda

总资产3 共写了9927字获得19个赞共19个粉丝

人面猴

序言：七十年代末，一起剥皮案震惊了整个滨河市，随后出现的几起案子，更是在滨河造成了极大的恐慌，老刑警刘岩，带你破解...

783c64db 45e5 48d7 82e4 95736f50533e

沈念sama 阅读 158736 评论 4 赞 362

死咒

序言：滨河连续发生了三起死亡事件，死亡现场离奇诡异，居然都是意外死亡，警方通过查阅死者的电脑和手机，发现死者居然都...

783c64db 45e5 48d7 82e4 95736f50533e

沈念sama 阅读 67167 评论 1 赞 291

救了他两次的神仙让他今天三更去死

文/潘晓璐我一进店门，熙熙楼的掌柜王于贵愁眉苦脸地迎上来，“玉大人，你说我怎么就摊上这事。” “怎么了？”我有些...

开封第一讲书人阅读 108442 评论 0 赞 243

道士缉凶录：失踪的卖姜人

文/不坏的土叔我叫张陵，是天一观的道长。经常有香客问我，道长，这世上最难降的妖魔是什么？我笑而不...

开封第一讲书人阅读 43902 评论 0 赞 204

港岛之恋（遗憾婚礼）

正文为了忘掉前任，我火速办了婚礼，结果婚礼上，老公的妹妹穿的比我还像新娘。我一直安慰自己，他们只是感情好，可当我...

388e473c fe2f 40e0 9301 e357ae8f1b41

茶点故事阅读 52302 评论 3 赞 287

恶毒庶女顶嫁案：这布局不是一般人想出来的

文/花漫我一把揭开白布。她就那样静静地躺着，像睡着了一般。火红的嫁衣衬着肌肤如雪。梳的纹丝不乱的头发上，一...

开封第一讲书人阅读 40573 评论 1 赞 216

城市分裂传说

那天，我揣着相机与录音，去河边找鬼。笑死，一个胖子当着我的面吹牛，可吹牛的内容都是我干的。我是一名探鬼主播，决...

783c64db 45e5 48d7 82e4 95736f50533e

沈念sama 阅读 31847 评论 2 赞 312

双鸳鸯连环套：你想象不到人心有多黑

文/苍兰香墨我猛地睁开眼，长吁一口气：“原来是场噩梦啊……” “哼！你这毒妇竟也来了？” 一声冷哼从身侧响起，我...

开封第一讲书人阅读 30562 评论 0 赞 197

万荣杀人案实录

序言：老挝万荣一对情侣失踪，失踪者是张志新（化名）和其女友刘颖，没想到半个月后，有当地人在树林里发现了一具尸体，经...

783c64db 45e5 48d7 82e4 95736f50533e

沈念sama 阅读 34260 评论 1 赞 241

护林员之死

正文独居荒郊野岭守林人离奇死亡，尸身上长有42处带血的脓包…… 初始之章·张勋以下内容为张勋视角年9月15日...

388e473c fe2f 40e0 9301 e357ae8f1b41

茶点故事阅读 30531 评论 2 赞 245

白月光启示录

正文我和宋清朗相恋三年，在试婚纱的时候发现自己被绿了。大学时的朋友给我发了我未婚夫和他白月光在一起吃饭的照片。...

388e473c fe2f 40e0 9301 e357ae8f1b41

茶点故事阅读 32021 评论 1 赞 258

活死人

序言：一个原本活蹦乱跳的男人离奇死亡，死状恐怖，灵堂内的尸体忽然破棺而出，到底是诈尸还是另有隐情，我是刑警宁泽，带...

783c64db 45e5 48d7 82e4 95736f50533e

沈念sama 阅读 28367 评论 2 赞 253

日本核电站爆炸内幕

正文年R本政府宣布，位于F岛的核电站，受9级特大地震影响，放射性物质发生泄漏。R本人自食恶果不足惜，却给世界环境...

388e473c fe2f 40e0 9301 e357ae8f1b41

茶点故事阅读 33016 评论 3 赞 235

男人毒药：我在死后第九天来索命

文/蒙蒙一、第九天我趴在偏房一处隐蔽的房顶上张望。院中可真热闹，春花似锦、人声如沸。这庄子的主人今日做“春日...

开封第一讲书人阅读 26068 评论 0 赞 8

一桩弑父案，背后竟有这般阴谋

文/苍兰香墨我抬头看了看天上的太阳。三九已至，却和暖如春，着一层夹袄步出监牢的瞬间，已是汗流浃背。一阵脚步声响...

开封第一讲书人阅读 26827 评论 0 赞 194

情欲美人皮

我被黑心中介骗来泰国打工，没想到刚下飞机就差点儿被人妖公主榨干…… 1. 我叫王不留，地道东北人。一个月前我还...

783c64db 45e5 48d7 82e4 95736f50533e

沈念sama 阅读 35610 评论 2 赞 274

代替公主和亲

正文我出身青楼，却偏偏与公主长得像，于是被迫代替她去往敌国和亲。传闻我的和亲对象是个残疾皇子，可洞房花烛夜当晚...

388e473c fe2f 40e0 9301 e357ae8f1b41

茶点故事阅读 35514 评论 2 赞 269

[3/4]我所经历的大数据平台发展史（三）：互联网时代 • 上篇

//我所经历的大数据平台发展史（三）：互联网时代 • 上篇http://www.infoq.com/cn/articles/the-development-history-of-big-data-platform-paet02 编者按：本文是松子（李博源）的大数据平台发展史...

03522728 8c05 49cf bace 7494e75ccd38

葡萄喃喃呓语阅读 51031 评论 10 赞 200

【转】机器学习模型评价1(Evaluating Machine Learning Models)

博客上看到一篇优秀的翻译文章。文章地址：http://blog.csdn.net/heyongluoyao8/article/details/49408319#机器学习模型评价(Evaluating Machine Learning Models)-主要概念与陷阱前言本...

_CelesteHuang_ 阅读 5255 评论 0 赞 24

OpenAI Gym学习（一）：OpenAI Gym 初探

1. OpenAI Gym 介绍 OpenAI Gym 是一个用于开发和比较RL 算法的工具包，它包括一系列不断增长、完善的环境（如 simulated robots及Atari），还提供了可以用于比较和评估算法的平台。与其他的数值计算库兼容，如tensorflow 或者...

E06d4ad9 5911 48ef 88cd 76d5c467455f

huyuanda 阅读 8211 评论 0 赞 4

深度强化学习导引

Neil Zhu，简书ID Not_GOD，University AI 创始人 & Chief Scientist，致力于推进世界人工智能化进程。制定并实施 UAI 中长期增长战略和目标，带领团队快速成长为人工智能领域最专业的力量。作为行业领导者，他和UAI一起在2014年...

0e4e103b9892

朱小虎XiaohuZhu 阅读 12859 评论 7 赞 66

Spring Cloud

Spring Cloud为开发人员提供了快速构建分布式系统中一些常见模式的工具（例如配置管理，服务发现，断路器，智能路由，微代理，控制总线）。分布式系统的协调导致了样板模式, 使用Spring Cloud开发人员可以快速地支持实现这些模式的服务和应用程序。他们将在任何分布式...

卡卡罗2017 阅读 134099 评论 18 赞 139

前端面试准备之——CSS篇

1、元素定位有哪些？ absolute 以第一个不是以static定位的父元素进行定位 fixed 以浏览器窗口进行定位 relative 相对于其正常定位进行定位 static 默认定位，元素出现在正常的文档流中 2、CSS的选择符有哪些？优先级算法怎么定义？ id选择器...

Amor_Hy 阅读 252 评论 0 赞 1

明天相见不要见怪

平时皮肤都不错只是要见喜欢的人之前偶尔会有问题忽然嘴唇起水泡脸上起痘你看见你的心情都快要跟见恋人差不多了涂了很多药膏还没好明天相见不要见怪

不正常生物研究中心阅读 204 评论 0 赞 14

海贼王830话分析

本周的漫画如期更新了，汉化组也是很辛苦的。言归正传，本周漫画的爆点很多，可以分析的地方也很多，下面小李一一道来。一、扉页故事还是《五亿的男人篇》，这次到了香波地群岛，人物是雷利和一些赌徒。有人说左下角的人物是藤虎，虽然有点像，但小李觉得不是。尾田对人物的刻画还是很细腻的...

小李talk 阅读 646 评论 2 赞 1

UFO画成语: 兔死狗烹

41a48c5a a147 4441 850b 040cc6845931

乐小鱼UFO 阅读 711 评论 6 赞 3

我的大学 | 刘志太：锐意进取，不悔青春

在我校2015年度“十佳学生”评选中，来自自动化与电气工程学院2013级自动化创新班的刘志太光荣入选，在表彰大会上，接过红彤彤证书的那一刻，他笑得自信而灿烂。“大学生活中，我可以骄傲得说，我从未偷懒过一天”，刘志太告诉记者，时间意识和严格的自律让他的学习生活始终高效而充实...

弥天欲雪阅读 680 评论 1 赞 4

huyuanda

总资产 3

OpenAI Gym学习（三）：OpenAI Gym评估平台

阅读：1708

OpenAI Gym学习（三）：OpenAI Gym评估平台

阅读：1501

热门故事

桂林志异：龙王起水

离婚后，妈宝男前夫后悔了

救了他两次的神仙让他今天三更去死

我把眼角膜捐给丈夫的白月光后，他疯了

为了活命，我对病娇反派弟弟表白，他竟当真要做我夫君

“有个坐过牢的富豪老公是种什么体验？”“要不然你来试试？”

前世渣男把我迷晕还叫我别怕，重生后我杀疯了

妹妹过失杀人，警察来时，我捡起了那把滴血的刀

我被校霸堵在巷口，却发现他是我谈了三个月的网恋对象

我首富之女的身份居然被人偷了

end_time: 2024-04-25 17:25:24 +0800 Completed in 163.219549ms