人工智能深度學習OpenAI baselines的使用方法
OpenAI,由諸多矽谷大亨聯合建立的人工智能非營利組織。2015年馬斯克與其他矽谷科技大亨進行連續對話後,決定共同創建OpenAI,希望能夠預防人工智能的災難性影響,推動人工智能發揮積極作用
OpenAI、DeepMind,伯克利三個可以說是強化學習的推動者,其中OpenAI 為很多算法都寫瞭baselines。本文講開始運行例子,以A2C算法為例子(具體a2c算法原理後續講解):
首先就是安裝gym環境,具體直接參考OpenAI的github:
https://github.com/openai/gym
本文使用瞭Atari遊戲,那麼在gym中需要安裝,不然有的遊戲可能不會默認安裝:
pip install -e '.[atari]'
這是原話:
The Atari environments are a variety of Atari video games. If you didn’t do the full install, you can install dependencies via pip install -e ‘.[atari]’ (you’ll need cmake installed) and then get started as follow:
import gym env = gym.make('SpaceInvaders-v0') env.reset() env.render()
下一步就是clone baselines的倉庫瞭:
git clone https://github.com/openai/baselines.git
然後進入目錄進行運行:
目錄如下:
total 48 drwxrwxr-x 6 jqw jqw 4096 Jun 8 16:50 . drwxrwxr-x 3 jqw jqw 4096 Jun 7 11:07 .. drwxrwxr-x 15 jqw jqw 4096 Jun 8 19:42 baselines drwxr-xr-x 2 root root 4096 Jun 8 16:50 baselines.egg-info drwxrwxr-x 2 jqw jqw 4096 Jun 7 11:08 data -rw-rw-r-- 1 jqw jqw 504 Jun 7 11:08 Dockerfile drwxrwxr-x 8 jqw jqw 4096 Jun 7 11:08 .git -rw-rw-r-- 1 jqw jqw 285 Jun 7 11:08 .gitignore -rw-rw-r-- 1 jqw jqw 1087 Jun 7 11:08 LICENSE -rw-rw-r-- 1 jqw jqw 3417 Jun 7 11:08 README.md -rw-rw-r-- 1 jqw jqw 957 Jun 7 11:08 setup.py -rw-rw-r-- 1 jqw jqw 224 Jun 7 11:08 .travis.yml
python3 -m baselines.a2c.run_atari
就可以瞭,其他的算法同樣的道理。
註意:此處使用給的是python3,
那麼對應需要在python3下安裝numpy, matplotlib, tensorflow, 等一系列庫,此處省略
參考:
https://github.com/openai/gym
https://github.com/openai/baselines
以上就是人工智能深度學習OpenAI baselines的使用方法的詳細內容,更多關於人工智能OpenAI baselines的資料請關註WalkonNet其它相關文章!
推薦閱讀:
- baselines示例程序train_cartpole.py的ImportError
- 使用docker安裝elk的詳細步驟
- 如何將自己的python代碼發佈在pip install給別人使用你知道嗎
- .gitignore文件作用及使用方法詳解
- python 如何上傳包到pypi