aai's Issues
狂ったようにsupervised learning回しまくる
supervised learningの精度向上 (適当にarchitecture変えたりlearning rateいじったり)
相手の実力を加味したうえでの方策
高速なオセロシミュレータ
棋譜を集める
棋譜を沢山クローリングできるようにしておく
PreprocessedDataset作る
-
棋譜データ読み込む
-
ランダムに1ターン選ぶ
-
そのターン開始時の盤面を再現
-
その盤面を元に、以下の特徴量(6x8x8)を作成する
order name description 0 黒の石の有無 0:ない、1:ある 1 白の石の有無 0:ない、1:ある 2 おけるかどうか 0:おけない、1:おける 3 ターン数 64で割って[0, 1)で正規化 4 自分の色 5 返せる個数 最大値で割って[0, 1]で正規化
教師あり学習回す
棋譜を学習しある程度それっぽいpolicy networkを作る
既存AIとの対戦環境の構築
Cythonで置き換える
探索エンジンつくる
-
パラメータ
name type description board Board 探索開始時の盤面状態 depth int 読む深さ limit int 探索打ち切り時刻 -
返り値
探索結果の木のtuple
Node: (b: Board, c: Color, (x: int, y: int, next: Node)[])
の形。伝われ。
対称性の考慮 (data augmentation)
train時、回転、反転、の8通りのdata augmentation
self-playによる強化学習
二人で終局までplayして、最後に方策勾配法で学習
V(s)の教師データ作成
- V(盤面s) -> 最終的な石の差の確率分布P(s)
- Q(盤面s, 手a) == V(s') ->最終的な石の差の確率分布P(s)
を求める関数(モンテカルロ?)
- 自分はランダム
- 極論、sにおけるすべての手を試して一番引き分けに近いところ行きたい。
Recommend Projects
-
React
A declarative, efficient, and flexible JavaScript library for building user interfaces.
-
Vue.js
🖖 Vue.js is a progressive, incrementally-adoptable JavaScript framework for building UI on the web.
-
Typescript
TypeScript is a superset of JavaScript that compiles to clean JavaScript output.
-
TensorFlow
An Open Source Machine Learning Framework for Everyone
-
Django
The Web framework for perfectionists with deadlines.
-
Laravel
A PHP framework for web artisans
-
D3
Bring data to life with SVG, Canvas and HTML. 📊📈🎉
-
Recommend Topics
-
javascript
JavaScript (JS) is a lightweight interpreted programming language with first-class functions.
-
web
Some thing interesting about web. New door for the world.
-
server
A server is a program made to process requests and deliver data to clients.
-
Machine learning
Machine learning is a way of modeling and interpreting data that allows a piece of software to respond intelligently.
-
Visualization
Some thing interesting about visualization, use data art
-
Game
Some thing interesting about game, make everyone happy.
Recommend Org
-
Facebook
We are working to build community through open source technology. NB: members must have two-factor auth.
-
Microsoft
Open source projects and samples from Microsoft.
-
Google
Google ❤️ Open Source for everyone.
-
Alibaba
Alibaba Open Source for everyone
-
D3
Data-Driven Documents codes.
-
Tencent
China tencent open source team.