<div dir="ltr">> One thing that is not explained is how to determine that a game is over</div><span>
</span><p dir="ltr">You'll find that very little of the literature explicitly covers this. When I asked this question I had to search a lot of papers on MCTS which mentioned "terminal states" before finding one which defined them.</p><span>
</span><p dir="ltr">Let me see if I can find the actual paper, but they defined it as a position where there are no more legal moves. You're right though, that ignores sekis, which makes me think I'm remembering wrong.</p><div class="gmail_quote"><div dir="ltr">On Mon, Feb 1, 2016, 13:45 Álvaro Begué <<a href="mailto:alvaro.begue@gmail.com" target="_blank">alvaro.begue@gmail.com</a>> wrote:<br></div><blockquote class="gmail_quote" style="margin:0 0 0 .8ex;border-left:1px #ccc solid;padding-left:1ex"><div dir="ltr"><div><br></div>Aja,<div><br></div><div>I read the paper with great interest. [Insert appropriate praises here.]</div><div><br></div><div>I am trying to understand the part where you use reinforcement learning to improve upon the CNN trained by imitating humans. One thing that is not explained is how to determine that a game is over, particularly when a player is simply a CNN that has a probability distribution as its output. Do you play until every point is either a suicide or looks like an eye? Do you do anything to make sure you don't play in a seki?</div><div><br></div><div>I am sure you are a busy man these days, so please answer only when you have time.<br></div><div><br></div><div>Thanks!</div></div><div dir="ltr"><div>Álvaro.</div><div><br></div><div><br></div></div><div class="gmail_extra"><br><div class="gmail_quote">On Wed, Jan 27, 2016 at 1:46 PM, Aja Huang <span dir="ltr"><<a href="mailto:ajahuang@google.com" target="_blank">ajahuang@google.com</a>></span> wrote:<br><blockquote class="gmail_quote" style="margin:0 0 0 .8ex;border-left:1px #ccc solid;padding-left:1ex"><div dir="ltr"><div style="font-size:12.8px">Hi all,</div><div style="font-size:12.8px"><br></div><div style="font-size:12.8px">We are very excited to announce that our Go program, AlphaGo, has beaten a professional player for the first time. AlphaGo beat the European champion Fan Hui by 5 games to 0. We hope you enjoy our paper, published in Nature today. The paper and all the games can be found here: </div><div style="font-size:12.8px"><br></div><div style="font-size:12.8px"><a href="http://www.deepmind.com/alpha-go.html" target="_blank">http://www.deepmind.com/alpha-go.html</a><br></div><div style="font-size:12.8px"><br></div><div style="font-size:12.8px">AlphaGo will be competing in a match against Lee Sedol in Seoul, this March, to see whether we finally have a Go program that is stronger than any human! </div><span><font color="#888888"><div style="font-size:12.8px"><br></div><div style="font-size:12.8px">Aja</div></font></span><div style="font-size:12.8px"><br></div><div style="font-size:12.8px">PS I am very busy preparing AlphaGo for the match, so apologies in advance if I cannot respond to all questions about AlphaGo.</div></div>
<br>_______________________________________________<br>
Computer-go mailing list<br>
<a href="mailto:Computer-go@computer-go.org" target="_blank">Computer-go@computer-go.org</a><br>
<a href="http://computer-go.org/mailman/listinfo/computer-go" rel="noreferrer" target="_blank">http://computer-go.org/mailman/listinfo/computer-go</a><br></blockquote></div><br></div>
_______________________________________________<br>
Computer-go mailing list<br>
<a href="mailto:Computer-go@computer-go.org" target="_blank">Computer-go@computer-go.org</a><br>
<a href="http://computer-go.org/mailman/listinfo/computer-go" rel="noreferrer" target="_blank">http://computer-go.org/mailman/listinfo/computer-go</a></blockquote></div>