<div dir="ltr"><div><br></div>Aja,<div><br></div><div>I read the paper with great interest. [Insert appropriate praises here.]</div><div><br></div><div>I am trying to understand the part where you use reinforcement learning to improve upon the CNN trained by imitating humans. One thing that is not explained is how to determine that a game is over, particularly when a player is simply a CNN that has a probability distribution as its output. Do you play until every point is either a suicide or looks like an eye? Do you do anything to make sure you don't play in a seki?</div><div><br></div><div>I am sure you are a busy man these days, so please answer only when you have time.<br></div><div><br></div><div>Thanks!</div><div>Álvaro.</div><div><br></div><div><br></div></div><div class="gmail_extra"><br><div class="gmail_quote">On Wed, Jan 27, 2016 at 1:46 PM, Aja Huang <span dir="ltr"><<a href="mailto:ajahuang@google.com" target="_blank">ajahuang@google.com</a>></span> wrote:<br><blockquote class="gmail_quote" style="margin:0 0 0 .8ex;border-left:1px #ccc solid;padding-left:1ex"><div dir="ltr"><div style="font-size:12.8px">Hi all,</div><div style="font-size:12.8px"><br></div><div style="font-size:12.8px">We are very excited to announce that our Go program, AlphaGo, has beaten a professional player for the first time. AlphaGo beat the European champion Fan Hui by 5 games to 0. We hope you enjoy our paper, published in Nature today. The paper and all the games can be found here: </div><div style="font-size:12.8px"><br></div><div style="font-size:12.8px"><a href="http://www.deepmind.com/alpha-go.html" target="_blank">http://www.deepmind.com/alpha-go.html</a><br></div><div style="font-size:12.8px"><br></div><div style="font-size:12.8px">AlphaGo will be competing in a match against Lee Sedol in Seoul, this March, to see whether we finally have a Go program that is stronger than any human! </div><span class="HOEnZb"><font color="#888888"><div style="font-size:12.8px"><br></div><div style="font-size:12.8px">Aja</div></font></span><div style="font-size:12.8px"><br></div><div style="font-size:12.8px">PS I am very busy preparing AlphaGo for the match, so apologies in advance if I cannot respond to all questions about AlphaGo.</div></div>
<br>_______________________________________________<br>
Computer-go mailing list<br>
<a href="mailto:Computer-go@computer-go.org">Computer-go@computer-go.org</a><br>
<a href="http://computer-go.org/mailman/listinfo/computer-go" rel="noreferrer" target="_blank">http://computer-go.org/mailman/listinfo/computer-go</a><br></blockquote></div><br></div>