地址推荐一本书: http://incompleteideas.net/sutton/book/the-book-2nd.html
是看论文 Hacking Google reCAPTCHA v3 using Reinforcement Learning https://arxiv.org/abs/1903.01003v2
里的公式2 没有见过 看引文目录是在:MIT reinforcement learning second edition 2018
一看书500多页,先放过来,以后有机会琢磨。
原文:https://www.cnblogs.com/yjphhw/p/10609749.html