归档
正在加载今日诗词...
08
28
05
K-bandit Algorithm K-bandit Algorithm
问题描述 有$K$个赌博机,每个赌博机有一定概率$P$吐出硬币,但是我们不知道这个概率是多少,每个赌博机吐出的硬币价值$V$也是不一样的,现在有$T$次机会选择赌博机,怎么选才能使得到的硬币总价值最大? 在下面的不同算法实现中,统一设定\[
2018-08-05
03