2.appendix H & 4.1
weight空间是离散的(所以需要平滑):
看一下这个问题是否存在(做一遍binaryduo的实验验证一下)-> 类NES方法search ->
妃哥:
天辰:
Q1:为什么要做smooth -> gradient 方向更丰富(而不是0/1)? Q2:BMXNet的weight initialization?(我们似乎是norm,忘记BMXNet的initialization方法了。