摄像头训练的吃豆人,我还是没活几集|TensorFlow.js
方栗子 发自 凹非寺 量子位 报道 | 公众号 QbitAI
上个周末,面向JavaScript开发者的TensorFlow.js在TF开发者峰会上发布。会上,Nikhil Thorat演示的图像训练版吃豆人,看上去是一款非常友好的游戏。
既然有官网挂出的Demo地址,作为好事者的一员,我也去试了一试。顺便帮大家测试一下网页版的游戏体验。只要打开电脑的前置摄像头,便可以用四种不同的图像训练AI进行上下左右的运动。等Loss值稳定下来,表示训练结束,就开始游戏吧。
EP01
我选择了比较方便的手势训练。一开始,只用大拇指表示四个方向。发现手势传达的意图很不明确,当时以为是AI不负责识别图像的方向——向上和向右 (皆手背朝外) 分不清,向左和向下 (皆手心朝外) 分不清。EP02后来,我把上和左换成了食指。AI依然固执地朝我不想去的方向跑,拇指和食指也分不清。EP03一定是我的脸出现在镜头里,AI才会困惑的,我这样想着。于是,我尽量把脸移出去了。然而并没有什么用,AI还是有些茫然。
EP04
并不甘心。我干脆不用手了,换成头部的前俯后仰,左摇右摆。万万没想到,虽然动作不甚美观,但这次真的好了许多,终于打上了3000分。
操作渣对自己的表现一本满足。后续不过,依然发现了一些问题。这个游戏厉害的地方是,动作变换的途中,系统经常识别出我们无法控制的方向。大概,在没有岔路的时候变换动作最为稳妥,就算过渡期间出现插曲,也能得到有效的纠正。不过,也只是想想,毕竟这种级别的操作已经不是我能练成的。
另外, learning rate (学习速率) 、batch size (批尺寸) 、epoch (所有数据训练的遍数) 和hidden units (隐含单元) 这四个参数的调整,在操作渣的成绩方面,似乎也没有体现出更大的帮助。可能多试几次,会找到更适合的参数组合。以及,关于样本的数量,一言难尽。四组样本,取到最后一组的当中,浏览器可能会突然闪一下——那是在说,前面的样本白取了,回去重新拍照吧。嗯,其实我也想多玩几次的。
- 免责声明
- 本文所包含的观点仅代表作者个人看法,不代表新火种的观点。在新火种上获取的所有信息均不应被视为投资建议。新火种对本文可能提及或链接的任何项目不表示认可。 交易和投资涉及高风险,读者在采取与本文内容相关的任何行动之前,请务必进行充分的尽职调查。最终的决策应该基于您自己的独立判断。新火种不对因依赖本文观点而产生的任何金钱损失负任何责任。