排雷避坑,机器学习一定要避开的3大陷阱

几十年来,机器学习领域一直饱受“坦克问题(tankproblem)”的折磨。

故事发生在上个世纪60年代(此研究已知的最早文献,此处感谢软件工程师JeffKaufman),事件的细节已湮没在时间的迷雾当中,不过故事大概是这样子的:
研究者们编写了个算法来从军方提供的照片中识别坦克。该模型成功地在测试图中找到了坦克,但随后使用真实的照片时却失败了。
原因是什么呢?口口相传的具体细节各不相同,