电脑视觉物件侦测中,一般都是先用特殊算法选取物件,然后再进行辨识。
特殊算法选取物件的过程,我们称为 Region Proposal(区域提案)。常用到的方法如Selective Search等等。
待选出物件后,对此区域撷取相关特征并加以分类,然后再针对此区域进行物件辨识。这种需要先找出Region Proposal然后再做辨识的做法通常就称为二阶学习法(two stage learning)。
二阶学习法有个重大问题 就是一张图在一阶时,提了太多的案件,比如提了1000个案件,那么接下来就要开始辨识系统啰。如果一个案件要辨识要0.1秒,那一千个案件不就要~~~100秒了。
除非你用一个很强的GPU平行运算,那还可能减低运算时间,但如果是手机这类型的算法几乎没办法做到即时运算,因此才有one stage的方法。