基于AI的图像视觉处理技术( 五 )


应用场景及商业价值
的应用同UNet一样 , 都适合分割场景任务 。
4.Mask R-CNN
Mask R-CNN是一个小巧、灵活的通用对象实例分割框架() 。它不仅可对图像中的目标进行检测 , 还可以对每一个目标给出一个高质量的分割结果 。
技术思想及原理分析
是大神何凯明之作 , 集检测、分类、分割为一体的大模型 。看名字就知道和Rcnn系列有一定联系 , 其实就是在Rcnn的基础上增加了一个类似UNet的分割模型 , Rcnn本来是做检测和分类的 , 就是其基础上增加了一个分割功能 。虽然功能全面 , 但是不一定适合所有的场景 , 比如有的时候 , 你可能只需要做分割 , 仅此而已 , 这时候选择什么模型就需要认真思考了 , 不然参数过于冗余的模型会降低效率 , 而多余的功能对当前的任务可能并没有必要 。
应用场景及商业价值
融合了检测、分类、分割三种功能 , 其使用场景更多一些 。比如一些需要对不同类别的实体进行分割分类的任务 。