网商银行计算机视觉技术获国际权威榜单第一,金融领域应用前景广泛
在2022年3月发布的场景解析及语义切割技能国际榜单ADE20K上,网商银行以0.6730的新高排名总分榜首,这是继上一年斩获并坚持cityscapes语义切割榜冠军后,在又一个核算机视觉范畴威望榜单上获得的佳绩。
ADE20K 是麻省理工学院(MIT)于2017年发布的一个可用于场景感知、切割和多物体辨认等多种使命的数据集, 包括150多种室表里不同场景的2万张多张相片,参赛者需求经过算法精确切割和符号其间比如修建、树、人、玻璃窗等物件,精确率越高则得分越高。比较于同类型的cityscapes,ADE 20K设置的环境和场景更为杂乱,对算法适应性的应战也更大,是国际核算机视觉三大尖端会议(CVPR、ICCV和ECCV)语义切割论文威望基准数据集。
针对ADE20K数据集的特色,网商提出BKSeg算法,在优化网络结构、改善练习战略后,测验集上 Pixel Accuracy 到达 0.8158,mIoU 到达 0.5301,终究得分为 0.6730,排名榜首。
BKSeg算法根据Mask2Former算法结构进行优化。具体来说,首要采用了根据CNN与Transformer结合的主干神经网络进行特征学习;其次结合Multi-scale FAPN战略,以提高不同巨细物体的切割作用;此外,BKSeg算法还增加了OHEM模块以提高难辨认物体的切割作用;最终,结合Semi-Supervised Learning技能完成对模型作用的进一步优化
据了解,网商银行是现在仅有一家一起在两个国际榜单上均坚持抢先的组织,一起在榜的还有华为、商汤科技、微软、谷歌、亚马逊等全球科技企业和研究组织。

场景解析和语义切割是核算机视觉的重要技能,能够协助核算机精确感知和了解平面相片上的物体,然后将非结构化的图画转化为能够被核算的数据,为复原和了解实在国际场景供给根底。大多数场景中的物体多样且杂乱,同一类物体在不同场景中的色彩、形状、巨细、姿势也不尽相同,因而怎么经过优化算法对不同物体进行切割和精确辨认,是此类技能的难点。
核算机视觉的不断发展也为金融服务带来了新的办法和形式。作为蚂蚁集团建立建议的专心于服务小微的科技银行,网商银行已经在乡村金融和小微金融风控等范畴广泛应用了此类技能。
在乡村金融范畴,网商银行首先引入了卫星遥感图画辨认技能,在中低分辨率卫星图画上经过核算机视觉进行10X10米的像素级作物辨认,完成了关于玉米、水稻、小麦等20多种主粮作物和苹果、猕猴桃、柑橘等十多种经济作物的辨认,并到达了以往用高分辨率卫星图画才干完成的93%辨认精确率。根据这项技能,网商银行“大山雀”卫星遥感风控体系,现在已掩盖全国超越1000个县域,服务几十万栽培大户。
一起,经过视觉图画辨认切割算法的继续优化,也能够对农房、大棚等设备进行主动提取,快速辨认设备散布类型、数量、面积等信息,然后能够获取乡村经济活动区域散布信息,辅导信贷层面供给更好的区域服务。
如下图所示,底图是天地图区域揭露印象,赤色(农房)、绿色(大棚)别离符号辨认出的设备。

此外,在线下实体店的场景中,图画感知技能也能用于对店肆的职业和运营行为的辨认、了解和描写。例如,经过辨认用户拍照上传的店肆门头照,货架乃至进销获合同和发票,并结合多维度穿插验真技能,网商银行便能够更精确描写小微运营者所在的职业、上下游联系和实在运营相貌,然后为运营性借款授信供给根据。

图例:经过解析相片,能够精确辨认商超货架的货品状况,然后为剖析出售状况供给参照