人工智能應(yīng)用落地如火如荼,科技巨頭間的技術(shù)競(jìng)爭(zhēng)也在風(fēng)起云涌。3月29日,在國(guó)際頂級(jí)賽事Pascal VOC挑戰(zhàn)賽目標(biāo)檢測(cè)Competition 3子任務(wù)中,搜狗人工智能圖像團(tuán)隊(duì)所提交的FPNSSD深度模型,獲得了77.0的高分,一舉刷新了該項(xiàng)任務(wù)的世界最好成績(jī)。(成績(jī)查詢(xún)網(wǎng)址:http://host.robots.ox.ac.uk:8080/leaderboard/displaylb.php?challengeid=11&compid=3)。

PASCAL VOC挑戰(zhàn)賽是計(jì)算機(jī)視覺(jué)目標(biāo)檢測(cè)的經(jīng)典權(quán)威賽事,其數(shù)據(jù)集標(biāo)注質(zhì)量高、場(chǎng)景復(fù)雜、目標(biāo)多樣、檢測(cè)難度大,是快速檢驗(yàn)算法有效性的首選。在計(jì)算視覺(jué)領(lǐng)域,Pascal VOC挑戰(zhàn)賽與ImageNet同為世界頂級(jí)的比賽,是國(guó)內(nèi)外AI公司競(jìng)相展開(kāi)激烈競(jìng)爭(zhēng)的主賽場(chǎng)。
PASCAL VOC的數(shù)據(jù)集包括20個(gè)類(lèi)別:人類(lèi),動(dòng)物(鳥(niǎo)、貓、牛、狗、馬、羊),交通工具(飛機(jī)、自行車(chē)、船、公共汽車(chē)、小轎車(chē)、摩托車(chē)、火車(chē)),室內(nèi)物體(瓶子、椅子、餐桌、盆栽植物、沙發(fā)、電視)。其中,搜狗圖像團(tuán)隊(duì)參加的Competition 3子任務(wù),以官方提供的數(shù)據(jù)集為訓(xùn)練集,不能添加其他額外標(biāo)注數(shù)據(jù),更能體現(xiàn)參賽團(tuán)隊(duì)的模型設(shè)計(jì)和技術(shù)功底。
搜狗圖像團(tuán)隊(duì)研發(fā)的FPNSSD檢測(cè)算法,借鑒了RetinaNet的架構(gòu)設(shè)計(jì)思想并優(yōu)化經(jīng)典的SSD檢測(cè)算法,設(shè)計(jì)出基于ResNet152的Feature Pyramid Network(FPN)網(wǎng)絡(luò)結(jié)構(gòu),同時(shí)融合淺層與深層的多尺度特征信息,這種在模型上的選擇和優(yōu)化策略大大增強(qiáng)了對(duì)小目標(biāo)物體的檢測(cè)能力。在此次挑戰(zhàn)賽中,搜狗圖像團(tuán)隊(duì)的FPNSSD檢測(cè)算法在20個(gè)子類(lèi)別中獲得10個(gè)單項(xiàng)第一,其中在鳥(niǎo)、貓、狗等小物體類(lèi)別上勝出優(yōu)勢(shì)明顯,充分驗(yàn)證了FPNSSD檢測(cè)算法在模型結(jié)構(gòu)設(shè)計(jì)上的先進(jìn)性。
此外,F(xiàn)PNSSD檢測(cè)算法采用SoftmaxLoss + Hard Negative Mining的訓(xùn)練方式,在FPNSSD框架中相對(duì)當(dāng)前業(yè)內(nèi)常用的基于FocalLoss的訓(xùn)練方式,能取得更高精度。
搜狗圖像團(tuán)隊(duì)成員大多來(lái)自清華、北大、中科院、浙大等高校,曾先后取得幾十項(xiàng)相關(guān)技術(shù)專(zhuān)利。團(tuán)隊(duì)長(zhǎng)期專(zhuān)注于場(chǎng)景文字檢測(cè)識(shí)別、人臉識(shí)別、圖像細(xì)粒度分類(lèi)、敏感圖像檢測(cè)、圖像理解等前沿領(lǐng)域研究,相關(guān)成果已廣泛應(yīng)用于搜狗旅行翻譯寶、搜狗翻譯APP、搜狗輸入法、搜狗汪仔答題助手、搜狗識(shí)圖等產(chǎn)品,在眾多垂直領(lǐng)域及具體場(chǎng)景中滿(mǎn)足著廣大用戶(hù)日益多樣化、個(gè)性化的應(yīng)用需求。
不僅如此,搜狗人工智能圖像團(tuán)隊(duì)的前沿成果,還通過(guò)搜狗AI開(kāi)放平臺(tái),正在為金融、保險(xiǎn)、醫(yī)療等行業(yè)客戶(hù)提供優(yōu)質(zhì)的AI服務(wù)和解決方案。作為人工智能帶路黨的搜狗,未來(lái)還將基于圖像識(shí)別技術(shù)在更多場(chǎng)景實(shí)現(xiàn)進(jìn)一步突破創(chuàng)新,帶來(lái)更豐富便捷的AI體驗(yàn)。
推薦閱讀
選購(gòu)是門(mén)技術(shù)活Wacom影拓系列數(shù)位板推薦攻略
Wacom影拓動(dòng)漫裝觸控?cái)?shù)位板在性能方面相當(dāng)棒,16毫米感應(yīng)高度60°傾斜角度,133點(diǎn)/秒讀取速率,加上十指觸控設(shè)計(jì),重新設(shè)計(jì)的ExpressKey™4快捷鍵,讓漫畫(huà)創(chuàng)意工作事半功倍。更關(guān)鍵的是,該產(chǎn)品搭載了繪制漫畫(huà)所>>>詳細(xì)閱讀
本文標(biāo)題:搜狗挑戰(zhàn)計(jì)算機(jī)視覺(jué)國(guó)際頂級(jí)賽事 Pascal VOC 刷新世界最好成績(jī)
地址:http://www.geekbao.cn/a/05/305701.html