盡管在技術(shù)上需要更加精進(jìn),但行為識(shí)別已經(jīng)開(kāi)始走向一些場(chǎng)景。
根據(jù)中商產(chǎn)業(yè)研究院發(fā)布的《2019-2024年中國(guó)機(jī)器視覺(jué)行業(yè)前景及投資機(jī)會(huì)研究報(bào)告》顯示,2018年中國(guó)機(jī)器視覺(jué)市場(chǎng)規(guī)模首次超過(guò)100億元;而隨著行業(yè)技術(shù)提升、產(chǎn)品應(yīng)用領(lǐng)域拓展,機(jī)器視覺(jué)市場(chǎng)將進(jìn)一步擴(kuò)大,預(yù)計(jì)在2019年機(jī)器視覺(jué)市場(chǎng)規(guī)模將近125億元。
的確CV(機(jī)器視覺(jué))行業(yè)的市場(chǎng)規(guī)模不小、也有利可圖,但當(dāng)技術(shù)產(chǎn)品紛紛成熟開(kāi)始走向落地應(yīng)用的時(shí)候,如何吃到這塊蛋糕,成為了眾多CV創(chuàng)企們所面臨的最大難題。與此同時(shí),持續(xù)虧損、盈利壓力也在催促著每家CV企業(yè)努力“奔跑”。
趨視科技并不屬于CV領(lǐng)域最知名的行業(yè),然而它們卻在落地應(yīng)用和盈利上先人一步,其公司創(chuàng)始人徐飆表示:“如果行業(yè)內(nèi)90%的企業(yè)都在虧損,我們則屬于另外那10%。”
它們是如何做到的呢
圖 | 趨視科技創(chuàng)始人徐飆
CV不僅有人臉識(shí)別,還有行為分析
談及CV,關(guān)注度和話題往往都集中于人臉識(shí)別領(lǐng)域,商湯、曠視等更是行業(yè)內(nèi)外關(guān)注的焦點(diǎn),但CV并不等同于人臉識(shí)別,它還包括行為識(shí)別。徐飆介紹,趨視科技在成立至今一直都瞄準(zhǔn)的是行為識(shí)別。
“行為識(shí)別就是識(shí)別人類或者車(chē)的行為,比如人的打架行為、汽車(chē)闖紅燈行為等。雖然都屬于機(jī)器視覺(jué),但人臉識(shí)別和行為識(shí)別是兩個(gè)技術(shù)、不同領(lǐng)域。”
技術(shù)層面,人臉識(shí)別通過(guò)一張照片就能完成,而行為識(shí)別則需要通過(guò)連續(xù)數(shù)據(jù)結(jié)合起來(lái)進(jìn)行判斷,因?yàn)樾袨楸旧硎且粋€(gè)連續(xù)動(dòng)態(tài)的過(guò)程。簡(jiǎn)而言之,人臉識(shí)別解決的是目標(biāo)對(duì)象是誰(shuí)的問(wèn)題,而行為解決的是做了什么樣的事。目前行為識(shí)別往往用于司法管理、智慧門(mén)店、智能社區(qū)等場(chǎng)景。
徐飆告訴我們:“行為識(shí)別適用的領(lǐng)域非常多,但當(dāng)前由于技術(shù)不夠成熟,面對(duì)太過(guò)復(fù)雜且并不標(biāo)準(zhǔn)的場(chǎng)景,行為識(shí)別技術(shù)很難發(fā)揮出很好的效果。所以該技術(shù)只能在一些垂直場(chǎng)景中先應(yīng)用起來(lái),慢慢地在應(yīng)用過(guò)程中不斷的積累、提升技術(shù),以此擴(kuò)展到更多場(chǎng)景,最終滿足整個(gè)大范圍內(nèi)人類對(duì)行為認(rèn)知的要求。”
那么行為識(shí)別的技術(shù)難點(diǎn)究竟是什么呢?
由于行為是多樣化的話,它包括個(gè)體行為、群體行為,具體每個(gè)行為的表現(xiàn)方式也并不相同。比如打架行為和偷竊行為、一個(gè)人與一個(gè)人之間的打架和群體之間的打架行為等都全然不同,因此行為識(shí)別在數(shù)據(jù)采集層面就面臨很大的困難,其中主要涉及遮擋、錯(cuò)位等問(wèn)題。
同時(shí)人類看待世界的角度是三維的,而攝像頭采集到的畫(huà)面是二維,因此會(huì)造成視頻中有一個(gè)人露出了一只胳膊,但由于視頻無(wú)法采集到距離參數(shù),所以遮擋、錯(cuò)位的現(xiàn)象會(huì)讓AI算法難以判斷。
其次學(xué)習(xí)數(shù)據(jù)欠缺。眾所周知,許多AI技術(shù)依靠深度學(xué)習(xí)算法模型去訓(xùn)練,這導(dǎo)致要讓AI實(shí)現(xiàn)行為識(shí)別,就必須先給行為下定義,讓AI知道行為是什么。然而前面已經(jīng)提到行為非常復(fù)雜,甚至很多時(shí)候AI需要學(xué)習(xí)判斷的是負(fù)面行為,因此企業(yè)很難獲取到大量的學(xué)習(xí)數(shù)據(jù)。而算法模型沒(méi)有經(jīng)過(guò)大量數(shù)據(jù)去訓(xùn)練,也就很難“聰明”起來(lái),從而在識(shí)別的效果和精度上難以達(dá)到用戶需求。
不過(guò)盡管在技術(shù)上需要更加精進(jìn),但行為識(shí)別已經(jīng)開(kāi)始走向一些場(chǎng)景。
CV企業(yè)破冰關(guān)鍵:規(guī)模化
徐飆介紹:“公司一開(kāi)始關(guān)注的就是行業(yè)落地而非通用場(chǎng)景,且瞄準(zhǔn)的第一個(gè)領(lǐng)域就是司法領(lǐng)域行業(yè)的管理,比如監(jiān)獄管理,是否有犯人打斗、翻墻、攀爬等。這對(duì)于司法領(lǐng)域的管理而言是一個(gè)剛需,能夠降低人力管理成本,提升管理質(zhì)量。”
而行業(yè)落地和通用場(chǎng)景落地兩條路徑的最大區(qū)別,在徐飆看來(lái),前者能夠助力企業(yè)快速實(shí)現(xiàn)規(guī)模化落地,而這至關(guān)重要。
他談到:“所有CV廠商在近年來(lái)特別強(qiáng)調(diào)落地,本質(zhì)上就是規(guī)模化落地,即企業(yè)在一個(gè)項(xiàng)目試點(diǎn)實(shí)現(xiàn)技術(shù)落地后能夠快速?gòu)?fù)制到下一個(gè)同類型的場(chǎng)景中,而不是做完一個(gè)試點(diǎn),下一個(gè)場(chǎng)景再重新做一遍,這無(wú)疑增加了許多成本。”
對(duì)于企業(yè)而言,要實(shí)現(xiàn)規(guī)模化落地首先在最初尋找落地行業(yè)時(shí),就要找到能夠?qū)崿F(xiàn)規(guī)模化、可復(fù)制性強(qiáng)的場(chǎng)景。其中的關(guān)鍵在于,企業(yè)對(duì)于用戶核心訴求的把握是否精確。徐飆認(rèn)為,CV企業(yè)要實(shí)現(xiàn)規(guī)模化必須了解用戶的需求,所謂需求指的不僅是用戶對(duì)于功能的需求,還包括用戶對(duì)性能當(dāng)中準(zhǔn)確度的要求。
“這需要碰撞。有些時(shí)候沒(méi)有人會(huì)告訴你他的需求和對(duì)準(zhǔn)確度的要求是什么,企業(yè)往往需要通過(guò)試點(diǎn)、交流、反饋、修正......逐步形成一個(gè)行業(yè)共識(shí),而并非單個(gè)客戶的需求。”
但即便把握了用戶需求和性能指標(biāo)并不足夠,企業(yè)還要評(píng)估自身的技術(shù)體系、優(yōu)勢(shì)能否滿足用戶的需求和指標(biāo)。最后企業(yè)還要考慮實(shí)現(xiàn)規(guī)模化之后,是否會(huì)被競(jìng)品取代,這要求其必須在技術(shù)落地應(yīng)用過(guò)程中打造自身的技術(shù)門(mén)檻,如此廠商們才能率先占領(lǐng)市場(chǎng),并在后續(xù)的競(jìng)爭(zhēng)中獲勝。
回到趨視科技自身,徐飆談道:“公司明年的短期計(jì)劃,一方面是確保在司法行業(yè)實(shí)現(xiàn)規(guī)模化,創(chuàng)造更多的收益;同時(shí)也會(huì)將技術(shù)落地到智慧門(mén)店場(chǎng)景。小規(guī)模化帶給我們盈利,也驗(yàn)證了技術(shù)已經(jīng)達(dá)到可復(fù)制狀態(tài),所以我們將會(huì)向更大的市場(chǎng)進(jìn)行布局。”
【鎂客·請(qǐng)講】欄目 策劃&撰寫(xiě):溫暖