商品識(shí)別和新零售。在這個(gè)里面,我們列了五個(gè)點(diǎn):
第一,我們要解釋一下,什么是商品識(shí)別。因?yàn)椋乙徽勥@個(gè)概念,我估計(jì)在座的每一個(gè)人都有自己的想法,我們也是做了很多的研究,我們也有自己的想法,但是我相信在這一點(diǎn)上,因?yàn)榇蠹姨幱趥鹘y(tǒng)行業(yè),可能沒(méi)有專(zhuān)門(mén)去做這個(gè)事情,但是我是專(zhuān)門(mén)做了一些商品識(shí)別是什么這件事情的研究。
第二,深度學(xué)習(xí)已經(jīng)是一個(gè)10幾年前的技術(shù)了,包括它最火的時(shí)候是2012年,AlexNet出來(lái)的時(shí)候,但是到現(xiàn)在也是有16年的時(shí)間了,其實(shí)我們要看的不是一個(gè)新技術(shù),我更多看的是一些成熟的技術(shù),怎么樣去解決各種各樣的問(wèn)題。所以,這里我會(huì)介紹一下我們現(xiàn)在圖像識(shí)別中一些成熟的技術(shù),我會(huì)在商品識(shí)別中怎么使用它。
第三,我到了任何一個(gè)地方我去跟人家講的時(shí)候,人家都會(huì)問(wèn)我,說(shuō)你們跟人臉識(shí)別有什么區(qū)別,商品識(shí)別跟人臉識(shí)別到底哪個(gè)難,這一點(diǎn)我要給大家去做一些區(qū)分。
第四,我們?yōu)槭裁磿?huì)選擇這個(gè)賽道?我們?yōu)槭裁磿?huì)覺(jué)得商品實(shí)際上對(duì)未來(lái),對(duì)人類(lèi)生活的改變意義重大。
第五,我這里寫(xiě)的是重塑新零售哪些落地場(chǎng)景,我會(huì)把我們現(xiàn)在的一些,已經(jīng)落地的,不管是剛需還是軟需,這種已經(jīng)落地的產(chǎn)品形態(tài)給大家介紹。因?yàn)椋吘股唐纷R(shí)別也好,新零售也好,其實(shí)時(shí)間還蠻短的,尤其是把人工智能這個(gè)技術(shù)應(yīng)用到這個(gè)領(lǐng)域里面,時(shí)間也是蠻短的。
確實(shí),我們發(fā)現(xiàn)有很多難以落地的地方,有很多客戶(hù)找來(lái)的時(shí)候,他提出的需求太特別了,太特別了很難規(guī)模化。但是,我愿意把這些成功和識(shí)別的,或者我們已經(jīng)做完的一些事情跟大家分享,希望能激發(fā)大家的一些靈感。
將來(lái)大家在自己的行業(yè)中,去做一些更容易規(guī)模化的,可以很好的解決用戶(hù)需要的這么一些點(diǎn)。這里我其實(shí)一直有一個(gè)看法。很多人都說(shuō)現(xiàn)在的世界是AI+什么,比如說(shuō)AI+醫(yī)療、AI+教育,但是我覺(jué)得從一個(gè)技術(shù)出發(fā),讓技術(shù)人去找每一個(gè)領(lǐng)域的痛點(diǎn),去解決他們的問(wèn)題,可能是一個(gè)麻煩事兒。
因?yàn)椋@種關(guān)鍵太聚焦于技術(shù)了,他不知道行業(yè)的痛點(diǎn),他總覺(jué)得行業(yè)的很多東西,我招幾個(gè)人就可以解決嗎?或者說(shuō)這個(gè)事情值得解決嗎?他會(huì)問(wèn)很多這樣的問(wèn)題,我反而認(rèn)為,這個(gè)詞我們要反過(guò)來(lái)看,我希望是咱們處于各個(gè)行業(yè)的行業(yè)專(zhuān)家,用行業(yè)來(lái)+我們的AI,只有你們知道,真正的行業(yè)痛點(diǎn)是什么,只有你們知道什么地方才是最需要視覺(jué)的,我們才能更好的解決現(xiàn)在的一些問(wèn)題。
什么是商品識(shí)別?
跟商品密切相關(guān)的幾點(diǎn):
第一,我們來(lái)講一下什么是商品識(shí)別,其實(shí)這不是一個(gè)新的概念了,很早以前大家都接觸過(guò)它了。比如說(shuō)最簡(jiǎn)單的,商品的Logo,每一家企業(yè)他做了一個(gè)產(chǎn)品以后它都會(huì)有Logo,耐克、阿迪達(dá)斯都是這樣的,他們通過(guò)Logo讓別人認(rèn)知自己的產(chǎn)品。
第二,就是我們傳統(tǒng)說(shuō)說(shuō)的一維碼和二維碼,UPC和EAN實(shí)際上本身都是一維碼,我們通過(guò)一維碼來(lái)識(shí)別這款商品是什么。
第三和第四可能大家在日常生活中可能碰特到,好像商品識(shí)別僅僅限于前兩點(diǎn),其實(shí)不是這樣的,在第三點(diǎn),我們是對(duì)商品的質(zhì)量是有一個(gè)基本的要求的,比如ISO9000的這種體系,然后去對(duì)這個(gè)商品質(zhì)量去做定義。
在這個(gè)里面,其實(shí)有很多人工智能可以幫助提高商品質(zhì)量這方面的一些想法。
第四,這個(gè)商品最終是要流通的,流通難免要進(jìn)行跨界流通,我從中國(guó)到美國(guó),從美國(guó)到中國(guó),甚至是到日本,各個(gè)國(guó)家都會(huì)商品是什么有一個(gè)自己的定義,當(dāng)然現(xiàn)在會(huì)稍微統(tǒng)計(jì)一點(diǎn),這個(gè)叫HSCode,會(huì)對(duì)商品有一個(gè)固定的定義,根據(jù)商品的流通環(huán)節(jié)會(huì)去考慮它的稅收問(wèn)題、危險(xiǎn)程度,各種各樣的相關(guān)問(wèn)題。
所有這些其實(shí)都是商品識(shí)別所涵蓋的內(nèi)容,這是一個(gè)傳統(tǒng)來(lái)看,我們這個(gè)商品識(shí)別是什么。
所以,用一句話(huà)來(lái)說(shuō),商品識(shí)別就是要識(shí)別商品及其相關(guān)屬性,這是很重要的一點(diǎn),這也是跟人臉識(shí)別有很大不同的一點(diǎn)。你會(huì)發(fā)現(xiàn)人臉識(shí)別,它重要的一點(diǎn)是什么?確認(rèn)人臉的身份,當(dāng)然他也會(huì)確定一些相關(guān)的屬性,人的種族、年齡、性別,但是相關(guān)的屬性你可以想象就是這些,不會(huì)再多。
但是,對(duì)于商品來(lái)說(shuō),他的屬性多不多,會(huì)跟類(lèi)別、質(zhì)量、產(chǎn)地、規(guī)格、商標(biāo)、外觀設(shè)計(jì)都相關(guān),所以所有的這些也是我們看好商品識(shí)別領(lǐng)域一個(gè)重要的因素,這個(gè)市場(chǎng)很大,它永遠(yuǎn)大于人臉市場(chǎng),它有很多可做的事情,所以我們現(xiàn)在做的就是想用計(jì)算機(jī)視覺(jué)與AI的技術(shù),來(lái)去做識(shí)別商品以及相關(guān)的屬性,所以剛才這一位朋友剛才問(wèn)的是商品流通領(lǐng)域,我的庫(kù)存、數(shù)據(jù)怎樣流動(dòng),其實(shí)那個(gè)只是商品識(shí)別中流通環(huán)節(jié)的一小部分,其實(shí)還有這么多的東西都是我們關(guān)注的。
下面就給大家講一講,商品識(shí)別里面會(huì)用到哪些計(jì)算機(jī)的技術(shù),最傳統(tǒng)的技術(shù)其實(shí)大家都知道的,條形碼、二維碼、OCR,其實(shí)也蠻方便的。
OCR跟前面兩個(gè)有一點(diǎn)區(qū)別,OCR這個(gè)技術(shù)還是發(fā)展中,可以說(shuō)會(huì)成熟一些,但是也沒(méi)有成熟到我隨便拿一個(gè)東西,我隨便一拍照、一掃,我就知道是什么的地步,離這個(gè)還有一些距離,但是條形碼、二維碼是相對(duì)來(lái)說(shuō)比較成熟的,它不是一種視覺(jué)技術(shù),它實(shí)際上是一種標(biāo)準(zhǔn)。
只不過(guò)我們把這個(gè)標(biāo)準(zhǔn)通過(guò)一些視覺(jué)的方法來(lái)展現(xiàn)出來(lái)了。
但是,可以想象一下,條形碼、二維碼最大的問(wèn)題是什么呢?我要想使用這個(gè)東西,首先我要有一個(gè)標(biāo)準(zhǔn)化的體系,我可能要有一個(gè)組織、機(jī)構(gòu),跟大家達(dá)成共識(shí),比如說(shuō)像我說(shuō)的UPC和ENA,這樣的機(jī)制,全球所有的商品廠家都要認(rèn)可這個(gè)機(jī)制,這個(gè)是積年累月可能持續(xù)了好幾十年才定下來(lái)的這么一套標(biāo)準(zhǔn)。
其次我所有做這個(gè)二維碼、條形碼的話(huà),無(wú)形之中我要給每一個(gè)商品增加額外的開(kāi)銷(xiāo)成本。然后更重要的是,我在使用的時(shí)候,我需要額外的設(shè)備去識(shí)別。
我忘了哪位朋友問(wèn)的一個(gè)問(wèn)題,既然商品我可以用二維碼、條形碼來(lái)識(shí)別,我為什么還要計(jì)算機(jī)視覺(jué)來(lái)識(shí)別?我先解釋一個(gè)這個(gè)問(wèn)題,我這是這么看待的,不一定對(duì)。其實(shí)對(duì)于我們一個(gè)終端消費(fèi)者,畢竟商品最終的Consumer是我們終端的消費(fèi)者。
你無(wú)論是買(mǎi)帽子也好,買(mǎi)一個(gè)方便面也好,你最終是我們這樣的一個(gè)消費(fèi)著,在我們的概念和意識(shí)中,我們會(huì)Care條形碼和二維碼嗎?我們不Care這個(gè)事情,這個(gè)條形碼、二維碼完全是商家為了自己的管理方便,或者是整個(gè)商品體系流通的方便強(qiáng)加給我們的概念,我們不得不接受。
包括你現(xiàn)在去盒馬鮮生他有自助結(jié)帳的地方,你要拿二維碼去這個(gè)屏幕上去掃,但是這個(gè)事情就強(qiáng)制我去了解這個(gè)東西,使用這個(gè)東西。但是,我們最終的理想是,我們希望像Amazongo那樣,用戶(hù)只要拿著就走。他本不該知道二維碼,那就不讓他知道二維碼,這是我們的一個(gè)理想。
現(xiàn)在我們都會(huì)說(shuō)深度學(xué)習(xí)或者用計(jì)算機(jī)視覺(jué)來(lái)解決的商品識(shí)別里面的一些問(wèn)題,其實(shí)本質(zhì)上,我們有5大基礎(chǔ)的,計(jì)算機(jī)視覺(jué)的技術(shù):圖像搜索、實(shí)體檢測(cè)、標(biāo)注與分類(lèi)、語(yǔ)義分割,最后是我們的視頻流的實(shí)體追蹤。
實(shí)際上這5個(gè),毫無(wú)疑問(wèn)是我們會(huì)在商品領(lǐng)域里通過(guò)互相組裝和定制來(lái)使用它們來(lái)完成我的一系列商品識(shí)別工作,但是這5個(gè),我估計(jì)可能在座的人并不是圖像識(shí)別相關(guān)的專(zhuān)家,可能沒(méi)有概念,這都是什么?所以,我們先介紹一下是什么。
第一,圖像搜索,它做的是什么事兒呢?就是我?guī)椭业目蛻?hù),建立一個(gè)以圖像為基礎(chǔ)的數(shù)據(jù)庫(kù),這是一個(gè)我們幫助我們家具的客戶(hù)建立了一個(gè)數(shù)據(jù)庫(kù),里面有各種各樣的家具。他的客戶(hù)用戶(hù)會(huì)提交一個(gè)照片,照片里面包含了某一種東西,我們幫他判斷,是不是在數(shù)據(jù)庫(kù)中,以及數(shù)據(jù)庫(kù)中,哪些的圖片或者是商品,跟他所提交的需求是最心思的。
這個(gè)就是圖像搜索所完成的任務(wù)。
第二,圖像分類(lèi),這個(gè)說(shuō)的簡(jiǎn)單一點(diǎn),你給我一張圖,我來(lái)根據(jù)預(yù)先定義好的一組的標(biāo)簽、定義,來(lái)告訴你,這張圖符合哪一個(gè)標(biāo)簽。這是我們給我們另外一個(gè)電商客戶(hù)做的一個(gè)案例,它想做什么呢?我就講講它最終落地的那個(gè)產(chǎn)品是怎么用到技術(shù)的。
他要做什么呢?
首先,他想知道這張圖里,你有他們的電商圖,我想知道這個(gè)圖里有沒(méi)有模特。所以,第一個(gè)計(jì)算機(jī)視覺(jué)圖像分類(lèi)模型給出的結(jié)果,我告訴你這是一個(gè)模特圖,而且準(zhǔn)確率是99%,它一定是一個(gè)模特圖。
然后因?yàn)橛泻芏嗟哪L貓D,有的是半身圖,有的是全身圖,還有的模特是背對(duì)著攝像頭拍的圖,他想知道,當(dāng)天的這個(gè)模特到底是什么樣的姿勢(shì),所以我們會(huì)給他一個(gè)新的模型,判斷這是一個(gè)上半身的圖,這也是準(zhǔn)確度100%,肯定是一個(gè)上半身的圖。
最后,他想判斷這個(gè)圖是正面還是背面的,畢竟都是上半身我也可以背對(duì)著大家,他需要一個(gè)算法來(lái)幫他判斷,這個(gè)圖里面的模特正對(duì)著大家還是背對(duì)著大家,我們依舊給他一個(gè)判斷,我們認(rèn)為是前面。但是,這回的準(zhǔn)確度只有79%,這個(gè)準(zhǔn)確度或者什么東西不重要,但是大家可以看到,我所謂的圖像分類(lèi)就是一個(gè)概念。給一張圖,我?guī)湍惆阉诺侥愣x的標(biāo)簽中的某一個(gè)去。
第三,圖像檢測(cè),我講的這個(gè)技術(shù)的順序你會(huì)發(fā)現(xiàn)是越來(lái)越難的,剛才你給我一張圖,我只要告訴你圖里面的東西是什么,但是我現(xiàn)在不但要告訴你圖里的東西是什么,我還要告訴你圖里面的東西在哪里?比如說(shuō),判斷圖片中的人、狗、桌子、刀子都在什么位置。
我們生活中很多的商品其實(shí)都是帶包裝的,我們?cè)趺磿?huì)利用這些包裝來(lái)識(shí)別這些商品?其實(shí)我們是學(xué)習(xí)著大量的數(shù)據(jù),在學(xué)習(xí)數(shù)據(jù)的時(shí)候,會(huì)有很多的數(shù)據(jù)讓我們的標(biāo)注員進(jìn)行標(biāo)注,就是指讓一些對(duì)這個(gè)商品會(huì)有一定了解的人去幫我們做標(biāo)注,他會(huì)在整個(gè)圖片中去標(biāo)出來(lái)整個(gè)物體的框。
有了標(biāo)注,實(shí)際上我們?cè)趯?shí)際應(yīng)用中:
首先,我們可以判斷這個(gè)物體在圖中的什么位置。
再一個(gè),我們可以精確的判斷出,這個(gè)物體最能表達(dá)他特征的東西是哪一塊,這樣的話(huà)我可以結(jié)合我剛才說(shuō)的搜索技術(shù),或者是其它的一些相應(yīng)技術(shù),來(lái)去判斷這個(gè)物體是什么,這個(gè)就是所謂的圖像檢測(cè)。
第四,語(yǔ)義切割,這個(gè)就比剛才又難了一步,大家可以看到,我剛才是用一個(gè)方塊,來(lái)去標(biāo)注圖中一個(gè)物體的位置。但是我通過(guò)語(yǔ)義切割的技術(shù),我可以找到以類(lèi)別為單位的,精確到像素級(jí)的這個(gè)物體的位置。
比如我可以找到這一組人他們的位置,這個(gè)就不是一個(gè)方塊的概念了,是真正的把他們都通過(guò)像素的方式來(lái)標(biāo)出來(lái)了,包括車(chē)、沙發(fā),這個(gè)要比剛才更難。
下面還有一些技術(shù),一個(gè)是圖像標(biāo)注技術(shù),圖像標(biāo)注技術(shù)其實(shí)很像圖像分類(lèi)技術(shù)。剛才我說(shuō)的半身的模特,19個(gè)模式或者是不是上半身的那個(gè)技術(shù)叫圖像分類(lèi),這個(gè)叫圖像標(biāo)注,圖像標(biāo)注比圖像分類(lèi)更難的是,它輸出的不是一個(gè)標(biāo)簽,而是很多多的標(biāo)簽,用來(lái)代表這幅圖中有一些什么內(nèi)容,比如說(shuō)像這幅圖,大家一看,這個(gè)是我們輸出的標(biāo)簽,基本上還是比較吻合這個(gè)圖所包含的內(nèi)容的,但是信息量很大。
這個(gè)是另外的一種圖像標(biāo)注,這種圖像標(biāo)注是指給特定的物品,剛才這個(gè)事情我們叫通用標(biāo)注,就是你認(rèn)為給我一張圖,包括我現(xiàn)在拍一張圖,它可以告訴我,圖片里面有什么。比如說(shuō),我現(xiàn)在拍一張圖,很有可能會(huì)告訴是會(huì)議室,然后有人群,然后這個(gè)就叫通用標(biāo)注,但是有很多特定領(lǐng)域的客戶(hù),比如說(shuō)我們服務(wù)最多的是電商的服裝領(lǐng)域。
他們有很多的需求是判斷服裝的顏色、類(lèi)別、以及圖中的風(fēng)格、標(biāo)簽,所以這個(gè)我們?cè)跇?biāo)注的技術(shù)上會(huì)做一些跟行業(yè)相關(guān)定制的一些特點(diǎn)。比如說(shuō)這個(gè)地方各我們會(huì)判斷她穿的是寬腿褲、T恤衫,以及它們的顏色是多少,包括他們的標(biāo)簽內(nèi)容。
這個(gè)高跟鞋因?yàn)槲医貓D的時(shí)候,沒(méi)有截出來(lái),下面是有一個(gè)高跟鞋,這個(gè)是屬于特定領(lǐng)域的圖像標(biāo)注技術(shù)。所以,這幅圖我剛才多多少少已經(jīng)給大家講解過(guò)了,這個(gè)就是相當(dāng)于我用各種各樣的技術(shù)來(lái)去判斷這個(gè)物體的物質(zhì),以及他的類(lèi)別,包括它的核心區(qū)域,我們可能會(huì)加入一些商標(biāo)檢測(cè),它是什么東西,肯定還會(huì)用到OCR這個(gè)技術(shù),來(lái)去識(shí)別它的相關(guān)一些信息。
這樣我就基本上把一個(gè)商品做成一個(gè)畫(huà)像,我可以知道它是什么東西了。
總之我是通過(guò)這個(gè)技術(shù)來(lái)識(shí)別不同東西的,不同屬性,這一點(diǎn)要強(qiáng)調(diào)了什么呢?跟人臉不太一樣,你會(huì)發(fā)現(xiàn),如果你去看人臉相關(guān)的一些技術(shù)的話(huà),過(guò)去10幾年可能人臉的特征點(diǎn),它是一個(gè)幾十、幾百這么一個(gè)維度,現(xiàn)在可能計(jì)算機(jī)的速度會(huì)更快了。他會(huì)說(shuō)人臉不會(huì)取幾百上千這么一個(gè)特征(點(diǎn)位),所以你可以認(rèn)為它的特征還是比較固定的,包括人的喜怒哀樂(lè)、歲數(shù),這些信息其實(shí)蠻固定的,我只要是人都會(huì)具有這些信息。
商品最大的困難是什么呢?不同的商品有不同的特征。你會(huì)發(fā)現(xiàn),我做服裝、家具,毫無(wú)疑問(wèn)它的樣子很重要,完全能代表它。即使不能代表它的細(xì)節(jié),也要代表它的類(lèi)別。
但是,你會(huì)發(fā)現(xiàn)珠寶這個(gè)東西,你就不能說(shuō),完全看他的樣子了,你要看他的材質(zhì),甚至你要看一些成型珠寶的時(shí)候,要看見(jiàn)一些正面、反面、側(cè)面各個(gè)角度的細(xì)節(jié)。如果你不關(guān)注細(xì)節(jié)的話(huà),你很有可能把兩個(gè)不同材質(zhì)的珠寶的首飾認(rèn)成一種珠寶首飾。
所以,不同的產(chǎn)品我們有不同的關(guān)注點(diǎn),這個(gè)也是商品識(shí)別比較難的一點(diǎn)。
商品識(shí)別技術(shù)能解決什么問(wèn)題?
下面我來(lái)給大家介紹一下,現(xiàn)在我們?cè)诮鉀Q各個(gè)領(lǐng)域中,能解決的一些問(wèn)題。
快速消費(fèi)品
這個(gè)是我給我們商超的一個(gè)客戶(hù)去做的一個(gè)技術(shù)。大家可以可以看到這里,當(dāng)我們這位產(chǎn)品經(jīng)理把東西放進(jìn)去的時(shí)候,我們會(huì)實(shí)時(shí)的檢測(cè)都有什么東西。目前這個(gè)技術(shù)正在給一個(gè)美國(guó)比較大的超市客戶(hù)去做試用,他要解決的地方不是結(jié)帳。
因?yàn)椋蠹視?huì)問(wèn)一個(gè)問(wèn)題,假如說(shuō)東西相互堆疊怎么辦?那肯定也是沒(méi)有辦法的,恰好這個(gè)客戶(hù)需要的不是一個(gè)結(jié)帳的概念,因?yàn)榻Y(jié)帳的概念,如果你要是相互堆疊,沒(méi)有檢查出來(lái),扣費(fèi)沒(méi)有扣到的話(huà),會(huì)有損購(gòu)物體驗(yàn)。他要解決的是什么呢?是重要貨品丟失的問(wèn)題。
用戶(hù)會(huì)自助結(jié)帳,結(jié)帳以后他會(huì)再把車(chē)推到一個(gè)攝像頭下,我們會(huì)判斷,在車(chē)中的重要物體跟他結(jié)帳的時(shí)候,帳單是否一致。確保他不要有一些東西沒(méi)有結(jié)帳,蓋在下面拿走。我們發(fā)現(xiàn),我們這個(gè)技術(shù)最大的一點(diǎn)是,如果發(fā)現(xiàn)有兩件商品是堆疊的話(huà),我會(huì)報(bào)警,會(huì)讓他重新把堆疊的物體分散開(kāi),再次掃描。是做這么一件事情。無(wú)論商品是平坦還是豎起來(lái),其實(shí)都是可以去做檢查的。
服裝、時(shí)尚商品
剛才是一個(gè)零售領(lǐng)域的一些技術(shù)的展示,我們現(xiàn)在看一看,服裝和時(shí)尚商品相關(guān)的一些展示。
現(xiàn)在我們有很多的電商,尤其是賣(mài)服裝類(lèi)的客戶(hù),用的技術(shù)基本都是這套技術(shù),無(wú)論是什么樣的照片,如果他能拍一張給我們的話(huà),我們會(huì)判斷,照片中有哪些東西,包括類(lèi)別。然后幫他去在他的數(shù)據(jù)庫(kù)中去找相關(guān)匹配的衣服。
家具、建材
再有的話(huà),是家居的領(lǐng)域,但是家居的領(lǐng)域,大家看到這個(gè)Demo會(huì)有一點(diǎn)像剛才的,但是是一個(gè)實(shí)際客戶(hù)的演示。也是在家居領(lǐng)域你給我任何一張圖片,我都能立刻識(shí)別出來(lái)這個(gè)圖片中的主要家具,比如說(shuō)頂燈、吊燈、桌子、各種燈都可以拿到,這樣客戶(hù)可以允許他們的客戶(hù)在他們的系統(tǒng)中尋找類(lèi)似的商品。
藝術(shù)品、玩具
這個(gè)是藝術(shù)品和玩具相關(guān)的,玩具我們相對(duì)于現(xiàn)在做得還少一些,其實(shí)玩具這個(gè)東西,很適合視覺(jué)的識(shí)別和檢測(cè)。這是我們給做陶瓷的一個(gè)客戶(hù),定做的一款產(chǎn)品。也是我們有大量的數(shù)據(jù),然后通過(guò)學(xué)習(xí),然后把他所需要的,任何一個(gè)陶瓷工藝品上的數(shù)據(jù)都幫他識(shí)別出來(lái)。所有的這些屬性都由他們的專(zhuān)家來(lái)定這些屬性,我們是把專(zhuān)家他們以前分析的圖片數(shù)據(jù)拿過(guò)來(lái)了以后進(jìn)行了學(xué)習(xí)。
五金工具
然后包括五金工具,雖然我這里沒(méi)有Demo,但是我們跟很大的一家五金工具有一個(gè)很大的電商叫米思米,它是一個(gè)日本的企業(yè),很大的一個(gè)電商,簽訂了一個(gè)戰(zhàn)略合作協(xié)議。去推進(jìn)五金相關(guān)這些工具的識(shí)別的工作。
出版物
最后一塊就是出版物,出版物現(xiàn)在相對(duì)來(lái)說(shuō)會(huì)簡(jiǎn)單一點(diǎn),因?yàn)榉饷婧屠锩娴膱D,它本質(zhì)上是一種不可變形的物體,它不像沙發(fā)、衣服,其實(shí)是一種柔性物體。它本真是可以變形的,所以它各種光照的影響和變形以后的效果,肯定跟你學(xué)習(xí)的時(shí)候不一樣,會(huì)造成一些難度,但是出版物相對(duì)來(lái)說(shuō)會(huì)簡(jiǎn)單一點(diǎn)。
這個(gè)方案其實(shí)就是通過(guò)報(bào)紙上的一些圖片,來(lái)觸發(fā)一些更豐富的媒體展示。
現(xiàn)在是談到了第三個(gè)議題,就剛剛跟大家談到的,很多人都會(huì)問(wèn)人臉跟商品識(shí)別差異在哪里?我覺(jué)得主要是從兩個(gè)方面考慮這個(gè)事情。
第一,我已經(jīng)談到了,對(duì)于技術(shù)來(lái)說(shuō),人臉的技術(shù)相對(duì)來(lái)說(shuō)比較穩(wěn)定、固定,可規(guī)模化,因?yàn)槿四樀奶卣鼽c(diǎn),其實(shí)剛剛我說(shuō)了,長(zhǎng)年以來(lái)一直是一個(gè)點(diǎn)位,可能最近幾年會(huì)多一些,但是這個(gè)技術(shù)還是這樣的一個(gè)技術(shù)、思路。所有的人臉都是用這個(gè)技術(shù)來(lái)解決,可能會(huì)增加一些圖像增強(qiáng),但是基本上技術(shù)的體系是這樣的。
包括我剛才說(shuō)的人的喜怒哀樂(lè)這些信息,也相對(duì)來(lái)說(shuō)是比較固定的,但是剛才給大家展示這么多的視頻以后,大家也可以理解到,商品領(lǐng)域其實(shí)分了很多不同的種類(lèi)五金類(lèi)、家具類(lèi)、珠寶首飾類(lèi),每一種類(lèi)別都有自己獨(dú)特的特征體系,這個(gè)是他最大的一個(gè)難點(diǎn)。
沒(méi)有統(tǒng)一的特征體系,意味著我做家具行業(yè)要把它做好,可能等同于我要把人臉這個(gè)領(lǐng)域做好,這個(gè)規(guī)模就很大了,就很復(fù)雜了。
第二,人臉檢測(cè)這個(gè)東西,雖然我可以判斷他的喜怒哀樂(lè),做一些更豐富的人的檢測(cè),比如說(shuō)這個(gè)人他買(mǎi)了這個(gè)商品以后,他滿(mǎn)意不滿(mǎn)意、開(kāi)心不開(kāi)心,這樣的檢測(cè)我是可以做的。但是,總體來(lái)說(shuō),現(xiàn)在人臉識(shí)別最落地的還是用于判斷人的身份。是不是這個(gè)人?這個(gè)人是誰(shuí)?解決這個(gè)事情。
但是,就像我剛才說(shuō)了,識(shí)別商品,以及商品的屬性,屬性中的種類(lèi)太多了。商品的身份只是他特有的屬性之一,我同時(shí)還要解決全環(huán)節(jié)各個(gè)方面的內(nèi)容,比如說(shuō)我要解決的是一個(gè)質(zhì)量問(wèn)題,我要解決的是一個(gè)管理問(wèn)題。
比如說(shuō)在這個(gè)作用領(lǐng)域,他的涵蓋程度復(fù)雜程度,以及他的商業(yè)價(jià)值,遠(yuǎn)遠(yuǎn)高于人臉識(shí)別。這個(gè)是一個(gè)壁壘。現(xiàn)在這里其實(shí)我沒(méi)有談技術(shù)壁壘,因?yàn)樯唐纷R(shí)別,包括你說(shuō)人臉識(shí)別是不是一種技術(shù)壁壘,我覺(jué)得現(xiàn)在人臉識(shí)別技術(shù)太成熟,也沒(méi)有競(jìng)爭(zhēng)壁壘。更多的可能是我們資源行業(yè)里面,比如說(shuō)技術(shù)進(jìn)入安防行業(yè),他們硬件資源的積累已經(jīng)很長(zhǎng)時(shí)間了,這個(gè)壁壘已經(jīng)形成了。人臉識(shí)別的一些獨(dú)角獸,我用什么辦法去突破這樣的壁壘,去賺取我們的一桶金或者兩桶金,這里面有很多的問(wèn)題。
行業(yè)數(shù)據(jù)
其實(shí)商品識(shí)別也有類(lèi)似的壁壘,我先講右邊的這個(gè)概念,其實(shí)有很多的商業(yè)數(shù)據(jù)是我們拿不到的,比如說(shuō)我們要去做汽車(chē)質(zhì)檢,這個(gè)數(shù)據(jù)以前是沒(méi)有人去采集的,以前是通過(guò)肉眼去看的,所以他們不會(huì)去拍照,所以就沒(méi)有采集這個(gè)環(huán)節(jié)。
這個(gè)時(shí)候我們?cè)趺慈ネ谶@樣的一個(gè)行業(yè)數(shù)據(jù),因?yàn)闆](méi)有圖片、沒(méi)有視頻,我的圖像識(shí)別就弄不起來(lái),所以我怎么去幫助這個(gè)行業(yè)去建立這樣的采集機(jī)制,可能是這個(gè)行業(yè)要面臨的一個(gè)問(wèn)題,所以這個(gè)是我說(shuō)的行業(yè)的數(shù)據(jù)的壁壘,然后再就是規(guī)則的壁壘。
規(guī)則標(biāo)準(zhǔn)
比如說(shuō)我們?cè)诜b領(lǐng)域、時(shí)尚領(lǐng)域,有一個(gè)概念是色系。可能大家會(huì)聽(tīng)說(shuō)一點(diǎn)潘多色系或者NCL色系,這些色系都是世界聞名的一些色系,就是任何一家買(mǎi)賣(mài),你要說(shuō)這個(gè)布料是什么顏色,你要說(shuō)我想把衣服做成顏色,你不談這個(gè)色系基本上是不行的。
所以,有很多人做這個(gè)生意,他都會(huì)把色系夠構(gòu)成一個(gè)冊(cè)子,然后會(huì)把上面的解讀,以及每年新的色系,標(biāo)注了相關(guān)的一些趨勢(shì)分析,然后把這個(gè)東西也作為一個(gè)咨詢(xún)類(lèi)的一個(gè)產(chǎn)品去售賣(mài)。如果你想為我們做事情的話(huà),那你就必須去遵循這樣一個(gè)行業(yè)的規(guī)則和標(biāo)準(zhǔn),然后再比如說(shuō)我們做的最多的是時(shí)尚標(biāo)簽的。
比如說(shuō)我們會(huì)做的,在我看來(lái)有什么樣的衣服,是長(zhǎng)袖、段袖,是珍珠衫還是蝙蝠衫,都做了很多這樣的東西,但是我們?nèi)绻屑?xì)觀察的話(huà),現(xiàn)在最大的天貓、淘寶,還有京東、唯品會(huì)這些,他們的標(biāo)簽體系都是不一樣的。甚至就跟剛剛說(shuō)的,天貓和淘寶他們的標(biāo)準(zhǔn)體系都是不一樣的,這個(gè)時(shí)候就意味著在這個(gè)行業(yè)里面,這個(gè)地方還沒(méi)有一家形成一個(gè)規(guī)范,我怎么定義服飾上面細(xì)節(jié)的標(biāo)簽?
意味著我現(xiàn)在針對(duì)京東的標(biāo)簽體系我做出一套系統(tǒng),可能唯品會(huì)他就不會(huì)買(mǎi)單,可能一些其它的電商不會(huì)買(mǎi)單。到了國(guó)外以后,可能亞馬遜他們覺(jué)得我有自己的體系,我為什么要用你這個(gè)體系。所以,這就是屬于剛才我說(shuō)的,整個(gè)這個(gè)行業(yè)里面的標(biāo)準(zhǔn),會(huì)成為阻礙技術(shù)推動(dòng)的一個(gè)因素。
識(shí)別能力
所以,這個(gè)是一些關(guān)于行業(yè)和標(biāo)準(zhǔn)的一些壁壘。其次從技術(shù)角度和產(chǎn)品的角度來(lái)說(shuō),我們這樣看。技術(shù)的壁壘,剛才我說(shuō)了人臉識(shí)別最好的是什么呢?他識(shí)別了30年,而且相對(duì)比較標(biāo)準(zhǔn),我的一套技術(shù)或者一套框架,我可以解決一批問(wèn)題。
但是,我的商品種類(lèi)太多了,我沒(méi)有一個(gè)方法、一個(gè)框架,可以解決一批問(wèn)題,甚至都是家居領(lǐng)域,可能我針對(duì)地毯和我針對(duì)沙發(fā)這兩樣?xùn)|西,我要解決的方案可能都會(huì)不一樣。除此之外一旦到了商品,比如說(shuō)人臉的話(huà),你可能會(huì)發(fā)現(xiàn),除了安防的攝像頭以外,平時(shí)的時(shí)候我們最多的還是自拍。
或者說(shuō),滴滴司機(jī)我第一次我要去認(rèn)證一下,會(huì)把手機(jī)要放在自己的臉前,所以這種情況下,其實(shí)光照和臉和攝像頭之間的距離其實(shí)新對(duì)來(lái)說(shuō)是固定的。所以,它對(duì)模型的泛化要求會(huì)低一點(diǎn),什么叫泛化要求?是說(shuō)的這個(gè)模型,我在燈光很好的情況下,或者燈光不太好的情況下,或者是有背景比較復(fù)雜的情況下,或者背景跟我訓(xùn)練時(shí)候不一樣情況下,在這些完全跟我一開(kāi)始訓(xùn)練和獲取知識(shí)的時(shí)候,不一樣的情況下,這種情況我還能不能識(shí)別他?一個(gè)泛化好的模型,其實(shí)它會(huì)對(duì)這種干擾因素,會(huì)有一定的冗余度,我不會(huì)受它的影響很大。
所以說(shuō),在商品識(shí)別里面,它不會(huì)存在一個(gè)用戶(hù)跟設(shè)定之間的關(guān)系是固定的,或者光照還是固定的情況下。很有可能是,我在這個(gè)地方拍一個(gè)沙發(fā),但是明天很有可能發(fā)生的是,這個(gè)沙發(fā)被放在一個(gè)角落里面了,我再拍一個(gè)沙發(fā),這個(gè)時(shí)候光照的影響會(huì)蠻大的。
所以,它會(huì)對(duì)模型的泛化要求會(huì)很高,這一塊也是我們不斷的再學(xué)習(xí)和加強(qiáng)的一個(gè)壁壘。我們希望把泛化的這件事情能解決的更好。再其次的話(huà)是說(shuō),現(xiàn)在大家都知道,我們所有的機(jī)器學(xué)習(xí)或者人工智能,我們都是叫監(jiān)督學(xué)習(xí)。什么是監(jiān)督學(xué)習(xí)呢?
首先我有大量的數(shù)據(jù),很多很多的數(shù)據(jù),成百萬(wàn)上千萬(wàn)的數(shù)據(jù),為這些數(shù)據(jù)需要進(jìn)行標(biāo)注,可想知道,所有的標(biāo)注都是由人來(lái)完成,所以有一句戲言說(shuō),有多少人工才有多少智能。到目前為止這是一個(gè)真實(shí)的事情,我需要大量的人工標(biāo)注。
這個(gè)時(shí)候,經(jīng)常會(huì)有客戶(hù)說(shuō),你們需要多少數(shù)據(jù),我可以把數(shù)據(jù)給你,你需要多少數(shù)據(jù),我?guī)湍惆褦?shù)據(jù)給你,幫我訓(xùn)練一個(gè)模型。我們說(shuō),需要10萬(wàn)的數(shù)據(jù)集,客戶(hù)一聽(tīng)那我做不成這個(gè)事兒了,因?yàn)榭蛻?hù)手上很有可能沒(méi)有這么多數(shù)據(jù),即使有這么多數(shù)據(jù),又讓誰(shuí)來(lái)標(biāo)注呢?
所以,這個(gè)是所有的人工智能公司現(xiàn)在面臨的一個(gè)問(wèn)題,我們現(xiàn)實(shí)的數(shù)據(jù)沒(méi)有這么多,標(biāo)注質(zhì)量沒(méi)有這么好,噪音很大。這個(gè)時(shí)候有一個(gè)技術(shù)叫弱監(jiān)督技術(shù),或者是叫半監(jiān)督技術(shù),我們?cè)趺礃油ㄟ^(guò)更好的數(shù)據(jù),噪音更大的數(shù)據(jù),也能完全現(xiàn)在的精準(zhǔn)度,這個(gè)也是一個(gè)會(huì)與以往的深度學(xué)習(xí),機(jī)器學(xué)習(xí)不太一樣的地方,所以這個(gè)也是我們?cè)谏唐纷R(shí)別領(lǐng)域比較獨(dú)到的一點(diǎn),也是我們要加強(qiáng)的一點(diǎn)。
第三,像剛才的標(biāo)簽這個(gè)體系,我說(shuō)過(guò)了,我做一套標(biāo)簽可能京東覺(jué)得是滿(mǎn)意的,但是唯品會(huì)覺(jué)得不滿(mǎn)意,這是因?yàn)槲业臉?biāo)簽體系跟用戶(hù)的體系是不一樣的,這種情況太多了,不止是服飾標(biāo)簽,很多的時(shí)候我做的東西,用戶(hù)說(shuō)第二天我要增加幾個(gè)類(lèi)別,你要給我重新訓(xùn)練嗎?可以。多長(zhǎng)時(shí)間?我標(biāo)數(shù)據(jù)帶訓(xùn)練可能需要一周的時(shí)間,這個(gè)太慢了。
怎么辦呢?我們現(xiàn)在的一個(gè)思路是跟傳統(tǒng)的機(jī)器學(xué)習(xí)不一樣,我提供的不再是一個(gè)簡(jiǎn)單的模型了,我希望把我的后臺(tái)工具,機(jī)器學(xué)習(xí)的訓(xùn)練工具,我的機(jī)器學(xué)習(xí)數(shù)據(jù)采集和標(biāo)注工具,全部平臺(tái)化,提升它,讓它能夠適應(yīng)我的客戶(hù)的環(huán)境。
實(shí)際上我把整套工具和解決方案,打包成一個(gè)解決方案,給我的客戶(hù),有的時(shí)候我不再說(shuō),因?yàn)槲易约旱娜肆?wèn)題或者資源問(wèn)題首先了,我自己來(lái)制造模型吞吐量的能力,我要把制造模型這個(gè)能力給我們的客戶(hù),讓他也有能力,快速的用它自己的數(shù)據(jù),來(lái)完成它自己的模型搭建,這樣我將來(lái)是一個(gè)平臺(tái),我可以讓他使用我的平臺(tái)去完成他自己的任務(wù),這樣會(huì)快很多。
這個(gè)是從技術(shù)角度來(lái)說(shuō)的,我認(rèn)為要加強(qiáng)的三點(diǎn),可以形成一定的壁壘,誰(shuí)要是能把這三點(diǎn)能解決的很好,它一定能成為一個(gè),至少在這個(gè)領(lǐng)域里技術(shù)很強(qiáng),能很落地能解決問(wèn)題的一個(gè)公司。
應(yīng)用能力
然后對(duì)于應(yīng)用能力,其實(shí)剛才我也多少涉及到了,最重要還是收集行業(yè)數(shù)據(jù)的能力。
你到底有沒(méi)有辦法收集行業(yè)數(shù)據(jù),用戶(hù)肯定是沒(méi)有數(shù)據(jù)的,你怎么去跟用戶(hù)合作去收集數(shù)據(jù),你有沒(méi)有思路。其次的話(huà),數(shù)據(jù)收集上來(lái)以后,比如說(shuō)都是沙發(fā),這種沙發(fā)和另外一種沙發(fā)到底有什么區(qū)別,這個(gè)是需要有行業(yè)知識(shí)的。
我客戶(hù)在買(mǎi)沙發(fā)的時(shí)候,它更關(guān)注哪些沙發(fā)的不同點(diǎn),來(lái)幫助他進(jìn)行選擇,這也是需要行業(yè)知識(shí)的。所以,這就是對(duì)行業(yè)數(shù)據(jù)的正確分析和解讀能力。
你會(huì)發(fā)現(xiàn),我做一個(gè)技術(shù)的公司,如果我只提供API或者我只提供SDK,其實(shí)用戶(hù)是不會(huì)買(mǎi)單的,他需要的東西和這個(gè)技術(shù)最終的交付方式,SDK也好,模型也好,其實(shí)中間還有一公里,這個(gè)時(shí)候你需要去理解行業(yè)客戶(hù)他的系統(tǒng),誰(shuí)的落地能力強(qiáng),誰(shuí)和這個(gè)行業(yè)它自身系統(tǒng)的整合能力強(qiáng),誰(shuí)就越能把這個(gè)問(wèn)題解決得更好。
所以,這一點(diǎn)醫(yī)療可能問(wèn)題更嚴(yán)重一點(diǎn),你就發(fā)現(xiàn)醫(yī)療體系里面,各種各樣的系統(tǒng)我都有,但是你怎么把你現(xiàn)有新的東西能整合進(jìn)去,是一個(gè)很難的事情了。
所以,這個(gè)是從三個(gè)角度,政策、行業(yè)標(biāo)準(zhǔn)、技術(shù)壁壘和產(chǎn)品壁壘三方面來(lái)講的這個(gè)事情。下一個(gè)題目就是說(shuō),我們?yōu)槭裁磿?huì)覺(jué)得商品識(shí)別這個(gè)技術(shù)至關(guān)重要。
商品的全流通領(lǐng)域,從設(shè)計(jì)、生產(chǎn)、交易、使用、回收,我們要解決的問(wèn)題太多,而且現(xiàn)在面臨的問(wèn)題也太多。如果我能用我的圖像識(shí)別技術(shù)解決其中的這么一些點(diǎn),那我對(duì)整個(gè)人類(lèi)社會(huì)的效能的提升會(huì)極大,會(huì)有很高的提升。
這個(gè)就是我們認(rèn)為我們能在商品流通的環(huán)節(jié)能做得一些事情,這里我不細(xì)說(shuō),但是有一點(diǎn)我想跟大家講,也是我們之前的一些經(jīng)驗(yàn)。你發(fā)展到現(xiàn)在有五個(gè)點(diǎn),哪個(gè)點(diǎn)可以做,哪個(gè)點(diǎn)里有商業(yè)價(jià)值,這是一個(gè)問(wèn)題。
我是一個(gè)創(chuàng)業(yè)公司,我可以五個(gè)點(diǎn)都做,我也可以像這些項(xiàng)目一樣,比如說(shuō)回收站的用戶(hù)來(lái)找我了,我就幫他做。但是,我們做一個(gè)初創(chuàng)公司我們要考慮一個(gè)問(wèn)題就是:我們?cè)撟瞿膫€(gè)行業(yè),做哪一點(diǎn),我的收益是最高的?
我們其實(shí)之前也走了很多的彎路,包括現(xiàn)在有一些歷史遺留問(wèn)題,我也不得不在這條路上繼續(xù)走下去,但是我們現(xiàn)在在轉(zhuǎn)變一個(gè)思維方式。估計(jì)在座有的朋友可能也了解這一點(diǎn),越是接近C端用戶(hù)的這種產(chǎn)品、訴求,你會(huì)發(fā)現(xiàn)越零散,越難以通過(guò)規(guī)模化的方式去覆蓋。
所以,我們?cè)谶x擇的時(shí)候,我們現(xiàn)在一個(gè)標(biāo)準(zhǔn)是,盡量往生產(chǎn)環(huán)節(jié)的上游去走。比如說(shuō)剛才我記得有一位朋友是講,生產(chǎn)環(huán)節(jié)的一些事情。其實(shí)很遺憾,我們現(xiàn)在這一塊做的還是太少,但是我們后面希望也能去多多接觸這方面的一些內(nèi)容,在生產(chǎn)環(huán)節(jié)里面去做一些事情,可能我們認(rèn)為margin會(huì)大一點(diǎn),會(huì)比在電商行業(yè)或者在零售行業(yè)做很多的事情margin會(huì)大一點(diǎn),這個(gè)是我們目前來(lái)說(shuō)的一些感受。
除了剛才我們說(shuō)的,它會(huì)跟生產(chǎn)商品流通的全環(huán)節(jié)有關(guān),還有一個(gè),是對(duì)于商品流通的監(jiān)管環(huán)節(jié),這個(gè)平常大家可能關(guān)注的比較少一點(diǎn),但是如果你是做這個(gè)買(mǎi)賣(mài)的話(huà),你會(huì)發(fā)現(xiàn)各個(gè)地方砍得很?chē)?yán),你總是會(huì)被這個(gè)砍、那個(gè)砍。
比如說(shuō)質(zhì)檢,質(zhì)監(jiān)你通過(guò)某種認(rèn)證,包括剛才我說(shuō)的UPC的那個(gè)碼,你要去提交你的申請(qǐng),才能申請(qǐng)下來(lái)那個(gè)碼,包括我國(guó)的知識(shí)產(chǎn)權(quán)保護(hù),包括我的收稅的情況,包括我安檢的情況……我們商品識(shí)別的技術(shù)都會(huì)在其中有一些輔助型的作用,包括其實(shí)現(xiàn)在有一些內(nèi)容我們也正在跟一些客戶(hù)去做。
最后一個(gè)題目就是說(shuō),我們的商品識(shí)別是如何重塑我們的零售?我也不說(shuō)新零售,新零售這個(gè)詞真的很新,它到底是什么,我也不是專(zhuān)家很難解釋清楚。對(duì)于新零售,其實(shí)只有人、貨、場(chǎng)三者還不夠,其實(shí)更重要的是這個(gè)數(shù)據(jù)在人、貨、場(chǎng)三者之間的流通,流通起來(lái)之后可能才叫我們的新零售。因?yàn)椋铝闶郯ㄎ覀円曨l直播這個(gè)行業(yè),其實(shí)現(xiàn)在都提一點(diǎn),我需要千人千面。我覺(jué)得新零售這個(gè)概念,最終的一個(gè)終極的目標(biāo)可能也是這樣的改革概念,我會(huì)針對(duì)不同的客戶(hù)會(huì)有不同的東西,不同的體驗(yàn)。
我覺(jué)得這個(gè)到那個(gè)時(shí)候,可能才能算一個(gè)真的新零售,不是像現(xiàn)在的這種零售,我進(jìn)去以后和旁邊這個(gè)人進(jìn)去以后這個(gè)店里面的東西是一樣的,我們要自己去做選擇。然后一個(gè)企業(yè)他可能只能通過(guò)不斷擴(kuò)大他賣(mài)的商品數(shù)量來(lái)實(shí)行覆蓋更多的客戶(hù),可能只能通過(guò)這種方案來(lái)完成。
毫無(wú)疑問(wèn),新零售不管意味著什么,最終我們要做兩件事兒,一個(gè)是給消費(fèi)者能省錢(qián),同時(shí)有更好的消費(fèi)體驗(yàn),對(duì)售賣(mài)者來(lái)說(shuō),肯定是要給他們賺錢(qián),同時(shí)提高他們的整個(gè)管理的性能和流通的性能。然后在新零售或者說(shuō)所謂線下這個(gè)行業(yè)的這個(gè)點(diǎn),都在起步。
我覺(jué)得很值得一提的是,不止是對(duì)這個(gè)產(chǎn)業(yè)本身,其實(shí)對(duì)整個(gè)人類(lèi)來(lái)說(shuō),包括技術(shù),最大的好處是我們會(huì)獲得很多原本無(wú)法得到的數(shù)據(jù),或者沒(méi)有思考過(guò)的數(shù)據(jù)。其實(shí)攝像頭的出現(xiàn)是一個(gè)很厲害的一件事情,它幫助我們收集了很,以前是我們沒(méi)有打算收集或者是收集不到的東西。
現(xiàn)在隨著攝像頭的普及越來(lái)越多,我們把我們這個(gè)方面的數(shù)據(jù)極大的收集起來(lái)了,所以你會(huì)發(fā)現(xiàn)整個(gè)科技的發(fā)展其實(shí)是一個(gè)數(shù)據(jù)收集能力和數(shù)據(jù)儲(chǔ)存能力的一個(gè)發(fā)展。從數(shù)據(jù)的角度來(lái)看,如果我們邁入新零售的領(lǐng)域來(lái)說(shuō),無(wú)論是便利店,無(wú)論說(shuō)是我們的貨柜,還有我們的終端零售機(jī),你會(huì)發(fā)現(xiàn)不可避免的,一定要加攝像頭。這就意味著又開(kāi)辟一個(gè)新的線下數(shù)據(jù)收集的場(chǎng)所。
包括將來(lái)有一些體驗(yàn)店,我可能會(huì)有一個(gè)智能貨鏡,所有的鏡子可能都會(huì)是攝像頭的一個(gè)概念。所有的這些東西,都將進(jìn)一步來(lái)把我們?nèi)祟?lèi)所能搜集的數(shù)據(jù),擴(kuò)充到一個(gè)新的領(lǐng)域來(lái)。所以,我覺(jué)得這個(gè)商品在重塑新零售,但是新零售其實(shí)反過(guò)來(lái)其實(shí)也在促進(jìn)我們的數(shù)據(jù)搜集和管理體系。
最終我們還是落點(diǎn)于這個(gè)數(shù)據(jù),這個(gè)數(shù)據(jù)里面到底有什么,我能挖掘到什么?這個(gè)東西才是我認(rèn)為新零售最終要解決和解答的一個(gè)問(wèn)題。
這里有一些有Demo。比如紅酒這個(gè)東西就屬于一個(gè)很特別的商品,因?yàn)榫频耐庑味际且粯拥模荒芡ㄟ^(guò)用機(jī)器來(lái)識(shí)別酒瓶的外形來(lái)判斷它是什么酒,所以酒的技術(shù)其實(shí)我們談的更多是酒標(biāo)的識(shí)別。我是怎么在圖片中找到酒標(biāo),然后對(duì)它進(jìn)行分析、索引、搜索。
所以,國(guó)內(nèi)現(xiàn)在幾家比較大的紅酒的廠商都是我們的客戶(hù)。而且紅酒這個(gè)產(chǎn)品典型的是一個(gè)多種技術(shù)綜合的一個(gè)產(chǎn)品,一開(kāi)始我給大家講過(guò)了,我們有搜索、檢測(cè)、識(shí)別,紅酒里面包含了檢測(cè)(檢測(cè)酒標(biāo))、搜索,我找到相同的款式,其實(shí)我還包含了OCR,我通過(guò)OCR識(shí)別,因?yàn)檫@個(gè)酒2005年和2003年其實(shí)是不一樣的酒,哪怕你的牌子是一樣的,也是不一樣的酒。
所以,我們要去識(shí)別里面的年份,來(lái)去做更精細(xì)的識(shí)別,所以它是一個(gè)綜合的一個(gè)東西。所以,看上去好像每一個(gè)東西都不是很大,其實(shí)背后還是積累了很多的技術(shù)。
這是另外一個(gè)電商客戶(hù),他是幫助客戶(hù)去做比價(jià)和去重的,用的也是我們這個(gè)技術(shù),所有的這些相似的圖,都是通過(guò)我們圖像識(shí)別技術(shù)來(lái)完成的。你會(huì)發(fā)現(xiàn)其實(shí)市面上有很多的比價(jià)的產(chǎn)品,但是他們比價(jià)更多的是圖像,比如說(shuō)豆瓣讀書(shū)會(huì)比價(jià)這個(gè)圖書(shū)在各個(gè)電商網(wǎng)站上的價(jià)格。但是,一到小商品,一到衣服的時(shí)候,你發(fā)現(xiàn)你沒(méi)法比價(jià)了,因?yàn)樗切〇|西不一樣,它沒(méi)有型號(hào)的概念。一個(gè)是衣服另外一個(gè)就是批發(fā)市場(chǎng)的小商品,雖然你看批發(fā)市場(chǎng)的小商品,都是5塊錢(qián)、6塊錢(qián)都很便宜有什么可比的,如果是批發(fā)市場(chǎng),你買(mǎi)了一千個(gè)、一萬(wàn)個(gè)的時(shí)候,這個(gè)價(jià)格的成本會(huì)有很大的差距。
所以,我們給很多家的這種B2B的電商,包括服裝電商會(huì)提供這種比價(jià)的這種系統(tǒng)。
下一個(gè)商品落地,真的是到了我們現(xiàn)在所謂的新零售,或者新的銷(xiāo)售體驗(yàn)的一種概念了,訪客購(gòu)物和商品挑選行為的追蹤,這一塊坦率的說(shuō),我現(xiàn)在還沒(méi)有發(fā)現(xiàn)特別真的需求,有很多的客戶(hù)找我們,想做什么呢?就是想做試衣鏡,然后他給試衣鏡里面可能會(huì)放一個(gè)攝像頭,然后去抓拍用戶(hù)都適用哪些衣服,通過(guò)這些衣服來(lái)去判斷,哪些衣服的銷(xiāo)量會(huì)更好,或者大家更感興趣。
但是,有幾個(gè)問(wèn)題,我們?cè)谘芯康倪^(guò)程中,沒(méi)有發(fā)現(xiàn)解決的方案。你想所有的試衣鏡大多數(shù)都在試衣間里面,你能裝攝像頭嗎?不能裝,這個(gè)是有隱私問(wèn)題的。所以,后來(lái)客戶(hù)就來(lái)跟我們的說(shuō),那咱們做鞋吧。鞋倒是可以,但是問(wèn)題一下就把這個(gè)事情就變得很小很小了。
然后其次是什么呢?大部分客戶(hù)的訴求,我就想通過(guò)大家試什么衣服來(lái)判斷,我哪個(gè)衣服的銷(xiāo)量可能會(huì)好,但是其實(shí)我是覺(jué)得,哪個(gè)衣服銷(xiāo)量好和不好的話(huà),你通過(guò)這個(gè)禮拜的數(shù)據(jù)和下個(gè)禮拜的數(shù)據(jù),你能判斷出來(lái),有沒(méi)有必要非得去用這個(gè)人試哪件衣服試的多和試驗(yàn)的少來(lái)判斷。
當(dāng)然,也有一種可能,有一些衣服可能試的很多,但是賣(mài)的很少,有可能會(huì)有這樣的信號(hào),這個(gè)有可能能解決的。這個(gè)信號(hào)意味著什么我不知道,但是有可能會(huì)有這樣的異常信號(hào),也許能幫助客戶(hù)去做一些分析。所以,在這一塊其實(shí)有很多的客戶(hù)來(lái)找我們談這個(gè)事情。
但是,目前來(lái)說(shuō)沒(méi)有特別好的,包括現(xiàn)在市面上有很多做VIP識(shí)別的,我這個(gè)客戶(hù)到店里面來(lái)以后,我的店員肯定不知道他是VIP,除非買(mǎi)東西以后,我說(shuō)您有沒(méi)有卡,卡能打折,他告訴是VIP,但是這個(gè)時(shí)候客戶(hù)已經(jīng)到了最后一個(gè)環(huán)節(jié)了,馬上就要離開(kāi)了。
哪怕之前有什么不爽,服務(wù)沒(méi)到位的情況,都已經(jīng)過(guò)去了,你來(lái)不及補(bǔ)了。所以,他們想做一個(gè)VIP的人臉識(shí)別系統(tǒng),用戶(hù)一進(jìn)來(lái)以后我馬上能夠識(shí)別出來(lái)這是一個(gè)VIP,馬上不同的感受就上來(lái)了。但是,目前來(lái)說(shuō),人臉識(shí)別是這樣的,首先從技術(shù)來(lái)說(shuō),你不能說(shuō)我這個(gè)VIP是單店VIP,肯定是連鎖店才有意義。
但是,連鎖店你這個(gè)人臉一旦到幾萬(wàn)這個(gè)級(jí)別,現(xiàn)在還沒(méi)有好的精準(zhǔn)匹配,你要說(shuō)搜索,我可能給你搜出來(lái)20個(gè)人很像這個(gè)人,這個(gè)是可以,但是這個(gè)不能解決你VIP的問(wèn)題。
你要的是精準(zhǔn)匹配,什么叫精準(zhǔn)匹配?是不是這個(gè)人。一定要給我一個(gè)準(zhǔn)確答案,但是現(xiàn)在這個(gè)可以坦率跟大家說(shuō),人臉這一塊,如果在普通攝像頭的條件下,到了幾萬(wàn)這個(gè)級(jí)別的話(huà),很難說(shuō)能達(dá)到這么一個(gè)精準(zhǔn)度。所以,你會(huì)發(fā)現(xiàn),警察他們不會(huì)說(shuō)你一個(gè)囚犯的照片,他馬上告訴你這個(gè)人是誰(shuí),其實(shí)他也是給出幾千個(gè)個(gè),為了防止有落網(wǎng),他和警察會(huì)二次篩查。
所以,這就是海量出片的人臉?biāo)阉骱腿四樉珳?zhǔn)匹配的一個(gè)差距。
然后再就是人、貨、場(chǎng)價(jià)值挖掘,這個(gè)商品的定向推薦,本質(zhì)上就是這個(gè)商品推薦。但是,我是覺(jué)得是這樣,這個(gè)事兒只靠商品識(shí)別是解決不了的,它一定你還要具備很強(qiáng)的人臉識(shí)別能力。因?yàn)椋阃扑]一定是既有商品又有人,而且還有地點(diǎn)和時(shí)間。
你不能說(shuō),我夏天的時(shí)候推你冬天的東西,或者說(shuō)這個(gè)人前兩天買(mǎi)了一個(gè)東西,今天他再來(lái)了,我再推薦他這個(gè)東西,這個(gè)是一個(gè)很大的題目。現(xiàn)在的話(huà)可能沒(méi)有一個(gè)很好的方案把這個(gè)方方面面到底是什么樣子能說(shuō)清楚,我們只能說(shuō)是在很多很具體的事情上一個(gè)個(gè)去解決。
而且這個(gè)一定不是一個(gè)公司兩個(gè)公司能做的,這個(gè)事情一定多個(gè)公司,最終還有集成公司大家一起合力去做這個(gè)事兒,才會(huì)把這個(gè)事兒做成的。
所以,這一塊因?yàn)槲覀兇_實(shí)沒(méi)有一個(gè)很好的去給大家講解,無(wú)論是成功的還是失敗的。所以,這一塊我也只能先暫時(shí)跳過(guò),關(guān)于這個(gè)商品,尤其是線下的商品我怎么去做定向推薦。但是,有一個(gè)很好玩兒的事情,大家可能都聽(tīng)說(shuō)過(guò)友寶,是一個(gè)自助售貨機(jī),主要是飲料類(lèi)的。你如果看他們的財(cái)報(bào)的話(huà),他們2016年的時(shí)候,他們通過(guò)靠飲料的售賣(mài)的營(yíng)收占他們總營(yíng)收的94%以上。
但是,到今年的時(shí)候,他們商品售賣(mài)的總營(yíng)收只是到了70%,剩下的20%是什么呢?是他們這一塊屏的廣告。所以,這也是我剛剛說(shuō)的一點(diǎn),有的時(shí)候新零售這個(gè)事兒是聽(tīng)坑爹的,你光賣(mài)這個(gè)商品,因?yàn)檫@個(gè)范圍太小了,其實(shí)像友寶這個(gè),全中國(guó)鋪了7萬(wàn)臺(tái)柜子的,他也很難去營(yíng)利,他最后要運(yùn)用廣告帶營(yíng)。
當(dāng)然,這個(gè)也是一個(gè)方面,你這個(gè)友寶上面掛一個(gè)屏幕去做更多的推薦和廣告,目前來(lái)看至少它在這一塊的營(yíng)利會(huì)逐漸的增多,包括線下的話(huà),我相信你無(wú)論是做無(wú)人貨柜、無(wú)人便利店還有友寶這種售賣(mài)機(jī)的也好,最終怎么去把廣告植入?怎么去推薦客戶(hù)不同的廣告,可能是一個(gè)真正可以賺到錢(qián)的點(diǎn)。
這個(gè)就是無(wú)人結(jié)帳,其實(shí)Amazongo已經(jīng)實(shí)現(xiàn)得很好了,雖然我沒(méi)有去,但是我們的CTO(美國(guó)人)在回國(guó)時(shí)候他去試了試,他覺(jué)得效果很好。但是,現(xiàn)在最大的問(wèn)題是成本問(wèn)題,Amazongo一個(gè)單店需要幾百萬(wàn)的美金,你會(huì)發(fā)現(xiàn)整個(gè)屋子里各個(gè)地方都是攝像頭,這個(gè)貨架上有很多很多的攝像頭,除了攝像頭進(jìn)場(chǎng)通信、RFID這些東西也都有。
所以,這個(gè)東西現(xiàn)在至少只有Amazon這種級(jí)別做一個(gè)體驗(yàn)店可以,現(xiàn)在真正想鋪開(kāi)了去做很難很難。主要還是受限于技術(shù)的瓶頸,包括我知道,我們有一些合作伙伴之前都想做無(wú)人便利店也來(lái)找過(guò)我們,我們也聊過(guò),后面我們一個(gè)判斷是,這個(gè)事情上還不是特別的成熟,他們也不太信,他們也找了別家去做。之前找過(guò)我們的兩家他們現(xiàn)在沒(méi)有了。
他們最后的一個(gè)反思,就是覺(jué)得自己步子邁得太大了,以為這個(gè)事兒我技術(shù)方面做到了就能解決,其實(shí)這是一個(gè)系統(tǒng)工程,這個(gè)技術(shù)單方面是解決不了的,一個(gè)是多方面的技術(shù),以及還有一些其它的Trick,包括運(yùn)營(yíng),一起解決,但是太復(fù)雜了。
他們想做無(wú)人便利店就是因?yàn)橛X(jué)得這個(gè)成本相對(duì)于真的便利店或者大商超成本會(huì)低一點(diǎn)。但是,實(shí)際上進(jìn)來(lái)以后,發(fā)現(xiàn)無(wú)論是從技術(shù)角度、管理角度、系統(tǒng)應(yīng)用角度來(lái)說(shuō),其實(shí)成本一點(diǎn)都不小。而且,貨損率也很高,所以最后這個(gè)事兒就沒(méi)做起來(lái)。
所以,目前我的一個(gè)判斷是,無(wú)人便利店可能步子邁的比較大,就是說(shuō)無(wú)人貨柜或者說(shuō)友寶這樣的機(jī)械要是想降成本是完全有可能做到的。現(xiàn)在一臺(tái)友寶的機(jī)器,大概是2.7萬(wàn)(簡(jiǎn)單一點(diǎn)的),稍微貴一點(diǎn)的是3萬(wàn),他們現(xiàn)在也在出那種便利架,就是把熟食放進(jìn)去。
那個(gè)柜子稍微格多一點(diǎn)大概是7萬(wàn)塊錢(qián),其實(shí)成本還是蠻高的,因?yàn)樗且粋€(gè)全封閉的系統(tǒng),它是靠機(jī)器跟這些設(shè)備來(lái)控制你選擇了什么,然后出貨這些東西。所以,這個(gè)成本很快高。
但是,如果用了圖像識(shí)別的話(huà),我相信至少2.7萬(wàn)的柜子能降到1萬(wàn)以下是完全有可能的。
便利店的最大問(wèn)題是什么呢?
店面和人員的運(yùn)營(yíng)費(fèi)用太高了,現(xiàn)在人的工資不斷在漲,然后店面的費(fèi)用也在漲。所以,為什么現(xiàn)在很多人去搞柜子,各種各樣的柜子或者是什么東西,就是因?yàn)檫@個(gè)柜子占地很小,尤其是當(dāng)你放你辦公室了以后,這個(gè)地方實(shí)際上是不收錢(qián)的,是白給你的。
無(wú)人貨柜的好處是什么呢?你只要補(bǔ)貨,你補(bǔ)貨一個(gè)真可以負(fù)責(zé)一個(gè)區(qū)域,所以確實(shí)成本會(huì)更低一點(diǎn),但是他的問(wèn)題是什么呢?你會(huì)發(fā)現(xiàn)現(xiàn)在所有的無(wú)人貨柜、便利店都賣(mài)的是飲料、泡面這種成型的商品,他的毛利太低了,就幾毛錢(qián)。
你像友寶他一臺(tái)柜子一個(gè)月平均來(lái)說(shuō),可能800塊錢(qián)的毛利。然后流水就要達(dá)到5000塊錢(qián),才有這個(gè)價(jià)格。其實(shí)毛利太低了,這個(gè)意味著什么呢?低的可能有一些成本可能也比較Hold住,然后貨損的成本你肯定Hold不住。你貨損如果像無(wú)人貨柜那么高,30%的貨損率你肯定是賠。所以,他的痛點(diǎn)是什么呢?
第一,怎么降低貨損。
第二,能不能賣(mài)熟食,就是高附加性的這種商品。
這兩個(gè)問(wèn)題如果他能解決的話(huà),其實(shí)我們覺(jué)得無(wú)人貨柜這種新奇可能還是可以跟便利店可以PK的,畢竟的話(huà),可以看到在日本,這是全民都比較認(rèn)可的東西。全日本40多萬(wàn)的這種機(jī)器到處都是,在中國(guó)還達(dá)不到這個(gè)量。
我估計(jì)現(xiàn)在一年10萬(wàn)都是撐死了,可能還得死好多。其實(shí)我覺(jué)得還是有很大的發(fā)展的。但是,要解決兩個(gè)事情:
第一,你怎么去賣(mài)那些毛利高的東西?
第二,你怎么降低貨損?
這個(gè)我覺(jué)得人工智能、圖像識(shí)別都是有希望能解決的。
然后就是貨架管理,這個(gè)東西也是有人找我們做,后面我們沒(méi)有做。因?yàn)槭忻嫔嫌袔准易龅眠€確實(shí)不錯(cuò)的,它相當(dāng)于是補(bǔ)完貨以后我拍一個(gè)照片……尤其是很多的加盟店補(bǔ)貨完了以后都是第三方去補(bǔ)貨,第三方補(bǔ)貨可能不負(fù)責(zé)任,可能有一些東西沒(méi)補(bǔ),或者是補(bǔ)的地方不對(duì),可能是需要拍一個(gè)照,然后傳到總部上,總部一確認(rèn)這個(gè)貨沒(méi)補(bǔ)對(duì),對(duì)這個(gè)員工可能會(huì)有一些懲罰機(jī)制,就大概是這么一個(gè)概念。
這個(gè)其實(shí)圖像視覺(jué)應(yīng)該能解決的還不錯(cuò)。但是問(wèn)題是,基本解決的是第一層,可想而知后面的幾層是解決不了的。
最后一個(gè),這個(gè)東西大家可能接觸少一點(diǎn),完全是一個(gè)設(shè)計(jì)師群體的東西了,但是我們?cè)谶@里因?yàn)橛幸恍┖玫暮献骰锇椋_實(shí)也做了一些事情。比如說(shuō)我們當(dāng)時(shí)跟紡織信息中心,一個(gè)中國(guó)比較大的這樣一個(gè)時(shí)尚趨勢(shì)分析的一個(gè)機(jī)構(gòu),去分析每年到底現(xiàn)在有什么東西在流行。
這個(gè)產(chǎn)品已經(jīng)落地了。現(xiàn)在紡織信息中心或者很多其它的時(shí)尚機(jī)構(gòu),包括制衣的廠商像Zara都有這樣的團(tuán)隊(duì),每年都有幾十個(gè)人滿(mǎn)世界各地飛,去各種秀場(chǎng)采風(fēng)。采風(fēng)回來(lái)以后拍很多的照片,然后再有一批人去分析,分析什么呢?分析顏色、分析新款趨勢(shì),很多很多人在做這個(gè)事情,這也是一個(gè)很大的市場(chǎng)。
以前都是人去做,現(xiàn)在我們想想機(jī)器完全可以做到,為什么不讓機(jī)器做呢?
這個(gè)是一個(gè)已經(jīng)落地的產(chǎn)品,也是給剛才我說(shuō)的,這種形式的客戶(hù)去用,然后我們歸去各大秀場(chǎng)、街拍,不但是高大上的也有接地氣的,所有地方去抓圖,抓圖以后所有的色彩,包括裙裝的比例,然后這個(gè)圖案,什么格紋、人紋、波點(diǎn),各種各樣的圖案、設(shè)計(jì)元素,什么中短流蘇袖口,這些東西全都是機(jī)器分析出來(lái)的,因?yàn)樗且豢畲髷?shù)據(jù)的BI產(chǎn)品,所以好多事兒我不在乎于一張圖我分析的對(duì)不對(duì),我主要看的是大部分圖是不是都分析對(duì)了?因?yàn)槲铱吹氖勤厔?shì)。
所以,這個(gè)現(xiàn)在已經(jīng)是一款比較落地的一個(gè)產(chǎn)品了。
最后再談一下未來(lái),未來(lái)的話(huà),還是我剛才說(shuō)的這個(gè)事情,沒(méi)有我們想象的那么樂(lè)觀。比如說(shuō)去年大家火無(wú)人貨柜,就覺(jué)得無(wú)人貨柜已經(jīng)就起來(lái)了,然后新零售現(xiàn)在持續(xù)在火,但是我是覺(jué)得技術(shù)還是在培育,未來(lái)是這個(gè)樣子,但是現(xiàn)在還有很多要克服的坎兒。
然后除了消費(fèi)領(lǐng)域是這樣的一個(gè)情況以外,我們也覺(jué)得,就是像我剛才說(shuō)的,你往上游走,去解決一些更本質(zhì)的問(wèn)題,尤其是采集這個(gè)問(wèn)題,以及一些質(zhì)量問(wèn)題,可能對(duì)這個(gè)行業(yè)鏈,可能有更大的意義,包括我們自己的營(yíng)收可能也會(huì)更好。再有就是很多的標(biāo)準(zhǔn)包括監(jiān)管,跟政府去結(jié)合,毫無(wú)疑問(wèn),就是你會(huì)發(fā)現(xiàn)推很多的標(biāo)準(zhǔn)只有政府能推下去,你是自己沒(méi)法去做這個(gè)事情的。
包括我們跟紡織信息中心也是一樣,為什么跟他們合作呢?因?yàn)樗麄冏约簳?huì)有持牌體系,就像剛才我說(shuō)的,NCS,但是其實(shí)中國(guó)有一個(gè)CNCS,就是所有紡織廠商,包括制衣廠商他都要遵從CNCS,這就是紡織信息中心做的一個(gè)標(biāo)準(zhǔn),大概就是這樣的一個(gè)想法。