欧美一区二区三区,国内熟女精品熟女A片视频小说,日本av网,小鲜肉男男GAY做受XXX网站

請問大神現在數據標注有前景嗎?能不能詳細介紹一下有幾個平臺?

阮建安2年前13瀏覽0評論

數據標注為通過分類、畫框、標注、注釋等,對圖片、語音、文本等數據進行處理,標記對象的特征,以作為機器學習基礎素材的過程。中國數據標注行業參與企業類型按參與模式主要分為眾包和自建工廠兩種模式,其中,眾包模式主要包括百度眾包、京東眾智、龍貓數據等;工廠模式主要包括貝賽、云測、愛數智慧、海天瑞聲、阿里數據標注、元坤智能數據、點我科技等。

頭部企業為自建數據團隊,中小數據供應商占比較大

目前,我國國內數據標注市場第一梯隊包括頭部公司組建自己的數據標注部門,京東(京東眾智)、百度(百度眾測)、騰訊、阿里(阿里數據標注)都已經擁有自己的標注平臺和工具。頭部公司之外,國內近年興起眾多數據標注公司,如龍貓數據、Testin云測、倍賽BasicFinder、數據堂等。這些公司僅次于頭部公司,都具有相當的規模,位于第二梯隊。

在中國數據標注行業參與主體中,按規模劃分,品牌數據服務商、中小數據供應商和需求方自建基礎數據團隊構成市場競爭關系,為AI數據標注市場的主要供應方,在2019年AI數據標注市場份額占比分別為30.4%、47.0%和22.6%,目前中小數據供應商是市場中的主要供應力量。

按模式分為數據標注公司和眾包平臺,服務領域廣泛

中國數據標注行業參與企業類型按參與模式主要分為眾包平臺和自建工廠(專業數據標注公司)兩種模式。2020年數據標注公司排行榜中,Testin云測、數據堂、龍貓數據位居前三;數據標注眾包平臺排行榜中,京東眾智、百度眾測、數據堂位居前三。

從數據標注代表企業業務布局來看,大部分數據標注服務商提供文本、語音、圖像、視頻等各類型數據標注,服務應用領域涵蓋安防、智能駕駛、醫療、教育、金融等多個領域,主要客戶包括科技公司、人工智能企業、傳統企業、政府部門、科研機構等。

業務偏重視覺類的企業多擁有自建標注基地,多分布在山西、河南等地

AI數據標注業內玩家按照業務方向和進入市場的時機可做粗略劃分,包括早期進入玩家、中晚期進入玩家、偏重視覺類業務玩家、偏重語音類業務玩家等。其中,業務更偏重語音類數據的玩家,通常擁有較多的自有知識產權數據集;擁有自建標注基地或全職標注團隊的則多為偏重視覺類的玩家。

作為人工智能產業鏈中必不可少的一環,發展AI數據標注服務成為了各地方推進AI建設的重要方向之一,貴州、山西、重慶等地相繼出臺指導意見,引入科技公司,共建數據基地、數據交易中心,打造具有地方特色的人工智能產業園。

目前,眾多數據標注公司自建標注基地或團隊,如百度的“百度山西的AI數據標注基地”、“百度大數據百鳥河基地”,數據堂的“數據堂保定數據加工基地”、“數據堂合肥數據基地”、“數據堂北京TTS錄音中心”等,多分布在山西、河南等地。

北京、上海、成都為需求企業分布前三地區,杭州數量下滑

從需求企業來看,根據AI數據標注猿統計數據顯示,2020年4月,國內數據標注業務相關公司數量為565家,2020年12月,數量增長至705家。從數據標注需求企業地區分布情況來看,截至2020年12月,北京、上海、成都、深圳、杭州為數據標注企業分布TOP5城市,企業數量分別達到185家、84家、68家、63家、46家;其中北京、上海、成都、深圳企業數量均較2020年4月有所上升,杭州企業數量較2020年4月有所下降。

市場集中度較低,未來將有所提升,行業并購成為趨勢

2019年,AI數據標注行業CR5(前五大企業市場份額)為26.2%,處于低集中競爭階段,行業活力充足,發展空間良好。前五大企業中,海天瑞聲與百度數據眾包越眾而出,據了解,國內整體供應方中,以提供圖像類數據采標服務的公司居多,內容涉及人像數據、OCR數據、自動駕駛數據等,業務需求較為分散,其中以百度數據眾包營收份額占比最大。

相比而言,語音類數據需求較為集中,且供應門檻高于圖像類數據,內容包含語音識別數據、語音合成數據等,其中以海天瑞聲營收份額占比最大。

目前人工智能數據標注行業集中度較為適中,既非寡占型市場也非充分競爭市場,這一方面是由于百度數據眾包、海天瑞聲、數據堂等企業進入市場較早,積累了較多客戶資源,另一方面則是由于下游企業之前多采用公開數據集訓練模型,對數據的高精度要求由來尚短,受生態傳導效應滯后影響,市場門檻還不顯著,資金與研發實力較為薄弱的中小企業還有較強的發展土壤。

然而未來,隨著下游企業發展壯大,直接使用外包團隊成本低廉、數據安全可控性強,一些基礎性需求將由下游企業自給自足,外部的數據服務商現有的存量市場面臨下降,因此必須承擔高難度、前沿獨特性任務,這就要求其自身投入高精度、專業化數據處理工具的研發和人工智能算法基礎研究,以把握客戶需求,開拓增量市場,因此資金與研發實力成為較高行業門檻,同時受近年資本市場冷卻影響,一批中小型廠商面臨業務收縮,再者部分廠商如倍賽開始在業內并購,參考海外數據服務市場發展情況(海外行業巨頭Appen多次并購其他企業),并購也將成為市場趨勢,多種因素疊加影響下,行業集中度將提升。

綜上,未來數據標注行業兼并與重組將成為大勢所趨。目前,國內較為典型的并購事件為倍賽BasicFinder收購專業的人工標注服務商薈萃,以此豐富自主數據采集系統,從而完成更具多樣性的任務。全球數據標注行業兼并重組步伐加快。

一方面頭部企業逐漸收購中小微數據平臺,將自己的議價能力提高到新的水平,在此背景下,全球數據標注行業市場集中度進一步提升。數據標注行業的并購重組規模將持續增長,行業的競爭將愈發激烈。

——更多數據來請參考前瞻產業研究院《中國數據標注行業市場前瞻與投資戰略規劃分析報告》