團隊如何接數據標注任務?
謝@霍華德邀我目前在車廠無人駕駛部門的職責之一便是研發無人駕駛感知算法的數據集的半自動標注算法再具體一點計算機視覺領域的: 語義分割(Semantic Segmentation) 和 全景分割 (Panoptic Segmentation)https://arxiv.org/pdf/1801.00868.pdf它們或許是數據標注領域成本最高的倆個任務(德國高達100人民幣/圖)它們的具體定義可以見上圖一、標注任務語義分割: 對圖片中每一個像素標注其類別(如:汽車、行人、道路等)全景分割:對于每一個像素,在語義分割的基礎上再區分目標instance物體(如:汽車1、汽車2、行人5等)二、標注格式通常標注結果還是存成圖片的常見格式(如: png)圖片的每一個通道存儲不同信息(用數字1-255表示)例如第一通道存儲: 該像素所屬類別第二通道:如果該像素屬于目標物體,他屬于第幾個instance第三通道:通常是0或1,1表示該像素是可以駕駛的區域,0反之三、開源數據集Cityscapes(戴姆勒公司、德國馬普所、TU Darmstadt): https://www.cityscapes-dataset.com/Mapillary Vistas (豐田、Lytf等贊助):https://www.mapillary.com/dataset/vistas?pKey=0_xJqX3-c-KyTb90oG_8HQKitti Dataset (德國KIT和豐田芝加哥研究所): http://www.cvlibs.net/datasets/kitti/eval_scene_flow.php等等可以看到背后都有財團的支持四、數據集的成本和作用成本:據Cityscapes官方,標注一張該數據集中的語義分割平均需要1.5小時!!!德國最低工資是9歐元左右/小時因此在德國標注一張語義分割圖片的成本超過13歐元(約合100塊人民幣)?。≈匾裕荷疃葘W習需要大量精細標注的數據作為“燃料”保守L3要能夠上路需要至少幾百萬張標注精細的訓練圖片人工智能時代,誰擁有數據誰就擁有源源不斷的燃料數據集也成為無人駕駛公司和主機廠的兵家必爭之地五、用優化算法節約標注成本手動標注一張語義分割像素級別的圖片平均需要1.5小時有沒有什么更智能的辦法提高標注效率呢?專注于優化算法的@運籌OR帷幄 以下略探12:1. ScribbleSup: Scribble-Supervised Convolutional Networks for ...2. Weakly-and Semi-Supervised Panoptic Segmentation3. Fast Interactive Object Annotation With Curve-GCN其中paper 1和2是用涂鴉和畫方框的方式與圖片交互Paper 3是用描物體邊界的方式標注軟件的一般流程是:標注者輸入交互信息-算法自動標注-標注者修改-算法標注直到標注者滿意為止Paper 1和2還report了只進行一次交互(標注時間為幾十秒)圖像分割優化算法結合深度學習CNN便可以達到相較于精細標注95%的精度We obtain state-of-the-art results on Pascal VOC, for both full and weak supervision (which achieves about 95% of fullysupervised performance).注:以上研究方向關鍵詞weakly and semi-supervised learning六、結語數據標注是如今深度學習獲得巨大成功的基石從Feifei Li創建ImageNet(1千多萬張、2萬多類別圖片)開始數據集便成為計算機視覺的一個熱點話題而伴隨著數據集的各種challenge和刷榜單也成為CV領域發頂會的標配希望“無償”使用公開數據集的研究者和業界從業者都能尊重數據集創作者的汗水人工智能的從業者也能認可那些幕后做著重復枯燥標記工作者的付出(例如:貴陽數據標記村)最后,無人駕駛、計算機視覺、人工智能的學生|研發者歡迎加入 @運籌OR帷幄 公眾號后臺的學術|研發群交流~