COCO是一個圖像識別的數據集,其中包含許多圖像以及它們的bbox信息。其中bbox信息是以JSON格式存儲的,可以用于訓練物體檢測模型。
"annotations": [{ "area": 537.974, "bbox": [190.66, 181.5, 19.34, 27.06], "category_id": 18, "id": 295193, "image_id": 558840, "iscrowd": 0, "segmentation": [ [190.66, 181.5, 190.66, 208.56, 210, 208.56, 210, 181.5] ] }]
上面的JSON代碼是一個bbox的例子。其中,"bbox"數組代表了該物體被框住的矩形。數組中前兩個元素代表該矩形左上角的坐標,后兩個元素代表該矩形的寬和高。
如果我們使用Python讀取這個JSON文件:
with open('coco_bbox.json', 'r') as f: data = json.load(f) # 打印第一個bbox的信息 print(data['annotations'][0]['bbox'])
我們可以得到如下結果:
[190.66, 181.5, 19.34, 27.06]
這就是該bbox的左上角坐標、寬和高。我們可以利用這些信息來訓練圖像識別模型,實現物體檢測功能。