確實,現在做人工智能方向的工程師,有不少被稱為“調參俠”,但也并不全是。
以我自己為例,我做cv方向(計算機視覺)的,調參在我日常工作中占的比例并不大。
在CV這塊,除了超參數外,影響模型效果的主要還是要
回歸正題!
調參俠,到底調什么參?
在人工智能里面,參數大致可分為2大類:
參數(parameters)/模型參數:由模型通過學習得到的變量,比如權重w和偏置b,這個多半是不能調節的,它是由神經網絡自己學習出來的。
超參數:在機器學習中,超參數是在
神經網絡訓練之前設置值的參數, 而不是通過訓練得到的參數數據。常見的有學習率、迭代次數、隱藏層的層數、每層神經元的個數等。通常情況下,需要對超參數進行優化,給學習機選擇一組最優超參數,以提高學習的性能和效果。這一般是根據經驗進行設定,影響到權重w和偏置b大小的數值。
為什么會被稱為“調參俠”?
主要原因有以下2個:
多半是剛入門的算法工程師做的事情,他們不是很懂神經網絡的結構、數據分布等等,只能通過調整超參數,以期望獲得較好的結果,這樣有時候是可行的;
更重要的原因是,GitHub上開源了很多模型,并附上了預訓練參數,如常用的檢測、分割、分類等等,這些
模型都非常成熟,大部分直接調用就可以,然后根據自己的訓練數據,稍加修改,就可以得到非常好的結果。公司只要結果,不要求創新,開源項目已經可以做到這點了,所以大多數只要 調參即可。
怎么避免成為“調參俠”
目前AI人才競爭越來越激烈,“調參俠”的時代已慢慢過去,這些事情其實根本不需要AI工程師來做,未來的研發工程師就可以承擔這些了!幾年前如果熟練使用TensorFlow,同時掌握基本的AI算法就可以很容易找到一份高薪的工作,但現在不一樣了,AI崗位的要求越來越高,對知識的深度也提出了更高的要求。
對于真正的人工智能工程師而言,他們往往是