阿里巴巴也發布了AI芯片?
作為一個芯片和AI行業從業者,首先,這確實是一件可喜可賀的事,但是,要辯證的看這個問題。
AI的興起是隨著Google的alpha GO通過圍棋大戰戰勝了李世石,名聲大噪,讓人們看到了人工智能達到人類認知能力的可能,但這僅僅是一種可能性。
AI的實現有三個重要的組成方面,
一、算法
深度學習算法是這一輪AI興起的主要推動力。通過神經網絡實現多層邏輯分析,從而達到類似人類思考的一種實現方法。簡單來說,就是讓機器通過大量的數據進行總結,得出規律,達到認知的目的和效果。目前這類算法已經很成熟來,乃至GitHub上很多開源的算法都達到了半商業化的水平。國內外做得比較好的算法公司從Google、amazon、商湯、曠視等的鳳毛麟角到現在的百家爭鳴,由于得到了政府和資本方的支持,發展確實都很好。
二、數據
數據是支撐深度學習算法準確率的必要條件。從前機器學習算法也可以通過數據學習對圖形圖像等內容進行分析,從而在第一次識別后對某個物體進行識別,但是請注意,這里用的是“某個物體”而不是某類物體,也就是并不具有分析推理的能力。深度學習算法結合海量數據以后,就具備了總結的能力,同時,算法學習過的數據類型越多,識別準確率也就越高,最近十年以來,由于互聯網的高速發展,積累的大量的數據,也側面推動了AI的到來,alpha go的算法就是通過一百多萬盤棋局進行深度學習,才實現了現在的能力。
三、算力
第一代alpha go的實現使用了大量的GPU來實現深度學習算法。英偉達公司生產GPU原本是對圖形圖像進行處理的運算單元,因為這類運算都是簡單但是海量的并行運算,所以非常適合深度學習算法。通過使用并行運算的GPU替代穿行運算的CPU實現深度學習算法,大大的提高了算法訓練以及實現的效率,才讓AI算法的快速實現成為了可能。(由于CPU和GPU的區別需要篇幅較大,此處做簡單類比:CPU類似于一個博士生,可以進行非常復雜的運算,但是他每次只能進行一種類型的運算,而GPU類似于成百上千哥小學生,每次可以進行很多個簡單的加減乘除,這種方式大大的提高了深度學習算法的運算效率)。
這樣就到了題主關心的這個問題,華為、阿里所發布的芯片就是此處所寫的算力芯片。其實算力芯片的概念也挺大的,CPU\GPU\FPGA\ASIC等都屬于算力芯片,但是從對于AI運算市場目前的主流來看,就是GPU\FPGA和ASIC。我們來看下這三種芯片簡單的區別,然后再來看華為和阿里發布的這兩顆芯片。
1、GPU
上文提到了GPU本來是圖像處理運算單元,現在被廣泛應用于AI領域,也是目前最為好用的AI芯片。但本質上GPU是一類通用芯片,他可以用來做顯卡、挖礦等應用于很多領域,也就是說GPU并非專用于AI的一類芯片。同時,經過多年的積累,GPU的大部分專利技術集中在Nvidia和AMD手里,國內想要通過這種技術實現AI算力芯片難度很大。
2、FPGA
FPGA是可編程邏輯門電路的縮寫,本質上是一種通用芯片。學弱電的同學應該都學過這類芯片,主流廠家就是Xlink、摩托羅拉、Intel、IBM等。FPGA使用單獨的編程語言VHDL,實現起來比高級語言C/JAVA等復雜得多,可能實現某一行C語言的功能需要上百行甚至上千行的VHDL語言,所以對于本來就很復雜的深度學習算法,使用FPGA作為AI芯片的廠家并不多。但FPGA也有一個優點,就是通用性,對于創業公司可以省去芯片流片的很多資金,像國內做得比較好的深鑒公司就是使用FPGA實現了一顆AI芯片的大部分功能,不過比較可惜的是,深鑒目前已經被Intel收購,成為了一家外企。
3、ASIC
ASIC是專用集成電路。簡單說就是這種芯片只能實現固定的功能,固化后就無法更改。這種芯片的優點是集成度非常高,性能可以充分發揮、功耗可以得到很好的控制。但同時,缺點也顯而易見,就是前期單顆芯片的成本很高,如果沒有很大的出貨量,很難平攤成本。所以,創業公司想作出AI芯片其實很難,因為融資之后一旦出現一點偏差,就很可能出現資金鏈斷裂,此處不再展開。目前,7nm的ASIC工藝制成已經得到了廣泛應用,手機CPU芯片、挖礦機芯片等領域早在去年就有了很大突破,今年各大廠商已經在突破5nm甚至3nm的芯片,從而可以在性能和功耗上有進一步的提升。
題目中說到華為升騰系列和阿里的含光系列都屬于ASIC芯片。其實國內也不僅僅華為和阿里做了AI芯片,像網絡上流行一種說法叫“AI芯片四杰”,就包含了寒武紀、比特大陸、地平線和云天勵飛。一顆芯片的發布到可用其實是一個漫長的過程。阿里的芯片不對外出售,我們無法具體分析,拿華為的升騰310來說,從發布到如今已經過了大半年時間,其實落地的項目也寥寥無幾,這主要又是由于芯片設計初衷和工具鏈易用性的問題。其實從歷史上看,一家公司發布的第一款芯片,往往都是試驗品,像華為麒麟的第一代產品,現在我還能想起使用華為P6的痛苦回憶。知道華為P8的麒麟935才到了真正日常使用的程度,而從P6到P8已經經歷了3年的時間。工具鏈也一樣,工程師的設計理論和真實用戶的使用習慣肯定是有區別的,而把算法從常用的GPU移植到ASIC芯片又是比較復雜的過程,同時客戶眾多,芯片廠家對客戶的支持力度也很難達到細致入微。
所以從0到1和從1到∞是個很漫長的過程,有大企業帶頭開創國產及自主可控路線固然是好事,但大家也不要過于樂觀了,因為這確實是一個很漫長的過程,AI是一個很復雜的學科,芯片的復雜度也不必說,所以我們雙面看到,共同努力,為祖國實現彎道超車加油,也給企業們一點時間。