談及AI時(shí)常聽(tīng)到的「神經(jīng)網(wǎng)絡(luò)」和「深度學(xué)習(xí)」到底是什么意思?
神經(jīng)網(wǎng)絡(luò)神經(jīng)網(wǎng)絡(luò)是一個(gè)模型。
這個(gè)模型可能是參照了人的神經(jīng)細(xì)胞和網(wǎng)絡(luò)的構(gòu)造,也可以理解成有一堆算法的表現(xiàn)形式剛好和神經(jīng)網(wǎng)絡(luò)有些像,然后被形容成神經(jīng)網(wǎng)絡(luò),形象,高大上。
這個(gè)模型是什么?解決這個(gè)問(wèn)題最好的途徑是回顧歷史,找它的起源。
感知器:(英語(yǔ):Perceptron)是Frank Rosenblatt在1957年就職于Cornell航空實(shí)驗(yàn)室(Cornell Aeronautical Laboratory)時(shí)所發(fā)明的一種人工神經(jīng)網(wǎng)絡(luò)。它可以被視為一種最簡(jiǎn)單形式的前饋神經(jīng)網(wǎng)絡(luò),是一種二元線性分類器。上邊是對(duì)于感知器的解釋,感知器可以看成是最早的神經(jīng)網(wǎng)絡(luò)。感知器同樣有著一個(gè)高大上的名詞,不過(guò)其本身是一個(gè)線性分類器。
線性分類器還是可以理解成一個(gè)“模型”。
通過(guò)這個(gè)模型和一些算法可以將一堆數(shù)值轉(zhuǎn)化成兩個(gè)數(shù)值,或者一個(gè)概率,舉個(gè)粗糙的例子:
人是否有好心情和很多因素相關(guān),比如:得到關(guān)愛(ài)、關(guān)愛(ài)了別人、遇到喜歡的人、賺錢了、天氣不錯(cuò)、終于下班了,等等。這些因素可以看成很多數(shù)值,但心情好不好只有兩個(gè),心情好和不好。借助感知器這個(gè)模型,可以推測(cè)人的心情。
感知器可以解決一些實(shí)際的問(wèn)題。不過(guò),有局限性,有局限性就需要解決。
多層感知器(Multilayer Perceptron,縮寫MLP)是一種前向結(jié)構(gòu)的人工神經(jīng)網(wǎng)絡(luò),映射一組輸入向量到一組輸出向量。MLP可以被看作是一個(gè)有向圖,由多個(gè)的節(jié)點(diǎn)層所組成,每一層都全連接到下一層。除了輸入節(jié)點(diǎn),每個(gè)節(jié)點(diǎn)都是一個(gè)帶有非線性激活函數(shù)的神經(jīng)元(或稱處理單元)。后來(lái),有人提出了多層感知器,解決了之前感知器的一些不足,更加強(qiáng)大了。
多層感知器可以看成是感知器的增強(qiáng),由于更加復(fù)雜,步驟更多,和神經(jīng)網(wǎng)絡(luò)的網(wǎng)絡(luò)更像一些。之前的單個(gè)感知器更像是神經(jīng)單元。
多層感知器的提出是在1980年左右,其發(fā)展并不順利,到后來(lái)隨著算法的進(jìn)步,特別是反向算法的提出;計(jì)算能力的提升;GPU的使用;數(shù)據(jù)的增多,類似于多層感知器,和神經(jīng)網(wǎng)絡(luò)有些像的模型在機(jī)器學(xué)習(xí)當(dāng)中才有了更好的表現(xiàn)。
這些模型流行的同時(shí),其對(duì)外的表現(xiàn)形式也越發(fā)高大上,比如上圖的樣子。
神經(jīng)網(wǎng)絡(luò)現(xiàn)在給外界的感覺(jué)已經(jīng)不是之前的分類器,而是更加注重流程,淡化了中間的細(xì)節(jié)。
更像一個(gè)模型。
深度學(xué)習(xí)從字面來(lái)看,深度學(xué)習(xí)是深度的機(jī)器學(xué)習(xí),這里的深度或許可以這樣來(lái)看:
計(jì)算更加復(fù)雜,計(jì)算更加深入,結(jié)果更好,就像經(jīng)過(guò)深度思考一樣。意思是深度學(xué)習(xí)算法比傳統(tǒng)機(jī)器學(xué)習(xí)算法厲害。。。。。。
神經(jīng)網(wǎng)絡(luò)中的層數(shù)多,可以粗略的看成更深。。。。。。
這里更喜歡這個(gè)關(guān)于深度學(xué)習(xí)的由來(lái):
由于多層感知器曾經(jīng)有一段時(shí)間表現(xiàn)并不好,甚至有些負(fù)面,近些年崛起之后,為了有一個(gè)全新的形象,給起了一個(gè)更加牛逼的名字:深度學(xué)習(xí)。
深度學(xué)習(xí)(deep neural network)是機(jī)器學(xué)習(xí)的分支,是一種試圖使用包含復(fù)雜結(jié)構(gòu)或由多重非線性變換構(gòu)成的多個(gè)處理層對(duì)數(shù)據(jù)進(jìn)行高層抽象的算法。深度學(xué)習(xí)是一種算法。
不過(guò),深度學(xué)習(xí)的表現(xiàn)過(guò)于突出,其含義也更加寬泛,包含神經(jīng)網(wǎng)絡(luò)的模型,包含算法。最終,深度學(xué)習(xí)有些類似一門學(xué)科。
相比神經(jīng)網(wǎng)絡(luò)和深度學(xué)習(xí)到底是什么,如何更好的使用深度學(xué)習(xí)的技術(shù),傳統(tǒng)機(jī)器學(xué)習(xí)當(dāng)中的技術(shù)來(lái)實(shí)現(xiàn)一些應(yīng)用更為重要。如果沒(méi)有使用神經(jīng)網(wǎng)絡(luò)的模型,沒(méi)有使用深度學(xué)習(xí)的算法,但是得到了一個(gè)更好的關(guān)于機(jī)器學(xué)習(xí)的結(jié)果,也挺好。