機(jī)器學(xué)習(xí)都包括了些什么?
許多人將機(jī)器學(xué)習(xí)視為通向人工智能的途徑,但是對(duì)于統(tǒng)計(jì)學(xué)家或商人而言,機(jī)器學(xué)習(xí)也可以是一種強(qiáng)大的工具,可以實(shí)現(xiàn)前所未有的預(yù)測結(jié)果。
為什么機(jī)器學(xué)習(xí)如此重要?
在開始學(xué)習(xí)之前,我們想花一些時(shí)間強(qiáng)調(diào)WHY機(jī)器學(xué)習(xí)非常重要。
總之,每個(gè)人都知道人工智能或人工智能。通常,當(dāng)我們聽到AI時(shí),我們會(huì)想象機(jī)器人到處走動(dòng),執(zhí)行與人類相同的任務(wù)。但是,我們必須了解,雖然有些任務(wù)很容易,但有些任務(wù)卻很困難,并且距離擁有像人類一樣的機(jī)器人還有很長的路要走。
但是,機(jī)器學(xué)習(xí)是非常真實(shí)的并且已經(jīng)存在。它可以被視為AI的一部分,因?yàn)楫?dāng)我們想到AI時(shí),我們想象的大部分內(nèi)容都是基于機(jī)器學(xué)習(xí)的。
在過去,我們相信未來的這些機(jī)器人將需要向我們學(xué)習(xí)一切。但是人腦是復(fù)雜的,并且并非可以輕松描述其協(xié)調(diào)的所有動(dòng)作和活動(dòng)。1959年,亞瑟·塞繆爾(Arthur Samuel)提出了一個(gè)絕妙的主意,即我們不需要教計(jì)算機(jī),但我們應(yīng)該讓他們自己學(xué)習(xí)。塞繆爾(Samuel)也創(chuàng)造了“機(jī)器學(xué)習(xí)”一詞,從那時(shí)起,當(dāng)我們談?wù)摍C(jī)器學(xué)習(xí)過程時(shí),我們指的是計(jì)算機(jī)自主學(xué)習(xí)的能力。
機(jī)器學(xué)習(xí)有哪些應(yīng)用?
在準(zhǔn)備這篇文章的內(nèi)容時(shí),我寫下了沒有進(jìn)一步說明的示例,假定所有人都熟悉它們。然后我想:人們知道這些是機(jī)器學(xué)習(xí)的例子嗎?
讓我們考慮一些。
自然語言處理,例如翻譯。如果您認(rèn)為百度翻譯是一本非常好的字典,請(qǐng)?jiān)倏紤]一下。百度翻譯本質(zhì)上是一組機(jī)器學(xué)習(xí)算法。百度不需要更新百度 Translate;它會(huì)根據(jù)不同單詞的使用情況自動(dòng)更新。
哦,哇 還有什么?
雖然仍然是主題,但Siri,Alexa,Cortana都是語音識(shí)別和合成的實(shí)例。有些技術(shù)可以使這些助手識(shí)別或發(fā)音以前從未聽過的單詞。他們現(xiàn)在能做的事令人難以置信,但在不久的將來,它們將給人留下深刻的印象!
SPAM過濾。令人印象深刻,但值得注意的是,SPAM不再遵循一組規(guī)則。它自己了解了什么是垃圾郵件,什么不是垃圾郵件。
推薦系統(tǒng)。Netflix,淘寶,F(xiàn)acebook。推薦給您的所有內(nèi)容都取決于您的搜索活動(dòng),喜歡,以前的行為等等。一個(gè)人不可能像這些網(wǎng)站一樣提出適合您的推薦。最重要的是,他們跨平臺(tái),跨設(shè)備和跨應(yīng)用程序執(zhí)行此操作。盡管有些人認(rèn)為它是侵入性的,但通常情況下,數(shù)據(jù)不是由人處理的。通常,它是如此復(fù)雜,以至于人類無法掌握它。但是,機(jī)器將賣方與買方配對(duì),將電影與潛在觀眾配對(duì),將照片與希望觀看的人配對(duì)。這極大地改善了我們的生活。
說到這,淘寶擁有如此出色的機(jī)器學(xué)習(xí)算法,它們可以高度確定地預(yù)測您將購買什么以及何時(shí)購買。那么,他們?nèi)绾翁幚磉@些信息?他們將產(chǎn)品運(yùn)送到最近的倉庫,因此您可以在當(dāng)天訂購并收到產(chǎn)品。難以置信!
金融機(jī)器學(xué)習(xí)
我們名單上的下一個(gè)是金融交易。交易涉及隨機(jī)行為,不斷變化的數(shù)據(jù)以及從政治到司法的各種因素,這些因素與傳統(tǒng)金融相距甚遠(yuǎn)。盡管金融家無法預(yù)測很多這種行為,但是機(jī)器學(xué)習(xí)算法會(huì)照顧到這種情況,并且對(duì)市場的變化做出響應(yīng)的速度比人們想象的要快。
這些都是業(yè)務(wù)實(shí)現(xiàn),但還有更多。您可以預(yù)測員工是否會(huì)留在公司或離開公司,或者可以確定客戶是否值得您光顧-他們可能會(huì)從競爭對(duì)手那里購買還是根本不購買。您可以優(yōu)化流程,預(yù)測銷售,發(fā)現(xiàn)隱藏的機(jī)會(huì)。機(jī)器學(xué)習(xí)為機(jī)會(huì)開辟了一個(gè)全新的世界,對(duì)于在公司戰(zhàn)略部門工作的人們來說,這是一個(gè)夢(mèng)想成真。
無論如何,這些已在這里使用。然后,我們將進(jìn)入自動(dòng)駕駛汽車的新境界。
機(jī)器學(xué)習(xí)算法
直到最近幾年,無人駕駛汽車還是科幻小說。好吧,不再了。自動(dòng)駕駛汽車已經(jīng)驅(qū)動(dòng)了數(shù)百萬英里(即使不是數(shù)十億英里)。那是怎么發(fā)生的?沒有一套規(guī)則。而是一組機(jī)器學(xué)習(xí)算法,使汽車學(xué)習(xí)了如何極其安全有效地駕駛。
我們可以繼續(xù)學(xué)習(xí)幾個(gè)小時(shí),但我相信您的主旨是:“為什么要使用機(jī)器學(xué)習(xí)”。
因此,對(duì)您來說,這不是為什么的問題,而是如何的問題。
這就是我們的Python機(jī)器學(xué)習(xí)課程所要解決的問題。蓬勃發(fā)展的數(shù)據(jù)科學(xué)事業(yè)中最重要的技能之一-如何創(chuàng)建機(jī)器學(xué)習(xí)算法!
如何創(chuàng)建機(jī)器學(xué)習(xí)算法?
假設(shè)我們已經(jīng)提供了輸入數(shù)據(jù),創(chuàng)建機(jī)器學(xué)習(xí)算法最終意味著建立一個(gè)輸出正確信息的模型。
現(xiàn)在,將此模型視為黑匣子。我們提供輸入,并提供輸出。例如,考慮到過去幾天的氣象信息,我們可能想創(chuàng)建一個(gè)預(yù)測明天天氣的模型。我們將輸入模型的輸入可以是度量,例如溫度,濕度和降水。我們將獲得的輸出將是明天的天氣預(yù)報(bào)。
現(xiàn)在,在對(duì)模型的輸出感到滿意和自信之前,我們必須訓(xùn)練模型。訓(xùn)練是機(jī)器學(xué)習(xí)中的核心概念,因?yàn)檫@是模型學(xué)習(xí)如何理解輸入數(shù)據(jù)的過程。訓(xùn)練完模型后,我們可以簡單地將其輸入數(shù)據(jù)并獲得輸出。
如何訓(xùn)練機(jī)器學(xué)習(xí)算法?
訓(xùn)練算法背后的基本邏輯涉及四個(gè)要素:
a.數(shù)據(jù)
b.模型
c.目標(biāo)函數(shù)
d.優(yōu)化算法
讓我們探索每個(gè)。
首先,我們必須準(zhǔn)備一定數(shù)量的數(shù)據(jù)進(jìn)行訓(xùn)練。
通常,這是歷史數(shù)據(jù),很容易獲得。
其次,我們需要一個(gè)模型。
我們可以訓(xùn)練的最簡單模型是線性模型。在天氣預(yù)報(bào)示例中,這將意味著找到一些系數(shù),將每個(gè)變量與它們相乘,然后將所有結(jié)果求和以得到輸出。但是,正如我們稍后將看到的那樣,線性模型只是冰山一角。依靠線性模型,深度機(jī)器學(xué)習(xí)使我們可以創(chuàng)建復(fù)雜的非線性模型。它們通常比簡單的線性關(guān)系更好地?cái)M合數(shù)據(jù)。
第三個(gè)要素是目標(biāo)函數(shù)。
到目前為止,我們獲取了數(shù)據(jù),并將其輸入到模型中,并獲得了輸出。當(dāng)然,我們希望此輸出盡可能接近實(shí)際情況。大數(shù)據(jù)分析機(jī)器學(xué)習(xí)AI入門指南https://www.aaa-cg.com.cn/data/2273.html這就是目標(biāo)函數(shù)出現(xiàn)的地方。它估計(jì)平均而言,模型輸出的正確性。整個(gè)機(jī)器學(xué)習(xí)框架歸結(jié)為優(yōu)化此功能。例如,如果我們的函數(shù)正在測量模型的預(yù)測誤差,則我們希望將該誤差最小化,或者換句話說,將目標(biāo)函數(shù)最小化。
我們最后的要素是優(yōu)化算法。它由機(jī)制組成,通過這些機(jī)制我們可以更改模型的參數(shù)以優(yōu)化目標(biāo)函數(shù)。例如,如果我們的天氣預(yù)報(bào)模型為:
明天的天氣等于:W1乘以溫度,W2乘以濕度,優(yōu)化算法可能會(huì)經(jīng)過以下值:
W1和W2是將更改的參數(shù)。對(duì)于每組參數(shù),我們將計(jì)算目標(biāo)函數(shù)。然后,我們將選擇具有最高預(yù)測能力的模型。我們?cè)趺粗滥囊粋€(gè)最好?好吧,那將是具有最佳目標(biāo)函數(shù)的那個(gè),不是嗎?好的。大!
您是否注意到我們說了四個(gè)成分,而不是說了四個(gè)步驟?這是有意的,因?yàn)闄C(jī)器學(xué)習(xí)過程是迭代的。我們將數(shù)據(jù)輸入模型,并通過目標(biāo)函數(shù)比較準(zhǔn)確性。然后,我們更改模型的參數(shù)并重復(fù)操作。當(dāng)我們達(dá)到無法再優(yōu)化或不需要優(yōu)化的程度時(shí),我們將停止,因?yàn)槲覀円呀?jīng)找到了解決問題的足夠好的解決方案。
https://www.toutiao.com/i6821026294461891086/