您所知道的關于人工智能AI的知識有哪些?
作為IT開發人員, 根據自己的經驗簡單的做了一下總結,分了兩大部分內容:
一、自然語言處理(NLP)
(1)、基礎
1、文本清洗(正則、分詞與規范化);
2、中文分詞(HMM、trie tree、工具有jieba)
3、文法分析
4、詞袋模型(ngram)
5、關鍵詞抽取(tfidf、texttrank)
6、語義相似度(term、score、距離函數)
7、文本的向量化表示(word2vec(skip、gram、glove)、elmo、bert)
8、機器學習(lr、svm、bayesian、fast text、)
9、深度學習(textCNN、textRNN、seq2seq、siamese LSTM、DSSM、attention)
(2)、在實際項目中的應用
1、實體識別(應用:醫療智能、對話機器人)、(技術:CRF、bilstm-CRF、PCNN)、(擴展:知識圖譜、圖數據庫)
2、query相似變換(應用:sug、糾錯改寫)、(技術:elasticsearch 建庫索引)
3、文本分類(應用:情感識別、文章類型、意圖識別(樣本爬取)、語種檢測)
4、序列標注(機器翻譯、詞性標注)
5、文本生成(應用:詩歌對聯、摘要生成)、(技術:VAE、GAN)
6、聊天機器人(案例:百度anyQ)
二、圖像視覺處理(計算機視覺)
(1)、主要應用
1、主要應用:無人駕駛、醫療影像診斷、安防、人臉識別、視頻內容理解、圖像分類、圖像分割、目標檢測、目標跟蹤。
2、OpenCV
3、圖像分類(CNN、AlexNet、LeNet、VGG、ResNet、Fast-RCNN)
4、圖像檢索(距離度量與檢索、圖像特征抽取、LSH近鄰檢索算法)
上面兩大內容中要學習的內容分為三個階段
第一階段:人工智能基礎。包括編程基礎:機器學習深度學習框架例如tensorflow/pytorch;數學基礎:高等數學,線性代數,概率論,統計學知識;機器學習基礎:決策樹,邏輯回歸,聚類算法,支持向量機,集成學習;深度學習基礎:反向傳播,鏈式求導,卷積神技網絡,循環神經網絡等。
第二階段:算法在NLP領域的實踐應用。基礎的NLP任務:詞法分析,包括:分詞,詞性標注等;句法依存分析;語義表示與語言模型;命名實體識別;文本分類;文本生成;機器翻譯;信息檢索等。
第三階段:算法在CV領域的實踐應用。CV圖像處理的基礎,opencv的框架;同時也是基于cv領域應用最廣的幾種任務:圖像分類;語義分割;圖像目標檢測;目標跟蹤;序列分析。