iLMS知識社群ePortfolioeeClass學習平台空大首頁Login
Position: 吳俊逸 > AI
AI 專家路線圖 (AI-Expert-Roadmap)
by 吳俊逸 2022-01-27 12:26:29, Reply(0), Views(856)
Ref: CUPOY AI時代的各種專業職務所需技能學習地圖整理
Ref: 機器之心 https://i.am.ai/roadmap/

這是一家德國軟體公司 AMAI GmbH 近期釋出的 GitHub 專案—AI 專家路線圖(AI-Expert-Roadmap)。該路線圖幾乎涵蓋了 AI 領域所有的知識點,並且每個知識點都有詳細的文件。有了這個路線圖的指導,或許能幫助你快速入門乃至成為 AI 領域的佼佼者。

這個學習路線圖幾乎涵蓋了人工智慧領域的所有內容,點點滑鼠,就能連結所需知識。



想從事人工智慧領域的研究,盲目地在網上購買了一本又一本的參考資料,學習影片刷了一遍又一遍…… 反過頭來看,這些方法可能作用並不是很大,卻消耗了大量的時間和金錢。

這時,一種提綱式的學習途徑就顯得尤為重要了。如果你想成為資料科學家、機器學習或者 AI 專家,而又苦於找不到合適的學習方法,本文將提供一組思路清晰、簡單易懂的人工智慧專家路線圖。


● Github專案地址:

https://github.com/AMAI-GmbH/AI-Expert-Roadmap


亮點多多的 AI 專家路線圖

對學習者非常友好的是,這份 AI 專家路線圖是一個互動版本。每個子模組所列內容都可以連結到指定網站,學習者可以找到詞條的維基百科或其他來源的釋義和拓展內容。此外,如果有新的研究出現時,該路線圖會隨時更新。

該路線圖旨在給學習者提供關於人工智慧的整體概念,並在學習感到困惑時給予指導,而沒有鼓勵學習者一味地選擇最先進、最熱門的技術。這是因為在科研中,每個人都需要了解哪種工具最適合自己。換言之,最先進、最熱門的技術不一定是最適合的。

就這份 AI 專家路線圖而言,開發者列出了任何學習路徑所必不可少的一些要素,如論文和程式碼、版本控制、語義化版本控制和更新日誌。但就具體選擇上,開發者認為在學習 AI 時不應直接過渡到當前熱門的技術——深度學習,而應步步為營,並提供了 3 條可供選擇的學習路徑:資料科學家→機器學習→深度學習…;資料科學家→資料工程師…;大資料工程師→…



循序漸進才是“王道”。

AI 專家路線圖概覽

這部分內容簡要總結了 AI 專家路線圖,並從以下幾個方面著手講解:資料科學家、機器學習、深度學習、資料工程師以及大資料工程師。這 5 部分內容都有詳細的學習路線圖,點選圖表任意模組,都會連結到對應的內容。

資料科學家路線圖

在資料科學家路線圖中,我們可以瞭解到進行 AI 研究所需要的基礎:矩陣和線性代數、資料庫、表格資料、資料格式(JSON、XML、CSV)、正則表示式等等。

在統計學方面,該路線圖涵蓋了概率論、概率分佈、估計、假設檢驗、置信區間、大數定律、蒙特卡羅方法等等。

在 Python 程式設計方面,該路線圖展示了 Python 基礎、比較重要的 Python 庫以及所需執行環境等。

在資料來源方面,學習者點選“Awesome Public Datasets”圖示,就可以連結到整理好的公共資料集等。接著過渡到視覺化和探索性資料分析 / 轉換 / 整理相關內容,最後進入到機器學習和資料工程師兩個不同的方向。



機器學習路線圖

機器學習路線圖主要分為 4 大部分:基礎概念、演算法、用例以及所用工具。其中基礎概念部分主要包括機器學習中常用的概念、梯度下降、訓練集、測試集、驗證集等基礎概念;演算法部分列舉了 4 類演算法:監督學習、無監督學習、整合學習和強化學習;用例部分列舉了情感分析、協同過濾、標註和預測;所用工具部分則介紹了 scikit-learn、spacy 等工具。每部分內容都有對應的詳細文件。



深度學習路線圖

機器學習之後進入到了深度學習,這是第 1 條可選擇學習路徑的最後部分。深度學習路線圖由 4 大部分組成:論文、神經網路、網路架構以及所用工具。論文部分提供了深度學習論文閱讀路線圖以及 SOTA 論文;神經網路部分提供了一篇詳細介紹如何理解神經網路的部落格文章;網路架構部分包括感知器、自動編碼器、CNN、RNN;所用工具部分主要介紹了 TensorFlow 、PyTorch 等。最後給出建議:保持探索、與時俱進。




資料工程師路線圖

在資料科學家路線圖之後可以直接進入到資料工程師路線圖,這是第 2 條可選擇的學習路徑。該路線圖主要介紹了資料格式、資料發現、資料整合、資料融合、資料調研、資料湖和資料倉庫以及如何使用 ETL 等多方面內容。




大資料工程師路線圖

大資料工程師路線圖是第 3 條可選擇的學習路徑,主要分為 3 部分內容:大資料架構、遵循的原則以及所用工具。大資料架構部分主要講述了大資料分析架構模式和最佳實踐;遵循的原則包括資料庫管理系統中的資料複製,以及 Hadoop 中 NameNode 和 DataNode 的區別等;所用工具則介紹了 Hadoop、Spark 等。