不寫程式也能玩資料分析:Orange Data Mining
by 吳俊逸
2022-06-08 12:28:01, Reply(0), Views(2182)

https://college.itri.org.tw/Home/LessonData?PosterGUID=9C4E6BC7-772F-441E-B68F-2CE6FAB181F5&fbclid=IwAR3ALbIST8Plf_EXzxJQva-_oZ7iKttK-F9MFcEdibpRntUTEXs7o7HLU7c
Orange 資料探勘(Orange Data Mining,舊稱Orange 3) 是一個支援視覺化、圖示化介面的資料探索工具。使用Orange就可以像積木一樣,透過堆疊功能模組進行資料探勘( Data Mining)、機器學習 (Machine Learning)、圖像分析 (Image Analysis)、文字探勘 (Text Mining),方便使用者可以專注於探索性數據而不是編碼工作。因此Orange這種視覺化程式設計工具(Visual Programming Tools)可提供開發人員和資料科學家各式各樣的模組,讓資料處理、模型建置、訓練及部署機器學習模型更加快速且視覺化更容易上手!
項目 | 單元名稱 | 課程介紹 | 課程大綱 | 時長 |
單元1 | Orange Data Mining安裝與基本功能介紹 | 介紹orange data mining 工具箱安裝,基本功能模組:資料匯入、資料清理、基礎統計分析、圖表呈現等案例說明。 | Tool installation Basic function introduction Basic data visualization | 1:20 |
單元2 | 資料可視化與機器學習之分類模型 | 透過案例,實際演練資料處理流程,特徵分析,與分類模型建構,決策樹、隨機森林等模型解釋,學習模型訓練與解讀模型結果。 | Description analysis Classification model Model training and confusion matrix | 1:30 |
單元3 | 機器學習之迴歸模型與分群模式 | 講述回歸模型與其案例,搭配模型解釋工具,分析各特徵值之權重,從訓練到預測結果之解釋,並講述分群模型,與降維的實作演練。 | Regression model Clustering model Principal Component Analysis | 1:20 |
單元4 | 機器學習之模型解釋與影像分析 | 模型解釋工具SHAP之操作與講解,搭配案例進行說明,了解參數貢獻值,並針對圖形資料,講述遷移學習與圖形建模分析等步驟。 | Model explainability Image analysis Transfer learning | 1:45 |
單元5 | 文字探勘分析 | 文字探勘,說明如何透過orange 進行文字資料的解析,如何計算詞頻、繪製詞彙雲,透過前處理進一步搭配模型對案例進行操作說明 | Text mining Hierarchical clustering Corpus with classification | 1:30 |
課程特色/目標
上完本課程可以
- 透過視覺化編程(Visual Programming)進行資料分析。
- 學習到資料探勘技術(Data Mining)與機器學習(Machine Learning)方法。
- 建立自己的數據分析流程(Data Pipeline),並使用這些數據建構所需要的機器學習模型。
課程對象
- 大專以上,無需特別背景,適合研發工程師、生產製造、品保等相關工程師/資料分析人員及各管理階層;
- 研究單位工程師、學生或對對於數據分析 與機器學習感興趣者;
- 具電腦基本操作或有基礎程式語言基礎者為佳。