iLMS知識社群ePortfolioeeClass學習平台空大首頁Login
Position: 吳俊逸 > AI
不寫程式也能玩資料分析:Orange Data Mining
by 吳俊逸 2022-06-08 12:28:01, Reply(0), Views(562)
https://college.itri.org.tw/Home/LessonData?PosterGUID=9C4E6BC7-772F-441E-B68F-2CE6FAB181F5&fbclid=IwAR3ALbIST8Plf_EXzxJQva-_oZ7iKttK-F9MFcEdibpRntUTEXs7o7HLU7c

Orange 資料探勘(Orange Data Mining,舊稱Orange 3) 是一個支援視覺化、圖示化介面的資料探索工具。使用Orange就可以像積木一樣,透過堆疊功能模組進行資料探勘( Data Mining)、機器學習 (Machine Learning)、圖像分析 (Image Analysis)、文字探勘 (Text Mining),方便使用者可以專注於探索性數據而不是編碼工作。因此Orange這種視覺化程式設計工具(Visual Programming Tools)可提供開發人員和資料科學家各式各樣的模組,讓資料處理、模型建置、訓練及部署機器學習模型更加快速且視覺化更容易上手!

項目

單元名稱

課程介紹

課程大綱

時長

單元1

Orange Data Mining安裝與基本功能介紹

介紹orange data mining 工具箱安裝,基本功能模組:資料匯入、資料清理、基礎統計分析、圖表呈現等案例說明。

Tool installation

Basic function introduction

Basic data visualization

1:20

單元2

資料可視化與機器學習之分類模型

透過案例,實際演練資料處理流程,特徵分析,與分類模型建構,決策樹、隨機森林等模型解釋,學習模型訓練與解讀模型結果。

Description analysis

Classification model

Model training and confusion matrix

1:30

單元3

機器學習之迴歸模型與分群模式

講述回歸模型與其案例,搭配模型解釋工具,分析各特徵值之權重,從訓練到預測結果之解釋,並講述分群模型,與降維的實作演練。

Regression model

Clustering model

Principal Component Analysis

1:20

單元4

機器學習之模型解釋與影像分析

模型解釋工具SHAP之操作與講解,搭配案例進行說明,了解參數貢獻值,並針對圖形資料,講述遷移學習與圖形建模分析等步驟。

Model explainability

Image analysis

Transfer learning

1:45

單元5

文字探勘分析

文字探勘,說明如何透過orange 進行文字資料的解析,如何計算詞頻、繪製詞彙雲,透過前處理進一步搭配模型對案例進行操作說明

Text mining

Hierarchical clustering

Corpus with classification

1:30


課程特色/目標 

上完本課程可以

  1. 透過視覺化編程(Visual Programming)進行資料分析。
  2. 學習到資料探勘技術(Data Mining)與機器學習(Machine Learning)方法。
  3. 建立自己的數據分析流程(Data Pipeline),並使用這些數據建構所需要的機器學習模型。

課程對象 

  1. 大專以上,無需特別背景,適合研發工程師、生產製造、品保等相關工程師/資料分析人員及各管理階層;
  2. 研究單位工程師、學生或對對於數據分析 與機器學習感興趣者;
  3. 具電腦基本操作或有基礎程式語言基礎者為佳。