Position: 吳俊逸 >
Latest Articles
by 吳俊逸
2018-05-23 14:16:46, Reply(0), Views(2158)

建立 DataFrame DataFrame 用來處理結構化(Table like)的資料,有列索引與欄標籤的二維資料集,可以透過 Dictionary 或是 Array 來建立,但也可以利用外部的資料來讀取後來建立,例如: CSV 檔案、資料庫等等。DataFrame 的操作 ❖ 資料描述查看 可以透過下列方法查看目前資料的資訊
(Read All...)
(Read All...)
by 吳俊逸
2018-05-20 10:41:22, Reply(0), Views(815)

Job Description
(Read All...)
(Read All...)
by 吳俊逸
2018-05-16 09:18:57, Reply(0), Views(3216)

Doc2Vec 或者叫做 paragraph2vec, sentence embeddings,是一种非监督式算法,可以获得 sentences/paragraphs/documents 的向量表达,是 word2vec 的拓展。
(Read All...)
(Read All...)
by 吳俊逸
2018-05-16 09:13:08, Reply(0), Views(4115)

REF: https://medium.com/pyladies-taiwanword2vec 是 Google 的一個開源工具,能夠根據輸入的「詞的集合」計算出詞與詞之間的距離。它將「字詞」轉換成「向量」形式,可以把對文本內容的處理簡化為向量空間中的向量運算,計算出向量空間上的相似度,來表示文本語義上的相似度。The amazing power of word vectorsword2vec 計算的是餘弦值 (cosine),距離範圍為 0–1 之間,值越大代表兩個詞關聯度越高。詞向量:用 Distributed Representation 表示詞,通常也被稱為「Word Representation」或「Word Embedding」。簡言之:詞向量表示法讓相關或者相似的詞,在距離上更接近。本次使用資料集搜狗實驗室的新聞文本 (完整版 648MB、tar.gz 格式);建議第一次使用迷你版 ( 110KB ),但要記得下載 tar.gz 格式的資料集,因示範程式碼是以此格式做清理。下載連結
(Read All...)
(Read All...)
by 吳俊逸
2018-05-09 10:36:03, Reply(0), Views(1171)

Job Location: Santa Clara, CA
(Read All...)
(Read All...)
by 吳俊逸
2018-04-30 00:41:05, Reply(0), Views(876)

2018年國際玻璃技術大展(Glasstec 2018)預定於10月在德國杜塞道夫舉行,本次主題將鎖定讓玻璃產業轉型為智慧工廠的初步成果,其中包括自動化如何改變製程以及玻璃產業轉型也需要政策配合。
(Read All...)
(Read All...)
by 吳俊逸
2018-04-21 15:33:45, Reply(0), Views(852)

美國Salary.com網站調查,僅37%的人將爭取加薪視為理所當然,但卻有18%的人從未要求過。但為自己的好表現爭取更高的薪水,本來就是天經地義的事,
(Read All...)
(Read All...)
by 吳俊逸
2018-04-21 10:07:41, Reply(0), Views(704)

KPMG 安侯建業聯合會計師事務所今 (10) 日表示,2017 年綜所稅結算申報與 2016 年相比有 6 個不同,包含調高免稅額、課稅級距金額、退職所得課稅門檻、配合納稅者權利保護法施行,對於基本生活費不課稅、增加綜合所得稅聲明事項表、因應住宅法上路,房屋所有權人出租房屋做公益使用或租給領有政府租金補貼之承租人,每屋每月可享有最高 1 萬元租金免稅額度。
(Read All...)
(Read All...)
by 吳俊逸
2018-04-18 15:36:34, Reply(0), Views(6790)

由於工作機不能上網(或工作環境有防火牆),在沒有網的情況下裝pandas真費勁,好不容易裝好了,記錄一下,備忘。具體步驟如下:
(Read All...)
(Read All...)