為什麼機器學習(Machine Learning)會夯翻天?你真的了解它的運作方式嗎?

文/Evelyn|編輯/Quen

機器學習(Machine Learning)的話題紅透半邊天,不只是未來趨勢,更是錢潮所在,本篇文章將介紹四種機器學習以及機器學習的七個步驟,跟著CloudMile萬里雲一起了解,往後加強服務內容、改善工作流程都適用。

假設今天你是一個提供電子郵件帳戶服務的公司,如何最有效率地替客戶分類雪片般飛來的郵件、篩選掉垃圾郵件,絕對是致勝關鍵,量小的時候請一位客服人員手動分類可能不難,但如果今天面對的是海量郵件,這個曠日廢時的則斷斷不可行了。

次佳的選項可能會是運用關鍵字演算法,藉由偵測信件內文關鍵字來分類郵件,雖然可以有效率解決手動問題,但此法的準確率並不高。目前最佳者還是半監督式的機器學習,有了此法,我們便可以完全自動化地分類郵件,且準確率會逐漸提升,這也代表未來公司不需再聘用從事此類重複工作的人力,更能將經費、時間及人力投注在拓展客戶源上。

四種機器學習(Machine Learning)

監督式學習(Supervised Learning)

在訓練的過程中提供物件(向量)和預期輸出,可以是「有標籤」的分類資料或是一個連續的值(迴歸分析),例如輸入了大量已標示清楚標籤的腳踏車和機車給機器後,讓機器分辨尚無標簽的照片是機車還是腳踏車。類似於動物和人類的認知感知中的「概念學習」(concept learning)。

半監督式學習(Semi-supervised learning)

介於監督學習與非監督學習之間。這樣的學習方式會先將「有標籤」的資料和「無標籤」的資料切出一條分界線,再將「無標籤」資料依據整體分布,調整出兩大類別的新分界。不需要百分之百大量的「有標籤」資料,讓半監督學習同時能降低成本又具有非監督式學習高自動化的優點。

非監督式學習(Unsupervised Learning)

這樣的機器學習方式不需要人力事前的輸入標籤,僅僅提供了輸入範例,便直接以沒有標準答案的資料來訓練機器,在學習時機器會自動找出潛在類別的規則,並且反覆以經過測試後的學習結果應用到新的案例上。

增強學習(reinforcement learning)

源自於心理中行為主義理論的學習方法,即如何在環境給予的獎懲刺激下,一步步形成對於這些刺激的預期,來產生能夠獲得最大利益的習慣性行為,強調的是透過環境而行動,並會隨時根據輸入的資料逐步修正。這個方法具有普適性,因此在其他許多領域,如博弈論、統計學及遺傳算法等都有研究

機器學習的七個步驟

機器學習的流程共有以下七個步驟:

  1. 收集資料(Gathering data )
  2. 準備數據(Preparing that data)
  3. 選擇模型(Choosing a model)
  4. 訓練機器(Training)
  5. 評估分析(Evaluation)
  6. 調整參數(Hyperparameter tuning)
  7. 預測推論(Prediction)

舉例來說,假設我們現在要教育機器去辨別啤酒和葡萄酒,需透過「訓練(training)」來建構這個問答系統,而此系統被又稱為「模型(model)」。

建議觀看:The 7 steps of machine learning

要分別不同酒種,首先,機器要蒐集數據,例如泡沫的量和玻璃杯的形狀等。為了快速達到我們的要求,我們會先選擇以下兩種作為判準標的「特徵(features)」:酒的顏色(光的波長)和酒精含量(百分比)。依此列出一份可供機器參考的顏色/酒精含量表,作為培訓數據,讓機器能對照比對。

use model to predict。圖/The 7 Steps of Machine Learning

接著就是機器開始學習的階段了。研究人員會將所有數據隨機排列,並把所有數據分成兩個部分,第一份佔大多數,用來讓機器對照數據;第二份是少部分,用來評估已訓練完成的模型之辨識性能。完成後即可選擇模型及開始訓練機器,只要讓給機器設定好演算法並適度調整參數,就可以提高預測的準確度。

利用機器學習提升品質

現在大家常用的 Facebook Messenger 聊天機器人、Pinterest、Twitter 時間軸和最大宗的Google 都在利用機器學習提升服務品質。要成為下一個科技巨擘,快來搶下機器學習這塊大餅吧。

大數據時代如何做好行銷:機器學習來幫你!

在機器學習(Machine Learning)如此火紅的時代,下圍棋靠 AI、自駕車靠 AI、自拍修圖也都靠 AI,你還在用傳統思維在做行銷規劃嗎?!是時候讓機器學習出手輔助你的行銷大業了!

還有誰使用 Machine Learning?

有10家公司用新穎的方式使用機器學習,看看都有誰!
https://www.xcnnews.com/kj/464024.html

GCP Machine Learning 官方介紹

https://cloud.google.com/products/machine-learning/

參考資料來源

*Intelligent email categorization with machine learning
https://cloudplatform.googleblog.com/2017/08/intelligent-email-categorization-with-machine-learning.html?m=1

*The 7 Steps of Machine Learning
https://medium.com/towards-data-science/the-7-steps-of-machine-learning-2877d7e5548e

*Machine Learning Workflow
https://cloud.google.com/ml-engine/docs/concepts/ml-solutions-overview

訂閱 CloudMile 電子報

所有 CloudMile 最新消息、產品動態、活動資訊和特別優惠,立即掌握。

我已閱讀並同意 CloudMile  隱私權政策.