什麼是深度學習?與機器學習的差異

如果您在過去幾年閱讀過科技相關文章,應該經常看到一些熱門詞彙,例如 人工智慧(Artificial Intelligence, AI)、機器學習(Machine Learning, ML) 與 深度學習(Deep Learning, DL)。這些名詞在科技與商業領域中被廣泛提及,但它們究竟代表什麼?彼此之間又有何差異與關聯?
本文將深入說明人工智慧、機器學習與深度學習的核心概念,並解析三者之間的關係。此外,文章也將介紹建構這些技術時的實務最佳做法,以及企業在導入相關技術時需要留意的關鍵要點。
人工智慧、機器學習與深度學習
理解 AI、機器學習與深度學習之間差異的最佳方式,是將三者視為一個層級關係:每一個概念都是前一層的延伸與子集合。人工智慧(AI) 是最廣泛的概念,其中包含 機器學習(Machine Learning),而 深度學習(Deep Learning) 則是機器學習的一種技術類型。
透過這樣的層級關係,可以更容易理解三者之間的關聯。接下來,我們將進一步深入探討各自的概念與應用。
人工智慧(Artificial Intelligence)
人工智慧(Artificial Intelligence,AI) 是一個概括性的術語,涵蓋多種不同技術。簡單來說,AI 指的是能夠模仿或展現人類智慧特徵的機器系統。數十年來,人工智慧不僅是科技領域的重要研究方向,也常出現在電影與科幻小說的情節之中。
如今,AI 已廣泛應用於我們的日常生活與各行各業。企業透過 AI 技術來自動化流程、進行預測分析與優化決策,取代部分原本由人類完成的工作。這不僅能節省時間與成本,也能讓員工從重複且枯燥的任務中解放出來,專注於更具價值的工作。
一般而言,人工智慧可分為三種類型:
- 狹義人工智慧(Artificial Narrow Intelligence,ANI)
又稱為「弱人工智慧」,專注於執行特定任務,例如語音辨識、影像辨識或推薦系統。
- 通用人工智慧(Artificial General Intelligence,AGI)
又稱為「強人工智慧」,指具備與人類相似的通用智慧,能處理多種類型的問題並完成不同任務。
- 超級人工智慧(Artificial Super Intelligence,ASI)
指在智慧能力上超越人類的人工智慧系統,能在各個領域展現遠超人類的決策與理解能力。
其中,狹義人工智慧(ANI) 是目前最常見且已被廣泛應用的 AI 形式,通常只能完成特定任務;而 通用人工智慧(AGI) 與 超級人工智慧(ASI) 則仍屬於理論或未來發展方向。
狹義人工智慧(Artificial Narrow Intelligence, ANI)
狹義人工智慧(Artificial Narrow Intelligence,ANI) 又稱為「弱人工智慧」,指的是只能執行單一或特定任務的 AI 系統。雖然弱 AI 在某些特定領域的表現可能非常出色,但在其他領域或不同任務上,仍無法達到人類的靈活性與理解能力。
一個著名的弱 AI 範例是 深藍(Deep Blue)。這是一台在 1996 年擊敗國際象棋世界冠軍 加里·卡斯帕羅夫(Garry Kasparov) 的電腦系統。深藍每秒可以評估多達 2 億個棋局位置,展現出極強的棋局分析能力。然而,除了下棋之外,它無法執行其他任務,因此仍屬於典型的弱人工智慧。
目前,狹義人工智慧已被廣泛應用於 科學研究、商業分析與醫療保健 等領域,用於開發能在特定任務上表現優異的 AI 解決方案。常見的應用包括:
- 醫學影像判讀
- 製造流程中的異常偵測
- 商業資料中的模式與趨勢分析
這些應用皆展現了弱 AI 在特定任務上的高效率與高準確度。
通用人工智慧(Artificial General Intelligence, AGI)
通用人工智慧(Artificial General Intelligence,AGI) 是強人工智慧的一種形式。與只能執行單一任務的狹義人工智慧不同,AGI 理論上能夠完成多種類型的任務,並具備更接近人類的智慧與理解能力。
在理想情況下,AGI 不僅能處理不同問題,還能在沒有持續人類指令的情況下自主做出決策。這類系統被認為同時具備邏輯推理能力與情境理解能力,使其能在多種環境中靈活應對。
目前,真正意義上的 AGI 尚未實現,但相關研究與技術仍持續發展。例如,聊天機器人與數位虛擬助理的對話能力已顯著提升,能更自然地與使用者互動,並在一定程度上回應情緒訊號。此外,一些研究也開始探索讓機器辨識與理解人類情緒的能力。
儘管這些進展令人期待,但真正具備情感理解與通用智慧的 AI,遠不只是能辨識情緒並做出回應而已。要實現真正的通用人工智慧,仍需要長期的研究與技術突破。
超級人工智慧(Artificial Super Intelligence, ASI)
在許多科幻小說中出現的 AI,通常被稱為 超級人工智慧(Artificial Super Intelligence,ASI),這是強人工智慧的另一種類型。ASI 指的是在智慧、推理能力與創造力等各方面都超越人類的人工智慧系統。
目前這類 AI 尚未真正出現,仍主要存在於科幻作品與理論討論之中。事實上,科學界至今仍未接近能夠創造出真正 ASI 的階段。
儘管如此,研究人員已在多個相關領域取得進展,這些技術未來可能為更高階 AI 的發展奠定基礎,例如:
- 機器人技術(Robotics)
發展能自主運作的機器人,例如 Roomba 掃地機器人等自動化設備。
- 機器推理(Machine Reasoning)
訓練 AI 模型透過資料庫或知識庫進行演繹與歸納推理,以做出決策並得出結論。
- 機器學習(Machine Learning)
透過演算法與計算模型,使機器能完成特定任務並從資料中持續學習。
目前,大多數 AI 系統仍屬於狹義人工智慧(弱人工智慧),只能專注於特定任務。然而,即便如此,這些技術對全球企業與個人仍具有革命性的影響。隨著 AI 技術持續發展與迭代,其能力也將不斷提升,逐步突破現有智慧系統的限制。
機器學習
AI 的智慧來源是什麼?答案就是 機器學習(Machine Learning,ML)。機器學習是人工智慧領域中的一個重要子領域,其核心目標是讓電腦能夠從資料中學習,而不是單純透過程式指令完成特定任務。換句話說,機器學習是透過演算法與模型來訓練 AI,使其能完成特定任務並從資料中持續改進。
機器學習通常包含以下三個關鍵要素:
資料集
資料集是由大量資料點或樣本所組成的集合。每筆資料可能是數值、圖片、文字、音訊或影片等形式。資料集主要用於訓練機器學習模型,讓模型能從中學習規律。
特徵
特徵是資料中用於描述問題的重要資訊,代表模型在分析資料時需要關注的屬性。透過特徵,機器學習模型能夠理解資料的結構,並學習如何解決特定任務。
演算法
演算法是機器學習模型用來分析資料並產生預測或決策的一套規則或計算流程。模型會依據演算法處理資料,從中找出模式並形成推論。
從本質上來看,機器學習模型會透過演算法讀取數千甚至數百萬筆資料,並據此做出預測或推論。為了讓模型能正確理解資料,必須透過資料集與特徵進行訓練,使模型能從真實世界資料中學習並建立判斷能力。
電腦視覺(Computer Vision, CV) 是機器學習的重要應用之一。電腦視覺技術已被應用於多種場景,例如影像辨識、品質檢測與醫療影像分析,其中最具代表性的應用之一就是自動駕駛技術。
一般而言,機器學習可分為四種類型:
- 監督式學習(Supervised Learning)
- 非監督式學習(Unsupervised Learning)
- 半監督式學習(Semi-supervised Learning)
- 強化學習(Reinforcement Learning)
這些不同的學習方式,使機器學習能夠應用於各種不同類型的問題與資料情境。
監督式學習(Supervised Learning)
監督式學習(Supervised Learning) 是指在「有標註資料」的情況下訓練模型的機器學習方法。這種方法類似於在老師指導下學習:模型會透過已標註答案的訓練資料進行學習,理解輸入資料與正確結果之間的關係。
在訓練過程中,模型會先使用帶有標註的資料集進行學習,建立預測規則。完成訓練後,再使用新的資料進行測試,以評估模型的表現與準確度。研究人員會持續檢視模型輸出的結果,並在準確率尚未達到設定門檻之前,持續對模型進行訓練與調整。
監督式學習常見於多種應用場景,例如:
- 垃圾郵件過濾
- 語言辨識
- 資料分類
- 電腦視覺
由於監督式學習能透過已知答案的資料進行訓練,因此在需要高準確度預測或分類的應用中被廣泛採用。
非監督式學習(Unsupervised Learning)
非監督式學習(Unsupervised Learning) 是一種在沒有標註資料或既定目標的情況下訓練模型的機器學習方法。模型會透過分析資料本身的結構與特徵,自行尋找其中的模式或關聯性。
在非監督式學習中,研究人員只提供原始資料,並不提供「正確答案」。機器學習模型需要透過演算法從資料中找出潛在規律,例如資料之間的相似性或群組結構。因此,這類模型常被用於資料分群、模式探索與資料分析,以協助企業從大量資料中發現有價值的洞察。
非監督式學習常見的應用包括:
- 資料分群
- 異常偵測
- 推薦系統
- 風險管理
由於非監督式學習能在沒有標註資料的情況下分析資料,因此特別適合用於探索未知資料結構或發現潛在模式的情境。
半監督式學習(Semi-Supervised Learning)
半監督式學習(Semi-Supervised Learning) 是結合監督式學習與非監督式學習的一種機器學習方法。在這種模式下,模型會同時使用部分已標註資料與大量未標註資料進行訓練。
由於標註資料通常取得成本較高,因此半監督式學習能利用少量已知標籤的資料,搭配更多未標註資料來提升模型的學習能力。透過這種方式,模型不僅可以依據標註資料學習既有模式,也需要自行從未標註資料中找出潛在結構與關聯性。
在半監督式學習中,研究人員通常可以預期模型可能會發現的模式方向,但模型仍必須在部分缺乏標註資訊的情況下,自主探索資料中的結構與規律。因此,這種方法在資料標註成本高、但資料量龐大的情境中特別常見。
強化學習(Reinforcement Learning)
強化學習(Reinforcement Learning) 是一種透過試錯(trial and error)方式進行學習的機器學習方法,其學習模式與人類的學習方式相當相似。模型會根據行為帶來的結果,從正向回饋(獎勵)或負向回饋(懲罰)中逐步調整策略,進而提升決策能力。
在強化學習中,模型通常會在一個動態環境中持續嘗試不同的行動,並根據得到的回饋不斷優化決策策略。相較於其他機器學習方法,強化學習允許模型在較少人工干預的情況下進行自主探索與學習。
強化學習已被廣泛應用於多種領域,例如:
- 遊戲 AI
- 機器人控制
- 自動駕駛技術
- 資源管理與最佳化
此外,在近年最受關注的大型語言模型(LLM)訓練過程中,基於人類回饋的強化學習(Reinforcement Learning from Human Feedback, RLHF)也扮演了關鍵角色。透過人類專家的評估與回饋,模型能進行微調與優化,進一步提升回應品質與可靠性。
深度學習(Deep Learning)
深度學習(Deep Learning, DL) 是機器學習的一個重要子領域。與其他機器學習方法相比,深度學習的主要差異在於演算法的學習方式以及所需資料量。深度學習通常需要大量資料進行訓練,但相對只需要較少的人為介入。
深度學習的核心概念是模仿人類大腦的結構,透過多層神經網路(Neural Networks)來處理與分析資料。資料會在神經網路的不同層之間傳遞與轉換,使模型能逐步學習複雜的特徵與模式。
深度學習模型可以使用已標註資料集進行訓練,但在某些情況下並不一定需要標註資料。模型既可以透過監督式學習進行訓練,也可以透過非監督式學習來發現資料中的潛在規律。
深度學習最令人期待的一點是,它能夠處理非結構化資料(Unstructured Data),例如圖片、語音、影片與自然語言等資料型態。隨著技術持續進步,未來的 AI 系統將更有能力在缺乏標註資料的情況下自主學習,進一步推動人工智慧的發展。
人工智慧、機器學習與深度學習的關鍵差異
透過前面的介紹可以了解到,人工智慧(AI)、機器學習(ML)與深度學習(DL)其實是同一技術體系中的不同層級,它們彼此之間具有明確的包含關係。
簡單來說:
人工智慧(AI)
是一個廣泛的概念,泛指一系列用於分析資料、找出模式並解決問題的技術與演算法。AI 的核心目標是讓機器具備類似人類的思考與決策能力。多數 AI 應用的實現,通常會依賴機器學習或深度學習技術。
機器學習(Machine Learning)
是人工智慧的一個子領域,透過資料與演算法訓練模型,使電腦能夠從資料中學習並解決特定問題,而不需要逐一撰寫明確的程式規則。
深度學習(Deep Learning)
是機器學習的一種進階形式,透過多層神經網路來學習資料中的複雜模式,並能處理大量非結構化資料,例如圖片、語音與自然語言。
簡而言之:
AI 是整體概念 → Machine Learning 是 AI 的方法之一 → Deep Learning 則是 ML 的進階技術。
人工智慧、機器學習與深度學習的不同專案切入方式
在設計 AI、機器學習或深度學習專案時,通常可以從不同角度進行規劃與開發。常見的兩種方法為:以模型為中心(Model-centric)與以資料為中心(Data-centric)。
以模型為中心(Model-centric)
在以模型為中心的 AI 專案中,團隊會將大量時間投入在開發與優化機器學習模型本身。
當專案重點放在模型時,資料通常在初期並不是主要關注焦點。雖然仍會採集必要資料,但核心目標是建立一個能夠有效處理資料噪音與複雜情境的優秀模型。在整個專案過程中,團隊會持續調整演算法、優化模型架構與修改程式碼,以提升模型的整體效能。
以資料為中心(Data-centric)
與模型導向的方法不同,以資料為中心的 AI 專案則將重點放在資料本身,而非模型架構。
在這種方法中,團隊會專注於提升資料品質與資料標註準確度,透過改善資料集來提升模型表現。Appen 一直強調,資料是 AI 專案中最關鍵的資產。
無論採用哪一種方法,高品質資料都是 AI 專案成功的基礎。資料就像是 AI 的「養分」,而資料採集、資料清理與資料標註都是 AI 開發流程中不可或缺的環節。
即使 AI 系統已經上線,仍需要持續進行資料標註與品質優化,以確保模型能持續產生更準確的結果。
機器學習與 AI 領域的專家 Andrew Ng 曾指出,在 AI 專案中:
約 80% 的時間與資源應投入在資料準備與資料品質提升上,而模型訓練本身通常只占約 20%。
過去許多企業在推動 AI 專案時,往往將重心放在模型訓練上。然而,越來越多研究與實務經驗顯示:高品質資料才是打造高品質 AI 的關鍵因素。
如何透過資料提升機器學習模型效能
雖然在 AI 專案中,花費大量時間進行資料採集、資料清理與資料標註,看起來似乎會壓縮模型訓練的時間,但實際上,以資料為中心的方法往往能有效提升專案的投資報酬率(ROI)與模型成果。以下說明幾種透過資料優化機器學習模型的重要做法。
一致的資料標註
在資料處理過程中,一致性是關鍵因素。無論是不同批次資料,或由不同標註人員處理的資料,都必須維持一致的標註標準。
因此,在資料標註流程中,建立嚴謹的品質控管(Quality Assurance, QA)機制與明確標註規範非常重要。透過高標準的品質要求與完善的流程管理,可以確保資料被正確且一致地標註,進而提升模型訓練品質。
適度引入資料噪音
在建立以資料為中心的機器學習模型時,有一個看似反直覺但常被採用的方法,就是在資料中適度引入噪音(Noise)或不完全一致的情況。
對於小型資料集而言,一致性非常重要,能幫助模型更快學習並產生穩定結果。但當資料集規模變大時,適度的資料噪音反而有助於提升模型的泛化能力。
如果資料過於「完美」,模型可能無法適應真實世界的情境,因為現實資料往往包含誤差與不一致。透過在資料中加入合理程度的噪音,可以讓模型更貼近真實環境,進而提升準確度與應用能力。
建立系統化的品質保證機制
在以資料為中心的 AI 專案中,品質保證(QA)是成功部署模型的重要關鍵。在資料與模型的整個生命週期中,都需要持續進行檢查與監控。
在資料標註階段,必須確保所有標註人員依照相同標準進行標註。如果在品質檢查中發現標註差異,應立即重新培訓標註人員,並修正錯誤資料。
此外,定期檢查模型的表現與可能出現的偏移(Model Drift)也同樣重要。
近年來,機器學習輔助的品質檢測工具也逐漸普及。除了傳統的預標註、人工校對與人工質檢流程之外,這類工具能更有效率地進行資料品質檢查,不僅能確保資料符合標準,也能提升整體標註效率。
持續監控與模型更新
機器學習模型並不是「訓練完成就結束」。為了確保模型在真實環境中持續保持準確度,定期監控、更新與重新訓練模型是必要的工作。
建立完善且系統化的品質保證機制,可以幫助團隊在整個 AI 系統運作過程中持續維持模型的準確性與穩定性。
總結
人工智慧(AI)、機器學習(ML)與深度學習(DL)經常一起被提及,它們其實是同一技術體系中的不同層級。深度學習是機器學習的一種形式,而機器學習則是人工智慧的重要子領域。
與許多新興技術一樣,業界對於如何最佳化導入與應用 AI 仍有不同觀點。有些人認為,AI 與機器學習專案中最重要的是模型本身;而另一些人——包括我們——則認為,高品質資料才是讓模型真正發揮效能並提升投資報酬率的關鍵因素。
如果您希望在企業中導入以資料為中心的機器學習模型,我們可以協助提供完整的資料服務,包括:
- 訓練資料採集
- 資料標註
- 資料品質檢測
- 長期模型訓練與優化建議
透過完善的資料流程與專業支援,協助您的 AI 專案順利落地並持續提升效能。若您想進一步了解相關解決方案,歡迎與我們聯繫。
Appen 提供 AI 模型建置與部署所需的全生命週期資料服務,涵蓋資料採集、資料標註、模型測試與高品質資料集,協助企業加速 AI 專案落地

