什麼是提示工程(Prompt Engineering)?

要理解提示工程,首先需要了解生成式 AI、大型語言模型(LLM),以及「提示」(Prompt)的概念。
什麼是生成式人工智慧(Generative AI)?
生成式人工智慧(生成式 AI)是一類人工智慧模型,能根據輸入的文本或指令自動產生對應的輸出。與傳統基於規則或模板的系統不同,生成式 AI 不僅限於匹配或填充預定內容,而是能自主生成全新的文字、圖像、音訊等內容。
什麼是大型語言模型(Large Language Model, LLM) ?
大型語言模型(Large Language Model, LLM)是生成式 AI 的一種,透過超大規模數據訓練而成,能高度模仿人類的思維與語言習慣,並在使用過程中持續學習與優化,專注於處理與生成人類語言的連續文字。
什麼是提示(Prompt)?
提示(Prompt)是指提供給生成式 AI 模型的輸入文字或指令。它可以是問題、短語、段落,甚至完整的文章,用來引導模型產生相應的回應或輸出。提示的主要作用是指示模型執行特定任務或生成符合需求的內容。
什麼是提示工程(Prompt Engineering)?
根據以上討論,我們可以了解,透過設計合適的提示(Prompt),可以引導模型生成特定主題的文章、回答特定問題,或進行有意義的對話。提示的品質與準確性對於產出符合預期的結果至關重要。
提示工程(Prompt Engineering) 指的是透過開發與優化提示詞,與大型語言模型(LLM)互動,以引導其產生預期結果,而無需對模型本身進行修改。
提示工程可幫助研究人員提升 LLM 在處理複雜任務(如問答、數學推理)的能力,或優化生成式 AI 在特定應用場景的表現。透過合理設計與運用提示工程,可充分發揮大型語言模型潛力,讓其更準確地執行各種任務,提升應用效能。
提示工程的基礎要素
由於提示工程透過調整提示來達成目標,因此首要任務是了解提示的結構與撰寫方式。提示的格式多樣,但主要由四個關鍵要素組成:
- 指令:明確說明希望語言模型執行的特定任務或操作。
- 上下文:提供額外資訊或背景,以幫助模型更準確理解並生成回應。
- 輸入數據:包含用戶輸入的內容或問題,作為模型產出結果的依據。
- 輸出指示:指定期望的輸出類型或格式,以確保結果符合需求。
需要注意的是,提示的格式取決於具體任務類型,並非所有要素皆為必需。根據不同應用場景,可靈活選擇適當的要素來引導模型產生更精確的輸出。以下,我們透過一個案例來進一步說明:
提示工程的重要技術
零樣本提示
在前述示例中,我們使用的皆為零樣本提示,亦即不提供範例,而僅透過描述內容與期望結果來引導模型生成回應。
少樣本提示
雖然多數大型語言模型已能有效處理零樣本提示,但當結果未達預期時,可透過提供範例作為「上下文提示」,引導模型產出更精確的回應。
最常見的應用案例包括:
- 針對新詞進行解釋與造句
- 內容分類
- 情緒分析與判斷
然而,少樣本提示仍有其局限性,特別是在需要多重推理的問題上,例如算術運算與邏輯推理題,模型有時無法給出正確的推論。在這種情況下,「思維鏈提示」(Chain of Thought Prompting)便成為一項關鍵技術。
思維鏈提示(Chain of Thoughts Prompting)
Wei 等人(2022)提出了 思維鏈提示(Chain of Thoughts Prompting)概念,透過引入 中間推理步驟,提升大型語言模型的複雜推理能力。
此方法可結合 少樣本提示,特別適用於需要更高層次推理的任務。具體而言,它透過描述一系列 中間推理過程,由人工構建推理步驟,使模型學習這些邏輯推演,進而在 數學推理、常識推理、符號推理 等任務中獲得更優結果。
現在思維鏈提示以及邏輯訓練已經成爲大型語言模型訓練中的重點,包括各種高級學科知識訓練以及推理訓練,以提高模型的複雜推理能力。
Appen Prompt Engineering 服務
Appen 深耕 AI 數據服務 26 年,提供 Prompt Engineering 客製化服務,包括指令標註、指令泛化、COT(思維鏈)描述等,為您的大型語言模型部署提供全方位支援。如需了解更多,歡迎聯繫我們的專家,為您量身打造最佳解決方案。
Appen 提供全方位大型語言模型數據服務,包括數據集、模型評估與模型優化。同時,Appen 智能大模型開發平台與完整標註工具,助您快速部署大型語言模型應用。