提示工程是一門相對較新的學科，用于開發和優化提示，以有效地將語言模型(LM)用于各種應用和研究主題。提示工程技能有助于更好地理解大型語言模型(LLM)的能力和局限性。 **研究人員使用prompt engineering來提高LLM在廣泛的常見和復雜任務上的能力，如問答和算術推理。**開發人員使用提示工程來設計與LLM和其他工具交互的健壯和有效的提示技術。提示工程不僅僅是設計和開發提示。它包含了對與LLM交互和開發有用的廣泛技能和技術。這是接口、構建和理解llm功能的一項重要技能。您可以使用prompt engineering來提高llm的安全性并構建新的功能，例如用領域知識和外部工具增強LLM。由于對與LLM一起開發的高度興趣，我們創建了這個新的prompt工程指南，其中包含所有最新的論文、學習指南、模型、講座、參考資料、新的LLM功能和與prompt工程相關的工具。視頻：

地址：//github.com/dair-ai/Prompt-Engineering-Guide

1. 引言

提示工程是一門相對較新的學科，用于開發和優化提示，以有效地將語言模型(LM)用于各種應用和研究主題。提示工程技能有助于更好地理解大型語言模型(LLM)的能力和局限性。研究人員使用prompt engineering來提高LLM在廣泛的常見和復雜任務上的能力，如問答和算術推理。開發人員使用提示工程來設計與LLM和其他工具交互的魯棒和有效的提示技術。本指南涵蓋了提示的基礎知識，對如何使用提示來交互和指示大型語言模型(LLM)提供了一個粗略的想法。 LLM設置

在處理提示時，您將通過API或直接與LLM交互。您可以配置一些參數以獲得不同的提示結果。 Temperature ——簡而言之，Temperature 越低，結果越確定，因為總是選擇可能性最高的下一個token。升高的Temperature可能導致更多的隨機性，鼓勵更多多樣化或創造性的輸出。我們實際上是在增加其他可能token的權重。在應用方面，我們可能希望對基于事實的QA等任務使用較低的Temperature，以鼓勵更事實和更簡潔的回答。對于詩歌生成或其他創造性任務，提高Temperature可能是有益的。 Top_p -類似地，使用Top_p(一種稱為核采樣的Temperature采樣技術)，您可以控制模型生成響應的確定性程度。如果你正在尋找準確和事實的答案，請保持這個數字較低。如果您正在尋找更多樣化的響應，請增加到更高的值。一般的建議是改變其中一個，而不是兩個都改變。在開始使用一些基本示例之前，請記住，您的結果可能會因您使用的LLM版本而有所不同。 提示的基礎知識

提示的元素隨著我們介紹提示工程可能提供的越來越多的示例和應用程序，您將注意到有一些組成提示的元素。提示(prompt)可以包含以下任何一個組件。 * 指令(Instruction):希望模型執行的特定任務或指令 * 上下文 context ——可以包含外部信息或額外的上下文，這些信息可以引導模型做出更好的響應 * 輸入數據——是我們感興趣的輸入或問題 * 輸出指示器 Indicator :表示輸出的類型或格式。

提示并不需要所有組件，其格式取決于當前的任務。我們將在接下來的指南中接觸到更多具體的例子。 設計提示的一般技巧

提示示例

在前一節中，我們介紹并給出了如何提示LLMs的基本示例。在本節中，我們將提供更多示例，說明如何使用提示來實現不同的任務，并介紹其中的關鍵概念。通常，學習概念的最好方法是通過示例。下面我們將介紹幾個示例，說明如何使用精心設計的提示來執行不同類型的任務。主題: * 文本摘要 * 信息提取 * 問題回答 * 文本分類 * 談話 * 代碼生成 * 推理

2. 提示技術

在這一點上，很明顯，改進提示有助于在不同的任務上獲得更好的結果。這就是prompt engineering背后的全部思想。雖然基本的例子很有趣，但在本節中，我們將介紹更高級的提示工程技術，使我們能夠實現更復雜和有趣的任務。 * **Zero-shot Prompting **

**Few-shot Prompting **

**Chain-of-Thought Prompting **

**Self-Consistency **

**Generate Knowledge Prompting **

**Automatic Prompt Engineer **

**Active-Prompt **

**Directional Stimulus Prompting **

**ReAct **

**Multimodal CoT **

Graph Prompting

3. 提示應用

Program-Aided Language Models * Generating Data

4. 模型

ChatGPT

在本節中，我們將介紹ChatGPT的最新提示工程技術，包括提示、應用、限制、論文和額外的閱讀材料。主題:

ChatGPT介紹 * 回顧對話任務與ChatGPT的對話 * Python的筆記本 ChatGPT是OpenAI訓練的一種可以進行對話交互的新模型。該模型被訓練成遵循提示中的指示，在對話的上下文中提供適當的響應。ChatGPT可以幫助回答問題、建議食譜、以某種風格寫歌詞、生成代碼等等。

ChatGPT使用來自人類反饋的強化學習(RLHF)進行訓練。雖然這個模型比之前的GPT迭代更有能力(也經過訓練以減少有害和不真實的輸出)，但它仍然有局限性。讓我們通過具體的例子來介紹一些功能和限制。你可以在這里使用ChatGPT的研究預覽，但對于下面的示例，我們將使用OpenAI Playground上的聊天模式。 * GPT-4 在本節中，我們將介紹GPT-4最新的prompt工程技術，包括提示、應用、限制和其他閱讀材料。

GPT-4介紹最近，OpenAI發布了GPT-4，這是一個大型多模態模型，可以接受圖像和文本輸入并發出文本輸出。它在各種專業和學術基準上實現了人類水平的表現。 書冊：

課件：

付費5元查看完整內容

相關內容

ChatGPT

關注 257

ChatGPT（全名：Chat Generative Pre-trained Transformer），美國OpenAI 研發的聊天機器人程序 [1] ，于2022年11月30日發布。ChatGPT是人工智能技術驅動的自然語言處理工具，它能夠通過學習和理解人類的語言來進行對話，還能根據聊天的上下文進行互動，真正像人類一樣來聊天交流，甚至能完成撰寫郵件、視頻腳本、文案、翻譯、代碼，寫論文任務。 [1] //openai.com/blog/chatgpt/

ChatGPT · 大模型 · 提示學習 · 綜述論文 · GPT-3 ·

2023 年 5 月 6 日

[付費5元查看完整內容]ChatGPT背后“推理”如何做？浙大等最新《基于語言模型提示的推理》綜述，闡述大模型提示推理機制與方法體系

專知會員服務

專知，提供專業可信的知識分發服務，讓認知協作更快更好！

作為解決復雜問題的基本能力，推理可以為各種實際應用提供后端支持，如醫學診斷、談判等。本文對語言模型提示推理的前沿研究進行了全面概述。我們介紹了研究成果的對比和總結，并為初學者提供了系統性的資源。我們還討論了這種推理能力出現的潛在原因，并強調了未來研究的方向。

1. 引言

推理能力是人類智能的核心，然而在自然語言處理（NLP）領域，現代神經網絡很難從所告知或已知的信息中進行推理（Duan 等，2020；Wang 等，2021；Bhargava 和 Ng，2022）。幸運的是，zhe（Brown 等，2020；Chen 等，2021；Chowdhery 等，2022），擴大語言模型（LMs）的規模已經被證明可以賦予一系列推理能力，如算術推理（Wang 等，2022e；Lewkowycz 等，2022）、常識推理（Jung 等，2022；Liu 等，2022b）和符號推理（Zhou 等，2023；Khot 等，2023）。如圖 1 所示，這種能力可以通過提示策略（Liu 等，2022d）（如思維鏈提示（CoT）（Wei 等，2022b），生成知識提示（Liu 等，2022c））來解鎖，從而大大縮小人類與機器智能之間的差距。同樣，NLP領域有大量的工作被提出；然而，這些方法分散在各種任務中，并未得到系統的回顧和分析。

本綜述組織：在本文中，我們進行了第一次關于語言模型提示推理的最近進展調查。我們首先介紹這個方向的一些初步內容（§2），然后建議按照分類法組織相關工作（§3）。我們進一步提供深入的比較和討論以獲得洞察力（§4）。為了方便對這個領域感興趣的初學者，我們強調了一些開放資源（§5）以及潛在的未來發展方向（§6）。

為了提高語言模型提示的推理能力，研究主要有兩個分支。第一個分支專注于優化提示推理策略，如圖 2 所示，包括提示工程（§3.1.1）、過程優化（§3.1.2）和外部引擎（§3.1.3）。

在提示工程（§3.1.1）中，許多方法試圖提高提示 T 的質量，我們稱這些工作為單階段方法；而其他方法在每個推理階段將 ci 添加到（T ，Q）的上下文中，或為每個 ci 設計特定的 Tci ，我們將這些方法視為多階段方法。需要注意的是，這里的一個階段是指一個輸入輸出過程。對于過程優化（§3.1.2），最簡單的方法是引入帶有參數θ的優化器，用于在生成A時校準C，我們稱這些工作為自優化方法。另一些方法嘗試獲得多個過程來得到最終的答案組合，我們將這些工作視為集成優化方法。此外，整個優化過程可以通過對生成的三元組（Q，C，A）進行微調 pLM 迭代地集成，這被視為迭代優化方法。此外，一些工作利用外部推理引擎（§3.1.3）生成 T ，直接執行 C 或通過在 C 中植入工具 API 調用進行推理。研究的第二個分支重點關注提示的知識增強。需要注意的是，LM 中豐富的隱式“模型知識”（Han等人，2021）可以生成知識或基于知識的提示 T（§3.2.1）。同時，外部資源中的顯式知識也可以被利用并檢索為知識性提示，以增強推理（§3.2.2）。

3. 方法體系

在本文中，我們調研了現有的基于語言模型提示的推理方法，并將它們歸類為策略增強推理（§3.1）和知識增強推理（§3.2）。如圖2所示，我們根據不同方法的獨特特征進一步細化它們。

3.1 策略增強推理

這方面工作的主要目的是設計更好的推理策略，具體體現在提示工程(§3.1.1)、流程優化(§3.1.2)和外部引擎(§3.1.3)中。

3.1.1提示工程

一種改進提示推理的直觀方法是提示工程。如圖3所示，我們根據提示階段的數量將這種方法分為單階段提示和多階段提示。

3.1.2 流程優化

自然語言理據(Ling et al.， 2017a)，也稱為CoT中的推理過程，在CoT提示中起著至關重要的作用(Ye and Durrett, 2022;Lampinen等人，2022;Min et al.， 2022)。推理過程的一致性(Wang et al.， 2022e)和推理步驟之間的連續性(Li et al.， 2022d)都會影響最終答案的準確性。直觀地，如圖4所示，我們將這一行方法分為三種類型，即自優化、集成優化和迭代優化。

3.1.3 外部引擎

在LM提示下進行推理時，模型應具有語義理解(如問題)和復雜推理(如通過生成推理過程)的能力;然而，我們不能同時擁有魚和熊掌(Hendrycks等人，2021;Nogueira等人，2021;Lewkowycz等人，2022)。為了打破這個障礙，外部推理引擎可以幫助語言模型(見圖5)。

3.2 知識增強推理

正如Manning(2022)所指出的，知識在AI推理系統中起著至關重要的作用。知識增強方法旨在用隱式(§3.2.1)或顯式(§3.2.2)知識提示語言模型，以協助推理(見圖6)。

**3.2.1 隱式知識 **

研究人員已經證明，語言模型中包含大量的隱式知識（Davison等人，2019；Petroni等人，2019；Jiang等人，2020）。以下工作試圖將這種“模型知識”引入作為知識提示進行推理。劉等人（2022c）使用少量提示的 GPT-3（Brown 等人，2020）生成知識并提示下游 LM。劉等人（2022b）借助強化學習（Schulman等人，2017）進一步校準知識。與在知識生成階段使用少量提示的方法不同，孫等人（2022）提出了一種兩階段生成提示，其中還包括答案生成提示。其他工作（李等人，2022b；王等人，2023；Shridhar等人，2022；Magister等人，2022；何等人，2022）遵循知識蒸餾，通過提示更大的 LM 生成推理樣本并教授較小的 LM。

3.2.2顯性知識

盡管大型語言模型已顯示出強大的生成能力(Wiegreffe等人，2022;Li等人，2022b;Wang et al.， 2023)，他們仍然有幻覺事實的傾向(Rohrbach等人，2018)和產生不一致的知識(Liu et al.， 2022b)。最近的工作表明，在上下文學習中檢索提示是取得良好性能的一種很好的方法(Liu等人，2022a;Rubin等人，2022)。由于常用檢索方法在度量結構化信息相似性方面的不穩定性，Lu等人(2023b)提出了一種基于策略梯度策略的動態提示檢索方法，無需暴力搜索。SU等人(2023)制定了一個選擇性的標注框架，以避免對大型標注檢索語料庫的需求。He et al.(2023)根據CoT的推理步驟檢索相關知識，以提供更可靠的解釋。Trivedi等人(2022)通過持久檢索wiki文檔來增強CoT提示，用于需要復雜的多步驟推理的開放域知識密集型任務。

4 比較與討論

表1顯示了不同方法的四種比較范圍。圖7進一步說明了不同規模的語言模型在算術推理的GSM8K (Cobbe等人，2021)上的性能比較。常識推理基準的類似結果見附錄A.3。模型規模較大的語言模型包含更多用于推理的隱性知識(Liang等人，2022b)。對代碼分支進行預訓練，不僅可以增強代碼生成/理解能力，還可以激發CoT的推理能力。.輸入上下文中包含的高質量推理依據是LM提示推理的關鍵。基于語言模型提示的推理分類。

5. 未來的發展方向

我們列出了一些潛在的方向如下:

推理的理論原理。高效的推理。魯棒的、可靠的和可解釋的推理多模態(交互式)推理。可泛化(真)推理。

6. 結論

本文對語言模型提示推理進行了綜述，包括全面的比較，以及幾個研究方向。展望未來，來自NLP和其他領域的方法之間將有更有效的協同作用，并希望復雜和高效的LM提示模型將越來越多地為提高推理性能做出貢獻。

付費5元查看完整內容

ChatGPT · 提示工程 · 書籍 ·

2023 年 5 月 1 日

[付費5元查看完整內容]【2023新書】CHATGPT提示掌握:掌握有效提示的完整指南, 106頁pdf

專知會員服務

專知，提供專業可信的知識分發服務，讓認知協作更快更好！

歡迎來到“ChatGPT提示的掌握:制作清晰有效提示的指南”!在這個全面的指南中，你將了解關于制作清晰有效的ChatGPT提示，以推動參與和信息豐富的對話的一切。無論你是聊天新手還是經驗豐富的ChatGPT用戶，本書對每個人都有幫助。從理解有效提示的原則到掌握構建清晰簡潔提示的藝術，您將獲得將ChatGPT對話帶到下一個層次所需的技能和知識。想了解更多… 在這本ChatGPT的書中，你會發現: * 對ChatGPT有深入的了解 * 使用ChatGPT提高制作清晰有效提示的技能 * 掌握ChatGPT提示的藝術。 * 一步一步的指導和實際的例子 * 越來越多的提示

付費5元查看完整內容

提示工程 · Andrew Ng · ChatGPT ·

2023 年 4 月 28 日

[付費5元查看完整內容]【吳恩達新課程】ChatGPT提示工程，ChatGPT Prompt Engineering for Developers

專知會員服務

專知，提供專業可信的知識分發服務，讓認知協作更快更好！

//learn.deeplearning.ai/chatgpt-prompt-eng/lesson/1/introduction

在ChatGPT Prompt Engineering for Developers中，您將學習如何使用大型語言模型(LLM)快速構建新的和強大的應用程序。使用OpenAI API，你將能夠快速構建學習創新和創造價值的能力，這些創新和創造價值的方式在以前成本高昂、技術含量高或根本不可能實現。由Isa Fulford (OpenAI)和Andrew Ng (DeepLearning.AI)教授的這個短期課程將描述LLM如何工作，為prompt engineering提供最佳實踐，并展示LLM api如何在各種任務的應用程序中使用，包括:

總結(例如，為了簡潔而總結用戶評論)
推斷(例如，情感分類，主題提取)
轉換文本(例如，翻譯、拼寫和語法糾正)
擴展(例如，自動寫電子郵件)
此外，您將學習編寫有效提示的兩個關鍵原則，如何系統地設計良好的提示，并學習構建自定義聊天機器人。

所有的概念都有大量的例子來說明，你可以直接在我們的Jupyter notebook環境中使用prompt engineering獲得實踐經驗。

付費5元查看完整內容

大模型 · ChatGPT · 大型語言模型 ·

2023 年 4 月 27 日

[付費5元查看完整內容]大模型如何用好？亞馬遜最新《大型語言模型(LLMs)實踐：ChatGPT》綜述，全面概述LLM模型、數據、任務的實戰指南

專知會員服務

專知，提供專業可信的知識分發服務，讓認知協作更快更好！

本文為從事大型語言模型（LLMs）的實踐者和終端用戶提供了一份全面且實用的指南，以應用于下游自然語言處理（NLP）任務。我們從模型、數據和下游任務的角度對LLMs的使用進行了討論和分析。首先，我們對當前基于GPT和BERT風格的LLMs進行了介紹和簡要總結。接著，我們討論了預訓練數據、訓練數據和測試數據的影響。最重要的是，我們詳細討論了在各種自然語言處理任務中使用和不使用大型語言模型的情況，如知識密集型任務、傳統自然語言理解任務、自然語言生成任務、新興能力和針對特定任務的考慮因素。我們通過各種使用和不使用的案例來說明LLMs在現實場景中的實際應用和局限性。同時，我們試圖了解數據的重要性及與每個NLP任務相關的特定挑戰。此外，我們還探討了偶然偏差對LLMs的影響，并深入研究了其他關鍵考慮因素，如效率、成本和延遲，以確保全面了解在實踐中部署LLMs。本全面指南旨在為研究人員和實踐者提供有價值的見解和最佳實踐，以便成功地將這些模型應用于廣泛的NLP任務。關于LLMs實用指南資源的策劃清單，定期更新，可以在

//github.com/Mooler0410/LLMsPracticalGuide 找到

1. 引言

近年來，大型語言模型的快速發展正在徹底改變自然語言處理領域[12, 128, 131]。這些強大的模型在處理各種NLP任務方面表現出巨大潛力，從自然語言理解（NLU）到生成任務，甚至為人工通用智能（AGI）鋪平了道路。然而，有效且高效地利用這些模型需要對它們的能力和局限性以及NLP涉及的數據和任務有實際的了解。為了為從業者和終端用戶提供指導，本研究關注于在下游自然語言處理任務中與大型語言模型（LLMs）合作的實際方面。本指南旨在提供實用建議，說明為何在給定任務中選擇或不選擇LLMs，以及如何選擇最合適的LLM，考慮到諸如模型大小、計算需求以及領域特定預訓練模型的可用性等因素。從實際角度深入了解LLMs，因此，為從業者和終端用戶提供了成功利用LLMs處理自己的NLP任務所需的實用知識。

我們的工作結構如下。首先，我們通過討論最重要的模型，如 GPT 風格和 BERT 風格架構，簡要介紹了 LLM（大型語言模型）。接著，我們從數據的角度深入研究影響模型性能的關鍵因素，包括預訓練數據、訓練/調優數據和測試數據。最后且最重要的是，我們深入研究各種具體的 NLP 任務，為 LLM 在知識密集型任務、傳統 NLU 任務和生成任務的適用性提供見解，以及這些模型所具有的新興能力和面臨的現實挑戰。我們提供詳細的示例，突顯 LLM 在實踐中的成功案例和局限性。為了分析大型語言模型的能力，我們將它們與微調模型進行比較。目前，還沒有一個普遍認可的關于 LLM 和微調模型的定義。考慮到實用性，在我們的文章中，對它們的定義如下：LLM 是在大量數據集上進行預訓練，而不針對特定任務調優的龐大的語言模型；微調模型通常是較小的語言模型，它們也經過預訓練，然后在更小的特定任務數據集上進一步調優，以優化其在該任務上的性能。本文總結了使用 LLM 的以下主要實用指南：

自然語言理解。在面對分布之外的數據或非常少的訓練數據時，利用 LLM 的卓越泛化能力。 自然語言生成。利用 LLM 的能力為各種應用創建連貫、與上下文相關且高質量的文本。 知識密集型任務。利用 LLM 存儲的廣泛知識來處理需要特定領域專業知識或普遍世界知識的任務。 推理能力。理解并利用 LLM 的推理能力，以提高在各種情境下的決策和問題解決能力。

2 .模型實用指南

本節簡要介紹了最先進的大型語言模型（LLMs）。這些模型在訓練策略、模型架構和應用場景上有所不同。為了更清晰地了解LLM領域，我們將其分為兩類：編碼器-解碼器或僅編碼器的語言模型和僅解碼器的語言模型。在圖1中，我們展示了語言模型的詳細演變過程。從演化樹中，我們得出以下有趣的觀察：

a) 僅解碼器模型已逐漸主導了大型語言模型（LLMs）的發展。在LLMs發展的早期階段，僅解碼器模型并不像僅編碼器和編碼器-解碼器模型那樣受歡迎。然而，在2021年之后，隨著具有改變游戲規則的大型語言模型（如GPT-3）的引入，僅解碼器模型經歷了顯著的繁榮。同時，在BERT帶來的初步爆炸性增長之后，僅編碼器模型逐漸開始淡出人們的視線。

b) OpenAI始終保持著在LLM領域的領導地位，無論是現在還是可能的未來。其他公司和機構在開發與GPT-3和當前的GPT-4相媲美的模型方面，都在努力迎頭趕上OpenAI。這個領導地位可以歸因于OpenAI對其技術路徑的堅定承諾，即使最初并未得到廣泛認可。c) Meta在開源LLM方面做出了巨大貢獻，并推動了LLM的研究。在考慮到對開源社區的貢獻時，尤其是與LLM相關的貢獻，Meta是最慷慨的商業公司之一，因為Meta開發的所有LLM都是開源的。d) LLM呈現出封閉來源的趨勢。在LLM發展的早期階段（2020年之前），大多數模型都是開源的。然而，隨著GPT-3的推出，越來越多的公司選擇封閉源代碼模型，如PaLM、LaMDA和GPT-4。因此，學術研究人員在LLM訓練方面的實驗變得更加困難。因此，基于API的研究可能成為學術界的主導方法。e) 編碼器-解碼器模型仍具有潛力，因為這種類型的架構仍在積極探索中，而且大多數都是開源的。谷歌為開源編碼器-解碼器架構做出了實質性貢獻。然而，僅解碼器模型的靈活性和通用性似乎使得谷歌對這個方向的堅持變得前景不太明朗。

我們還簡要總結了表1中每種類型的特征和代表性LLM。

2.1 BERT風格語言模型: 編碼器-解碼器或僅編碼器由于自然語言數據很容易獲得，并且已提出了無監督訓練范式，以更好地利用超大型數據集，這激發了自然語言的無監督學習。一種常見的方法是在考慮上下文的同時預測句子中的掩碼詞。這種訓練范式被稱為掩碼語言模型。這種類型的訓練允許模型對單詞和它們所使用的上下文之間的關系有更深的理解。這些模型使用Transformer架構等技術在大量文本語料庫上進行訓練，并在許多NLP任務中取得了最先進的結果，如情感分析和命名實體識別。掩碼語言模型的著名例子包括BERT [28]， RoBERTa[65]和T5[84]。由于在廣泛的任務中取得了成功，MLMs已經成為自然語言處理領域的重要工具。

2.2 GPT風格的語言模型:僅解碼器雖然語言模型在架構中通常與任務無關，但這些方法需要對特定下游任務的數據集進行微調。研究人員發現，擴大語言模型的規模可以顯著提高少樣本甚至零樣本的性能[16]。獲得更好的少樣本和零顯示性能的最成功的模型是自回歸語言模型，它是通過給定前面的單詞在序列中生成下一個單詞來訓練的。這些模型已被廣泛用于文本生成和問答等下游任務。自回歸語言模型的例子包括GPT-3 [16]， OPT [126]， PaLM[22]和BLOOM[92]。改變游戲規則的GPT-3首次通過提示和上下文學習展示了合理的少樣本/零樣本性能，從而顯示了自回歸語言模型的優越性。還有一些模型，如CodeX[2]，針對特定任務(如代碼生成)進行了優化，用于金融領域的BloombergGPT[117]。最近的突破是ChatGPT，它專門針對對話任務改進了GPT-3，為各種現實世界的應用提供了更具交互性、連貫性和上下文感知的對話。

3 數據實用指南

在本節中，我們將討論數據在為下游任務選擇適當模型方面發揮的關鍵作用。數據對模型有效性的影響從預訓練階段開始，一直持續到訓練和推理階段。 (1)在面臨分布外數據的下游任務中，LLM的泛化能力比微調模型更好，如對抗性樣本和域偏移。(2)在處理有限的標注數據時，LLM比微調模型更可取，并且在有大量標注數據時，兩者都可以是合理的選擇，具體取決于特定的任務需求。(3)建議選擇在與下游任務類似的數據字段上預訓練的模型。

4 NLP任務實用指南

在本節中，我們詳細討論LLM在各種下游NLP任務中的用例和非用例以及相應的模型能力。在圖2中，我們將所有討論總結為一個決策流。它可以是面對任務時快速決定的指南。

5 其他注意事項

盡管LLM適用于各種下游任務，但還有一些其他因素需要考慮，如效率和可信性。對效率的討論包括LLM的訓練成本、推理延遲和參數有效的調優策略。對可信性的考察包括魯棒性和校準、公平性和偏差、潛在的虛假相關性以及LLM中的安全挑戰。

6 結論和未來的挑戰

大型語言模型的最新進展正在徹底改變自然語言處理領域。有效地使用LLM需要了解它們的能力和各種NLP任務的限制。本文為在下游NLP任務中使用LLM提供了實用指南。首先討論了一些突出的模型，如GPT風格和BERT風格的架構以及影響它們性能的因素。探討了將LLM用于下游任務，包括知識密集型任務、NLU和NLG任務，并提供了成功和局限性的具體例子。本實用指南提供了對LLM的見解和跨NLP任務利用LLM的最佳實踐。我們希望它能使研究人員和從業人員發揮他們的潛力，推動語言技術的創新。接下來，我們分析了LLM未來面臨的挑戰:

在真實世界的“數據集”上評估所提出的模型。現有的深度學習模型主要在標準的學術數據集上進行評估，如ImageNet，這些數據集是深度學習發展的里程碑。然而，標準學術數據集的局限性并不能準確反映現實世界的性能。隨著模型的發展，至關重要的是要在反映現實世界需求的更多樣化、復雜和現實的數據上評估它們。評估真實世界“數據集”上的模型，除了學術上的，將提供更嚴格的測試它們的能力，以及更好地理解它們在真實世界應用中的有效性。這確保了模型能夠應對現實世界的挑戰并提供實際的解決方案。

模型對齊。確保日益強大和自主的模型與人類的價值觀和優先事項相一致至關重要。必須開發方法來保證這些模型的行為符合預期，并且不會針對不期望的結果進行優化。從模型開發過程的一開始就集成對齊技術至關重要。模型透明度和可解釋性也是評估和確保對齊的重要因素。此外，當我們展望未來時，一個更艱巨的挑戰正在逼近:調整超人系統。雖然這項任務目前超出了我們的需求，但重要的是要考慮和準備調整這些先進系統的潛在影響，因為它們可能提出獨特的復雜性和倫理問題[8,15]。

安全對齊。雖然人工智能存在風險的討論很重要，但需要具體的研究來保證先進人工智能的安全發展。這包括可解釋性、可擴展的監督和管理，以及模型屬性的形式化驗證技術。安全性不僅應該被視為一個附加組件，而且應該被視為模型構建過程中不可分割的一部分。

基于縮放的性能預測。隨著模型大小和復雜性的急劇增加，很難預測模型性能將如何變化。開發方法在擴展后或在開發新架構時更好地預測模型性能，將允許更有效地使用資源和加速進展。一些可能性包括:訓練一個較小的“種子”模型并推斷其增長，模擬規模增加或模型調整的影響，以及在不同規模上對模型迭代進行基準測試以構建縮放規律。這些可以在模型建立之前就了解模型的性能。

付費5元查看完整內容

ChatGPT · 書籍 · 人工智能 · GPT-4 · 提示工程 ·

2023 年 4 月 17 日

[付費5元查看完整內容]【2023新書】ChatGPT淘金熱: 從人工智能革命中獲利，掌握GPT-4的提示工程技術，200頁pdf

專知會員服務

專知，提供專業可信的知識分發服務，讓認知協作更快更好！

ChatGPT是OpenAI基于GPT-4架構創建的大型語言模型。它旨在理解和響應自然語言文本輸入，允許與機器進行對話。ChatGPT已經在大量數據上進行了訓練，使它能夠對廣泛的提示生成連貫和上下文適當的響應。憑借先進的自然語言處理能力，ChatGPT具有執行語言翻譯、文本摘要和問答等任務的能力。 ChatGPT作為一個大型語言模型，在教育、醫療、客服、娛樂等領域有著廣泛的應用。在這一部分中，我們將討論ChatGPT的一些最值得注意的應用，以及如何使用它們來增強各種行業。

聊天機器人和虛擬助手——ChatGPT最常見的應用之一是開發聊天機器人和虛擬助手。憑借其先進的自然語言處理能力，ChatGPT可以用來創建能夠理解并響應人類輸入的聊天機器人。這些聊天機器人可以用于各種行業，從客戶服務到醫療保健，幫助用戶查找信息、回答問題和解決問題。
語言翻譯- ChatGPT也可以用來開發語言翻譯工具。ChatGPT具有理解和生成多種語言文本的能力，可以用來創建翻譯工具，將文本從一種語言翻譯成另一種語言。這個應用程序在國際商務和外交行業中特別有用。 3.文本摘要——它也可以用于開發文本摘要工具，以幫助用戶快速而無困難地理解一篇長文本的要點。這個應用程序在新聞業中很有用，因為記者需要快速地為觀眾總結新聞故事。
問答——ChatGPT可以用來創建問答工具，幫助用戶快速輕松地查找信息。這些工具可以用于各種行業，從教育到客戶服務，幫助用戶找到問題的答案，而不必在長文檔或網站中搜索。
個性化內容生成——ChatGPT還可以根據用戶的興趣和偏好為用戶生成個性化內容。該應用程序可用于營銷和娛樂等行業，以創建更有可能吸引和留住用戶的定向廣告和內容。
教育——ChatGPT可以用于教育，為學生創造個性化的學習體驗。通過分析學生數據并生成個性化內容，ChatGPT可以幫助學生按照自己的節奏并以最適合他們學習風格的方式學習。
醫療保健——同樣，在醫療保健領域，ChatGPT可以幫助醫生和護士快速準確地診斷患者。ChatGPT可以通過分析患者數據和生成可能的診斷結果，幫助醫療保健專業人員做出更明智的決定，并提供更好的患者護理。
娛樂——ChatGPT還可以創建交互式娛樂體驗，例如聊天應用程序可以用于游戲和社交媒體行業，創建富有吸引力和沉浸感的用戶體驗。
客戶支持——ChatGPT可以以多種方式用于客戶服務

付費5元查看完整內容

ChatGPT · 書籍 · 提示學習 · 提示工程 ·

2023 年 4 月 12 日

[付費5元查看完整內容]如何向ChatGPT問問題？這本手冊《提問的藝術—讓ChatGPT給出高質量答案》，提示工程技術全面指南，52頁pdf

專知會員服務

專知，提供專業可信的知識分發服務，讓認知協作更快更好！

The Art of Asking ChatGPT 提問的藝術—讓ChatGPT給出高質量答案

ChatGPT回答的質量如何全靠Prompt輸入了，雖然GPT-3.5和GPT-4展現出來的能力差別很大，但是就輸入端講，你描述的越清晰，給AI的指令越準確，他提供的回答質量就越高，才有可能超越人類的生成質量，我常用的幾個技巧如下

Prompt需要包含完整的信息，并且盡量不要包含容易混淆的信息，這對輸出會產生干擾
告訴他做什么不要做什么，這個是在幫助AI限定生成內容的范圍，不僅可以提高內容質量，也有助于提升生成速度
給定AI一個角色，在專業場景下適用這種方法，給出他一些角色的提示，比如電影評論家、作者、面試官、代碼專家等等
要求Prompt給出推理過程，尤其在做邏輯題和數學相關題目的時候，比較實用
問題中加上例子，一般在難以描述清楚需求時可以用這種方式

Prompt的技巧非常多，如果你懶得記，也有一個經過實踐的萬能公式

Instruction（必須）： 指令，即你希望模型執行的具體任務。 Context（選填）： 背景信息，或者說是上下文信息，這可以引導模型做出更好的反應。 Input Data（選填）： 輸入數據，告知模型需要處理的數據。 Output Indicator（選填）： 輸出指示器，告知模型我們要輸出的類型或格式。

只要你按照這個框架寫 prompt ，模型返回的結果都不會差。當然，你在寫 prompt 的時候，并不一定要包含所有4個元素，而是可以根據自己的需求排列組合。