检索增强生成（RAG）：通过现实世界知识增强AI语言模型

教學

近年來，人工智能（AI）取得了巨大的進步，主要歸功於大型語言模型（LLM）。LLM非常擅長理解和生成類似人類的文本，它們催生了若干新工具，如進階聊天機械人及AI撰寫器。

雖然LLM擅長生成流暢且類似人類的文本，但它們在確保事實正確性方面有時會遇到困難。當準確性非常重要的時候，這可能會成為一個大問題

那麼，這個問題的解決方案是什麼？答案是搜救增強生成（RAG）。diy7>

RAG結合了如GPT等模型的強大功能，並增加了從外部數據庫、文章和內容尋找信息的能把力。這幫助AI生成的文本不僅僅是好寫作，而且在事實和脈絡上的正確性也有所提高。

通過結合生成文本的能把力和尋找並使用準確且相關信息的能把力，RAG為我們打開了許多新的可能性。它有助於弥合AI只寫文本和能使用實際知識的AI之間的差距。

在本文中，我們將近距離探討RAG，它是如何工作的，何處使用它，以及它可能會如何改變我們與AI未來的互動。

搜救增強生成（RAG）是什麼？

讓我們先來正式定義一下RAG:

取值加深生成 (RAG) 是一個 AI 框自己的人工智慧架构建大語言模型 (LLM) 通過它們與外部知識庫接起来。這个允许访问最新、准确的资料，提升其结果的相关性和事实准确性。

现在，让我们用简单的话来解释，以便容易理解。

过去两年我们都用过像ChatGPT的AI聊天机器人，能够回答我们的问题。这些是由大语言模型 (LLM) 提供动力，它们经过训练，建立在大量的网路内容/数据之上。它们在几乎任何主题上都能产生类似人类的文本。看起来它们完全能够回答我们所有的问题，但并非总是如此。它们有时分享的信息可能不准确，并且事实不正确。

这就是RAG发挥作用的地方。这是它的基本原理（简化版）：

你问一个问题。
RAG搜索一个精选的可靠信息知识库。
它检索相关信息。
它把这个信息传给LLM。
LLM利用这个准确的信息来回答你。

通过这个过程，回答有了准确信息的支撑。

傳統的 LLM 像 ChatGPT 可能會說：“通常，您可以攜帶一件最多 50 磅的托運行李和一件手提行李。但請向航空公司確認具體規定。” RAG 增強系統 會說：“對於 X 航空公司，經濟艙乘客可以攜帶一件 50 磅的托運行李和一件 17 磅的手提行李。商務艙則可以攜帶兩件 70 磅的行李。注意像運動器材這樣的特殊物品規定，並且在辦理登機時始終核實。”

你有注意到區別嗎？RAG 提供了針對實際航空公司政策的具體、準確資訊。總結來說，RAG 使這些系統在實際應用中更可靠和可信。這對於開發在現實世界中更可靠的 AI 系統非常重要。

RAG 的工作原理

現在我們對 RAG 有了初步了解，讓我們來了解一下它是如何工作的。首先，讓我們從一個簡單的架構圖開始。

RAG 的關鍵組件

從上面的架構圖中，可以看到在用戶提問和最終答案之間，有 3 個關鍵組件對 RAG 的運作至關重要。

知識庫
檢索器
生成器

現在，我們來逐一了解每個組件。

知識庫

這是存放所有文件、文章或數據的倉庫，可以參考來回答所有問題。這需要不斷更新新的相關信息，以便 responses 精準且用戶能夠獲得最相關和最新的信息。

從技術角夙，這通常使用向量數據庫如Pinecone、FAISS等來存放文字作為數值表現（嵌入），從而實現快速有效搜索。

检索器

這負責尋找與用戶問題相關的文件或數據。當問問題時，检索器迅速地在知識庫中尋找最相關的信息。

從技術角夙，這通常使用密集检索方法，如密集段落检索或BM25。這些方法將用戶問題轉換為與知識庫中使用的相同類型的數值表現，並將它們與相關信息匹配。

生成器

這負責生成與用戶問題相關且語境上连貫內容。它取自检索器的信息，並用來撰寫回答問題的回应。

從技術上手，這是由大規模語言模型（如 GPT-4 或開源選擇如 LLAMA 或 BERT）推動的。這些模型在巨量數據上進行訓練，能夠根據收到的輸入產生類似於人類的文本。

RAG 的益處與應用

既然我們已經了解 RAG 是什麼以及它是如何工作的，讓我們來探尋一下 RAG 所提供的益處以及它的應用。

RAG 的益處

知識更新

與只能依賴於訓練數據的傳統 AI 模型（如 ChatGPT）不同，RAG 系統可以存取並運用知識庫中最新最快的資訊。

提高準確性與減少幻覺

RAG 通過使用知識庫中的事实性、更新資訊來提高响应的準確性。這在很大程度上減少了他幻想問題 – 當 AI 生成更可信但錯誤的資訊的案例。

定制與专业化

公司可以通過使用專業知識庫以及建立 AI 助手來滿足他們特定的需求，這些 AI 助手在特定領域是專家。

透明度與可解釋性

RAG系統通常能提供其信息的源头，使用戶更容易理解信息来源、核验主張，並理解回應背后的思維。

可擴展性与效率

RAG允許高效地使用算術資源。代替不斷地重訓練大模型或建造新的模型，組織可以更新他们的知識庫，使AI系統更容易擴展和維護。

RAG的應用

客戶服務

RAG使客戶支持聊天机器人变得更聪明和更有帮助。这些聊天机器人可以访问知识库中最新的信息，并提供精确和有关上下文的答案。

个性化助手

公司可以创建定制的AI助手，可以访问他们独特和专有的数据。通过利用组织内部的文件，这些助手可以快速高效地回答员工的查询。

客户心声

组织可以使用RAG来分析，并从各种客户反馈渠道中提取有见地的洞察，以创建对客户体验、情感和需求的全面理解。这使他们能够迅速识别和解决关键问题，并根据完整的客户反馈情况做出基于数据的决策，不断根据客户反馈改进产品。

RAG的未來

RAG 已经成为人工智慧領域中的关键技术，結合了大語言模型與動態資訊擷取的能量。許多組織已經利用这一点並為其需求建立客製化解決方案。

当我们展望未來，RAG 將改變我們與資訊互動和作決定的方式。未來的 RAG 系統將：

具有更大的語境理解並提升个性化
超越文字，纳入圖像、音頻/視頻的多模态
具有實時知識庫更新
與許多工作日志无缝整合，以提高生產力和促進合作

結論

總結來說，RAG 將革新我們與 AI 和資訊互動的方式。通過縮小 AI 生成的內容與其事實準確性之間的差距，RAG 將為智能 AI 系統舖路，這些系統不僅更有能力，而且更準確、更值得信賴。隨著這一點繼續發展，我們與資訊的互動將比以往更加高效和準確。

Source:
https://dzone.com/articles/rag-enhancing-ai-language-models