【AI大模型】RAG和Embeddings

定义

RAG(Retrieval Augmented Generation),是指通过检索的方法来增强生成的模型架构。

背景

为什么要用 RAG,因为 LLM 的知识存在固有缺陷:

  • 知识不新:由于训练的时间和成本,大模型的知识往往是旧的,如 GPT-4 Turbo 的知识库截至时间是2023年4月
  • 知识不全:缺少专业的领域知识或私有的业务知识

实现

RAG 的本质就是检索 + 生成。


使用 Assistants API

OpenAI 在第一届 DevDay 推出的 Assistants API 内置了 RAG 功能,我们有必要先来了解一下:

  • 自动选择两种检索策略:
    1)针对小文件直接把文件内容添加到 Prompt 中
    2)对于大文件会通过向量检索
  • 支持文件最大 512M,格式包括.pdf, .md, .docx等

下面是简单的实现代码:

client = openai.OpenAI()

# 上传文件
file = client.files.create(
    file=open("llama2.pdf", "rb"),
    purpose='assistants'
)

# 创建 Assistant
assistant = client.beta.assistants.create(
    instructions="你是个问答机器人,你根据给定的知识回答用户问题。",
    model="gpt-4-1106-preview",
    tools=[{"type": "retrieval"}],
    file_ids=[file.id]
)

# 创建 Thread
thread = client.beta.threads.create()

# 创建 User Message
message = client.beta.threads.messages.create(
    thread_id=thread.id,
    role="user",
    content="Llama 2有多少参数"
)

# 创建 Run 实例,同时给 Assistant 提供指令
run = client.beta.threads.runs.create(
    thread_id=thread.id,
    assistant_id=assistant.id,
    instructions="请用中文回答用户的问题。",
)

# 等待 Run 完成
while run.status != "completed":
    run = client.beta.threads.runs.retrieve(
        thread_id=thread.id,
        run_id=run.id
    )

# 获取 Run 的结果
messages = client.beta.threads.messages.list(
    thread_id=thread.id
)

# 打印结果
for turn in reversed(messages.data):
    print(f"{turn.role.upper()}: "+turn.content[0].text.value)

可以看出,使用 Assistants API 实现 RAG 非常简单和方便,但是使用 Assistants API 也存在着一些局限:

  • 安全:我们的一些私有的业务知识不适合也不允许上传给 OpenAI
  • 成本:使用过程中所有的 token 都是要收费的
  • 能力:除了文件大小限制、国内访问限制等,通用服务都是黑盒子,可能无法实现个性化的定制需求

所以,我们还是有必要学习和了解 RAG 的实现原理以及 RAG 系统的自主搭建。

最后编辑于
©著作权归作者所有,转载或内容合作请联系作者
平台声明:文章内容(如有图片或视频亦包括在内)由作者上传并发布,文章内容仅代表作者本人观点,简书系信息发布平台,仅提供信息存储服务。

推荐阅读更多精彩内容

  • 2023.10.17.达视津气象 朋友们早上好!今天是2023.10.17.星期二,农历九月初三的6:06,其干支...
    余則徐阅读 74评论 0 0
  • 向爷爷偷学音乐的趣事【往事回忆-刘本新】 学音乐,声乐和器乐,要有天赋。而天赋常被认为是灵性,天性。按照马克思的观...
    刘本新上海阅读 94评论 0 0
  • 中原焦点团队网络初级38期朱继红 坚持分享第304天,坚持读书打卡第304天,约练83次,观察员 50次,来访者2...
    紫色春天阅读 55评论 0 0
  • 京心❤️达:罗振 2023年2月28日 日精进 落地真经 严格就是爱,放纵既是害 油卡目标:17张、完成0张 产值...
    罗振京心达二店阅读 111评论 0 0
  • 爷仨——儿时冬天取暖儿 1.苏墩儿爸妈儿时冬天取暖。 20世纪50年代中后期,苏墩儿爸妈正值儿时。 冬天寒冷,他们...
    苏墩儿爷仨日记阅读 83评论 0 1