【AI大模型】RAG和Embeddings

定义

RAG(Retrieval Augmented Generation),是指通过检索的方法来增强生成的模型架构。

背景

为什么要用 RAG,因为 LLM 的知识存在固有缺陷:

  • 知识不新:由于训练的时间和成本,大模型的知识往往是旧的,如 GPT-4 Turbo 的知识库截至时间是2023年4月
  • 知识不全:缺少专业的领域知识或私有的业务知识

实现

RAG 的本质就是检索 + 生成。


使用 Assistants API

OpenAI 在第一届 DevDay 推出的 Assistants API 内置了 RAG 功能,我们有必要先来了解一下:

  • 自动选择两种检索策略:
    1)针对小文件直接把文件内容添加到 Prompt 中
    2)对于大文件会通过向量检索
  • 支持文件最大 512M,格式包括.pdf, .md, .docx等

下面是简单的实现代码:

client = openai.OpenAI()

# 上传文件
file = client.files.create(
    file=open("llama2.pdf", "rb"),
    purpose='assistants'
)

# 创建 Assistant
assistant = client.beta.assistants.create(
    instructions="你是个问答机器人,你根据给定的知识回答用户问题。",
    model="gpt-4-1106-preview",
    tools=[{"type": "retrieval"}],
    file_ids=[file.id]
)

# 创建 Thread
thread = client.beta.threads.create()

# 创建 User Message
message = client.beta.threads.messages.create(
    thread_id=thread.id,
    role="user",
    content="Llama 2有多少参数"
)

# 创建 Run 实例,同时给 Assistant 提供指令
run = client.beta.threads.runs.create(
    thread_id=thread.id,
    assistant_id=assistant.id,
    instructions="请用中文回答用户的问题。",
)

# 等待 Run 完成
while run.status != "completed":
    run = client.beta.threads.runs.retrieve(
        thread_id=thread.id,
        run_id=run.id
    )

# 获取 Run 的结果
messages = client.beta.threads.messages.list(
    thread_id=thread.id
)

# 打印结果
for turn in reversed(messages.data):
    print(f"{turn.role.upper()}: "+turn.content[0].text.value)

可以看出,使用 Assistants API 实现 RAG 非常简单和方便,但是使用 Assistants API 也存在着一些局限:

  • 安全:我们的一些私有的业务知识不适合也不允许上传给 OpenAI
  • 成本:使用过程中所有的 token 都是要收费的
  • 能力:除了文件大小限制、国内访问限制等,通用服务都是黑盒子,可能无法实现个性化的定制需求

所以,我们还是有必要学习和了解 RAG 的实现原理以及 RAG 系统的自主搭建。

最后编辑于
©著作权归作者所有,转载或内容合作请联系作者
  • 序言:七十年代末,一起剥皮案震惊了整个滨河市,随后出现的几起案子,更是在滨河造成了极大的恐慌,老刑警刘岩,带你破解...
    沈念sama阅读 218,525评论 6 507
  • 序言:滨河连续发生了三起死亡事件,死亡现场离奇诡异,居然都是意外死亡,警方通过查阅死者的电脑和手机,发现死者居然都...
    沈念sama阅读 93,203评论 3 395
  • 文/潘晓璐 我一进店门,熙熙楼的掌柜王于贵愁眉苦脸地迎上来,“玉大人,你说我怎么就摊上这事。” “怎么了?”我有些...
    开封第一讲书人阅读 164,862评论 0 354
  • 文/不坏的土叔 我叫张陵,是天一观的道长。 经常有香客问我,道长,这世上最难降的妖魔是什么? 我笑而不...
    开封第一讲书人阅读 58,728评论 1 294
  • 正文 为了忘掉前任,我火速办了婚礼,结果婚礼上,老公的妹妹穿的比我还像新娘。我一直安慰自己,他们只是感情好,可当我...
    茶点故事阅读 67,743评论 6 392
  • 文/花漫 我一把揭开白布。 她就那样静静地躺着,像睡着了一般。 火红的嫁衣衬着肌肤如雪。 梳的纹丝不乱的头发上,一...
    开封第一讲书人阅读 51,590评论 1 305
  • 那天,我揣着相机与录音,去河边找鬼。 笑死,一个胖子当着我的面吹牛,可吹牛的内容都是我干的。 我是一名探鬼主播,决...
    沈念sama阅读 40,330评论 3 418
  • 文/苍兰香墨 我猛地睁开眼,长吁一口气:“原来是场噩梦啊……” “哼!你这毒妇竟也来了?” 一声冷哼从身侧响起,我...
    开封第一讲书人阅读 39,244评论 0 276
  • 序言:老挝万荣一对情侣失踪,失踪者是张志新(化名)和其女友刘颖,没想到半个月后,有当地人在树林里发现了一具尸体,经...
    沈念sama阅读 45,693评论 1 314
  • 正文 独居荒郊野岭守林人离奇死亡,尸身上长有42处带血的脓包…… 初始之章·张勋 以下内容为张勋视角 年9月15日...
    茶点故事阅读 37,885评论 3 336
  • 正文 我和宋清朗相恋三年,在试婚纱的时候发现自己被绿了。 大学时的朋友给我发了我未婚夫和他白月光在一起吃饭的照片。...
    茶点故事阅读 40,001评论 1 348
  • 序言:一个原本活蹦乱跳的男人离奇死亡,死状恐怖,灵堂内的尸体忽然破棺而出,到底是诈尸还是另有隐情,我是刑警宁泽,带...
    沈念sama阅读 35,723评论 5 346
  • 正文 年R本政府宣布,位于F岛的核电站,受9级特大地震影响,放射性物质发生泄漏。R本人自食恶果不足惜,却给世界环境...
    茶点故事阅读 41,343评论 3 330
  • 文/蒙蒙 一、第九天 我趴在偏房一处隐蔽的房顶上张望。 院中可真热闹,春花似锦、人声如沸。这庄子的主人今日做“春日...
    开封第一讲书人阅读 31,919评论 0 22
  • 文/苍兰香墨 我抬头看了看天上的太阳。三九已至,却和暖如春,着一层夹袄步出监牢的瞬间,已是汗流浃背。 一阵脚步声响...
    开封第一讲书人阅读 33,042评论 1 270
  • 我被黑心中介骗来泰国打工, 没想到刚下飞机就差点儿被人妖公主榨干…… 1. 我叫王不留,地道东北人。 一个月前我还...
    沈念sama阅读 48,191评论 3 370
  • 正文 我出身青楼,却偏偏与公主长得像,于是被迫代替她去往敌国和亲。 传闻我的和亲对象是个残疾皇子,可洞房花烛夜当晚...
    茶点故事阅读 44,955评论 2 355

推荐阅读更多精彩内容

  • 2023.10.17.达视津气象 朋友们早上好!今天是2023.10.17.星期二,农历九月初三的6:06,其干支...
    余則徐阅读 61评论 0 0
  • 向爷爷偷学音乐的趣事【往事回忆-刘本新】 学音乐,声乐和器乐,要有天赋。而天赋常被认为是灵性,天性。按照马克思的观...
    刘本新上海阅读 71评论 0 0
  • 中原焦点团队网络初级38期朱继红 坚持分享第304天,坚持读书打卡第304天,约练83次,观察员 50次,来访者2...
    紫色春天阅读 45评论 0 0
  • 京心❤️达:罗振 2023年2月28日 日精进 落地真经 严格就是爱,放纵既是害 油卡目标:17张、完成0张 产值...
    罗振京心达二店阅读 37评论 0 0
  • 爷仨——儿时冬天取暖儿 1.苏墩儿爸妈儿时冬天取暖。 20世纪50年代中后期,苏墩儿爸妈正值儿时。 冬天寒冷,他们...
    苏墩儿爷仨日记阅读 65评论 0 1