低成本指令数据集构建： Self-Instruct

SELF-INSTRUCT的介绍

作用：SELF-INSTRUCT，该方法可以仅使用最少的人工标注，生成大量的用于指令调优的数据。
指令格式：一条指令数据集由instruction、input、output三个部分组成。需要注意的是insturction和input之间没有严格的区分。如以下两个例子是相同的。

# 例子1
instruction: "write an essay aboutschool safety"
input:""
output:"...."
# 例子2
instruction: "write an essay about thefollowing topic"
input:"school safety"
output:"...."

SELF-INSTRUCT的流程

SELF-INSTRUCT的流程框架图如下图，主要分为四个步骤。

SELF-INSTRUCT.png

第一步自动化指令生成，就是instruction部分的自动生成。
作者先人工手写了175个任务，每个任务包含1个指令和一个实例，称为种子任务池。

第一次基于LLM生成命令时，FewShot的8个示例命令都是人工手写的。
然后不断生成新的命令，prompt的fewshot每次都是采样6个手写instruction和2个以前LLM自动生成的instruction。

prompt模板如下：

您需要写出 30 个不同的任务指令。这些任务指令将在未来提供给 GPT 模型去完成解答。
以下是要求：
1. 尽量不要重复每条指令的动词，以最大限度地提高多样性。
2. 指令使用的语气和方法也应多样化。例如，您可以将问题式指令与命令式指令相结合。
3. 指令的类型应多样化，即应包括不同类型的任务，如开放式生成、分类、编辑等。
4. 语言类模型应该能够完成指令。例如，请勿生成“创建任何视觉或音频输出”的指令，请勿生成“在下午 5 点叫醒您或设置提醒”的指令，因为语言类模型无法执行任何操作。
5. 指令所使用的语言应为中文。
6. 指令应为 1 到 2 句话长。允许使用祈使句或疑问句。
这里是一些已有的指令示例，请模仿这些示例，按上述要求生成30个不同的指令。
示例：
任务1：请回答世界上人口最多的五个国家的名字和人口数量。
任务2：#省略了……#

步骤二分类任务识别
判断第一步生成的指令是否是一个分类任务。那什么是分类任务？论文中定义为“output的标签是一个有限的、小的标签集合的任务”。该步骤也是由LLM模型来判断，仍使用few-shot方式来实现——用种子任务集合中的12个分类任务指令和19个非分类任务指令作为few-shot的例子。
prompt模板如下：

以下任务可以被视为具有有限输出标签的分类任务吗？
任务：考虑到我的性格和工作，告诉我是否适合。
这是分类吗？是的

任务：举一个你必须运用幽默感的例子。
这是分类吗？不

任务：用适当的命名实体替换给定文本中的占位符。
这是分类吗？不

任务：返回此人的SSN编号。
这是分类吗？不

任务：检测Reddit帖子是否包含仇恨言论。
这是分类吗？是的
#省略其他示例
任务：{目标任务的指令}

步骤三实例生成
给定指令及其任务类别，为每个指令生成实例。根据指令是否是分类任务，采取不同的prompt模板。

（1）对于非分类任务，采用Input-firstApproach（输入优先），也就是先让LLM根据指令先生成一个输入(input)，再生成对应的输出(output)（如果任务不需要input，就直接生成结果）。

对应的prompt模板如下：

为以下任务举个例子，尽可能生成多个示例。如果任务不需要额外的输入，您可以直接生成输出。

任务：对给定的列表进行升序排序。
示例1
清单：[10、92、2、5、-4、92、5、101]
输出：[-4,2,5,5,10,92,92,101]
示例2
列表：[9.99、10、-5、-1000、5e6、999]
输出：[-1000、-5、9.99、10、999、5e6]

任务：哪些运动最适合在家减少腹部脂肪？
输出：
-躺着的腿抬高
-腿进出
-木板
-侧板
-仰卧起坐

任务：提取段落中的所有国家名称，用逗号分隔。
段落：《诺博士》是英国作家伊恩·弗莱明的第六部小说，讲述了他的英国特勤局特工詹姆斯·邦德的故事。这本书写于牙买加弗莱明的Goldeneye庄园，1958年由乔纳森·凯普在英国首次出版。在小说中，邦德调查了两名一直在调查No.博士的军情六处特工在牙买加失踪的事件。邦德前往No的加勒比海岛屿，遇到了在那里收集贝壳的Honeychile Rider。他们被捕后被带到一座雕刻在山上的豪华设施。诺医生是一位德国传教士和一位中国妇女的儿子，他的性格受到了萨克斯·罗默傅满故事的影响。《诺博士》是弗莱明的第一部在英国受到广泛负面评论的小说，但在美国却受到了更积极的评价。
输出：英语、英国、牙买加、英国、德语、中文、英国、美国。

任务：将85华氏度转换为摄氏度。
输出：85°F=29.44°C

任务：｛目标任务的说明｝

（2）对于分类任务，采用Output-first Approach（输出优先），先生成一个可能的类别标签，再在类别标签的条件下生成input。
prompt模板如下：

根据给定的分类任务和类别标签，请生成与每个类标签对应的输入。如果任务不需要输入，只需生成可能的类别标签。
以下是一些示例：

任务：将句子的情感分为积极、消极或混合。
类别标签：混合
输入：我喜欢这家餐厅的味道，但他们的服务太慢了。
类别标签：积极
输入：我今天过得很愉快。天气很好，我和朋友和家人在一起。
类别标签：消极
输入：我对最新的超级英雄电影真的很失望。我不会向任何人推荐它。

任务：给定一个对话，分类用户是否对服务满意。你应该回答“满意”或“不满意”。
类别标签：满意
输入：
-客服：谢谢你的反馈。我们将在未来努力改进我们的服务。
-顾客：我对你们提供的服务很满意。谢谢你的帮助。
类别标签：不满意
输入：
-客服：很抱歉，我们将为您取消订单，您将在7个工作日内获得退款。
-顾客：哦，那太久了。我希望你对此采取更快的行动。

任务：回答以下多项选择题。选择A、B、C或D作为最终答案。
类别标签：C
输入：问：德国的首都是哪里？A.伦敦 B.巴黎 C.柏林 D.罗马
类别标签：D 
输入：问：太阳系中最大的行星是什么？A） 地球 B） 土星 C） 火星 D） 木星

任务：告诉我给定列表的第一个数字。
类别标签：1
输入：列表：1、2、3
类别标签：2
输入：列表：2、9、10

任务：｛目标任务的说明｝

步骤四过滤和后处理

指令过滤：为了保证指令的多样性，一个指令只有与任务池中已有的指令的ROUGE-L（相似度）小于0.7才会被考虑加入到任务池，同时过滤掉包含一些特殊词（如image/picture/graph等）的生成指令。
实例过滤：对于生成的实例，过滤掉重复的、过滤掉相同input不同output的实例。并用启发式方法识别和过滤掉一些实例，比如是否太长、是否太短、输出是输入的重复等。

步骤五检查自动生成的指令、输入、输出是否满足要求
为了验证生成数据的质量，随机从生成的样本中抽取200个任务（包含指令、输入和输出），然后让一个专家标注员来判断实例是否正确，最后统计合格率。

生成的指令是否描述了一个清晰有效的任务？
生成的输入是否与指令相匹配？
生成的输出是否正确回答了任务或指令？
整套指令、输入、输出都是合格的？

人面猴
序言：七十年代末，一起剥皮案震惊了整个滨河市，随后出现的几起案子，更是在滨河造成了极大的恐慌，老刑警刘岩，带你破解...
沈念sama阅读 219,589评论 6赞 508
死咒
序言：滨河连续发生了三起死亡事件，死亡现场离奇诡异，居然都是意外死亡，警方通过查阅死者的电脑和手机，发现死者居然都...
沈念sama阅读 93,615评论 3赞 396
救了他两次的神仙让他今天三更去死
文/潘晓璐我一进店门，熙熙楼的掌柜王于贵愁眉苦脸地迎上来，“玉大人，你说我怎么就摊上这事。” “怎么了？”我有些...
开封第一讲书人阅读 165,933评论 0赞 356
道士缉凶录：失踪的卖姜人
文/不坏的土叔我叫张陵，是天一观的道长。经常有香客问我，道长，这世上最难降的妖魔是什么？我笑而不...
开封第一讲书人阅读 58,976评论 1赞 295
港岛之恋（遗憾婚礼）
正文为了忘掉前任，我火速办了婚礼，结果婚礼上，老公的妹妹穿的比我还像新娘。我一直安慰自己，他们只是感情好，可当我...
茶点故事阅读 67,999评论 6赞 393
恶毒庶女顶嫁案：这布局不是一般人想出来的
文/花漫我一把揭开白布。她就那样静静地躺着，像睡着了一般。火红的嫁衣衬着肌肤如雪。梳的纹丝不乱的头发上，一...
开封第一讲书人阅读 51,775评论 1赞 307
城市分裂传说
那天，我揣着相机与录音，去河边找鬼。笑死，一个胖子当着我的面吹牛，可吹牛的内容都是我干的。我是一名探鬼主播，决...
沈念sama阅读 40,474评论 3赞 420
双鸳鸯连环套：你想象不到人心有多黑
文/苍兰香墨我猛地睁开眼，长吁一口气：“原来是场噩梦啊……” “哼！你这毒妇竟也来了？” 一声冷哼从身侧响起，我...
开封第一讲书人阅读 39,359评论 0赞 276
万荣杀人案实录
序言：老挝万荣一对情侣失踪，失踪者是张志新（化名）和其女友刘颖，没想到半个月后，有当地人在树林里发现了一具尸体，经...
沈念sama阅读 45,854评论 1赞 317
护林员之死
正文独居荒郊野岭守林人离奇死亡，尸身上长有42处带血的脓包…… 初始之章·张勋以下内容为张勋视角年9月15日...
茶点故事阅读 38,007评论 3赞 338
白月光启示录
正文我和宋清朗相恋三年，在试婚纱的时候发现自己被绿了。大学时的朋友给我发了我未婚夫和他白月光在一起吃饭的照片。...
茶点故事阅读 40,146评论 1赞 351
活死人
序言：一个原本活蹦乱跳的男人离奇死亡，死状恐怖，灵堂内的尸体忽然破棺而出，到底是诈尸还是另有隐情，我是刑警宁泽，带...
沈念sama阅读 35,826评论 5赞 346
日本核电站爆炸内幕
正文年R本政府宣布，位于F岛的核电站，受9级特大地震影响，放射性物质发生泄漏。R本人自食恶果不足惜，却给世界环境...
茶点故事阅读 41,484评论 3赞 331
男人毒药：我在死后第九天来索命
文/蒙蒙一、第九天我趴在偏房一处隐蔽的房顶上张望。院中可真热闹，春花似锦、人声如沸。这庄子的主人今日做“春日...
开封第一讲书人阅读 32,029评论 0赞 22
一桩弑父案，背后竟有这般阴谋
文/苍兰香墨我抬头看了看天上的太阳。三九已至，却和暖如春，着一层夹袄步出监牢的瞬间，已是汗流浃背。一阵脚步声响...
开封第一讲书人阅读 33,153评论 1赞 272
情欲美人皮
我被黑心中介骗来泰国打工，没想到刚下飞机就差点儿被人妖公主榨干…… 1. 我叫王不留，地道东北人。一个月前我还...
沈念sama阅读 48,420评论 3赞 373
代替公主和亲
正文我出身青楼，却偏偏与公主长得像，于是被迫代替她去往敌国和亲。传闻我的和亲对象是个残疾皇子，可洞房花烛夜当晚...
茶点故事阅读 45,107评论 2赞 356

低成本指令数据集构建： Self-Instruct

SELF-INSTRUCT的介绍

SELF-INSTRUCT的流程

推荐阅读更多精彩内容