一些gpt类的项目

模型类

stanford_alpaca : 用于训练斯坦福大学Alpaca模型的代码和文档,以及生成数据

https://github.com/tatsu-lab/stanford_alpaca

提供了代码和文档来训练Stanford的Alpaca模型,以及生成数据
基于transformers框架开发,支持多种预训练模型
使用PROMPT_DICT来定义不同任务的指令模板
使用smart_tokenizer_and_embedding_resize函数来调整词表和嵌入层的大小

llama.cpp : 将Facebook的LLaMA模型移植到C/C++

https://github.com/ggerganov/llama.cpp

llama.cpp是一个基于Meta的LLaMA模型(Large Language Model)的纯C/C++版本,用于模型推理。LLaMA模型是一个GPT-3级别的语言模型,可以在单个GPU上运行,并且可以在普通的笔记本电脑、手机和树莓派上运行。llama.cpp的量化实现基于作者的另外一个库——ggml,使用C/C++实现的机器学习模型中的tensor。

mlc-llm : 让每个人都可以在自己的设备上本地开发、优化和部署AI模型

https://github.com/mlc-ai/mlc-llm

mlc-llm是一个通用的解决方案,可以让任何语言模型在不同的硬件后端和原生应用上进行本地部署,同时提供了一个高效的框架,让每个人都可以根据自己的需求进一步优化模型性能。mlc-llm的目标是让每个人都能开发、优化和部署AI模型到每个人的设备上。

mlc-llm支持的平台包括:iPhone和Intel/ARM MacBooks上的Metal GPU;Windows和Linux上的AMD和NVIDIA GPU通过Vulkan;Windows和Linux上的NVIDIA GPU通过CUDA;浏览器上的WebGPU(通过伴生项目WebLLM)。

mlc-llm提供了一个可重复、系统化和可定制的工作流,让开发者和AI系统研究者能够用以生产力为中心、以Python为主的方式实现模型和优化。这种方法可以快速实验新的模型、新的想法和新的编译器通道,然后本地部署到目标设备上。

web-llm : 将大型语言模型和聊天功能带到Web浏览器中。一切都在浏览器内部运行,不需要服务器支持

https://github.com/mlc-ai/web-llm

web-llm是一个将大型语言模型和基于LLM的聊天机器人引入Web浏览器的项目。这个项目可以让每个人都能在浏览器上享受GPU加速的AI助手,并保护隐私。web-llm使用了WebGPU API,在浏览器内运行vicuna-7b-delta-v0模型。web-llm采用了机器学习编译(MLC)的关键技术,建立在开源生态系统的基础上,包括Hugging Face、来自LLaMA和Vicuna的模型变体、wasm和WebGPU;主要流程则建立在Apache TVM Unity之上。

alpaca-lora :在消费级硬件上对LLaMA进行指导调整

https://github.com/tloen/alpaca-lora

alpaca-lora是一个使用low-rank adaptation (LoRA)技术对Alpaca模型进行轻量化的项目。Alpaca模型是一个基于LLaMA 7B模型的聊天机器人,使用了Instruct数据集进行微调。LoRA技术是一种在冻结原模型参数的情况下,通过添加额外的低秩层并只训练这些层的参数来实现模型适应的方法 。

alpaca-lora的优点是可以在低成本和低资源的情况下,获得与Alpaca模型相当的效果,并且可以在MacBook、Google Colab、Raspberry Pi等设备上运行。alpaca-lora使用了Hugging Face的PEFT和bitsandbytes来加速微调过程,并提供了一个脚本来下载和推理基础模型和LoRA模型。

Chinese-LLaMA-Alpaca : 中文LLaMA&Alpaca大语言模型+本地CPU/GPU部署 (Chinese LLaMA & Alpaca LLMs)

https://github.com/ymcui/Chinese-LLaMA-Alpaca

  • 开源了经过中文文本数据预训练的中文LLaMA大模型
  • 开源了进一步经过指令精调的中文Alpaca大模型
  • 无缝衔接知名LLaMA量化和部署工具 llama.cpp
  • 提供了多种模型合并、转换、量化、推理、部署的方法和脚本
  • 提供了预训练脚本、评测样例、技术文档等资源

LMFlow : 一个可扩展的工具包,用于对大型基础模型进行微调和推理。适用于所有大型模型

https://github.com/OptimalScale/LMFlow

LMFlow是一个用于微调和推理大型基础模型的可扩展、方便和高效的工具箱,旨在为用户提供友好、快速和可靠的体验,让大型模型为所有人所用。它支持多种语言、多种模型结构、多种微调算法和多种任务类型。它还提供了在线服务、Colab示例和模型库等功能。

自动化工具类

AutoGPT : 一项试验性的开源尝试,旨在使GPT-4实现完全自主

https://github.com/Significant-Gravitas/Auto-GPT

Auto-GPT是一个实验性的开源应用程序,展示了GPT-4语言模型的能力。这个程序由GPT-4驱动,可以将LLM(Large Language Model)的“思想”链接起来,自动实现您设定的任何目标。作为GPT-4运行完全自主的第一个例子之一,Auto-GPT拓展了人工智能的可能性。

最后编辑于
©著作权归作者所有,转载或内容合作请联系作者
  • 序言:七十年代末,一起剥皮案震惊了整个滨河市,随后出现的几起案子,更是在滨河造成了极大的恐慌,老刑警刘岩,带你破解...
    沈念sama阅读 205,386评论 6 479
  • 序言:滨河连续发生了三起死亡事件,死亡现场离奇诡异,居然都是意外死亡,警方通过查阅死者的电脑和手机,发现死者居然都...
    沈念sama阅读 87,939评论 2 381
  • 文/潘晓璐 我一进店门,熙熙楼的掌柜王于贵愁眉苦脸地迎上来,“玉大人,你说我怎么就摊上这事。” “怎么了?”我有些...
    开封第一讲书人阅读 151,851评论 0 341
  • 文/不坏的土叔 我叫张陵,是天一观的道长。 经常有香客问我,道长,这世上最难降的妖魔是什么? 我笑而不...
    开封第一讲书人阅读 54,953评论 1 278
  • 正文 为了忘掉前任,我火速办了婚礼,结果婚礼上,老公的妹妹穿的比我还像新娘。我一直安慰自己,他们只是感情好,可当我...
    茶点故事阅读 63,971评论 5 369
  • 文/花漫 我一把揭开白布。 她就那样静静地躺着,像睡着了一般。 火红的嫁衣衬着肌肤如雪。 梳的纹丝不乱的头发上,一...
    开封第一讲书人阅读 48,784评论 1 283
  • 那天,我揣着相机与录音,去河边找鬼。 笑死,一个胖子当着我的面吹牛,可吹牛的内容都是我干的。 我是一名探鬼主播,决...
    沈念sama阅读 38,126评论 3 399
  • 文/苍兰香墨 我猛地睁开眼,长吁一口气:“原来是场噩梦啊……” “哼!你这毒妇竟也来了?” 一声冷哼从身侧响起,我...
    开封第一讲书人阅读 36,765评论 0 258
  • 序言:老挝万荣一对情侣失踪,失踪者是张志新(化名)和其女友刘颖,没想到半个月后,有当地人在树林里发现了一具尸体,经...
    沈念sama阅读 43,148评论 1 300
  • 正文 独居荒郊野岭守林人离奇死亡,尸身上长有42处带血的脓包…… 初始之章·张勋 以下内容为张勋视角 年9月15日...
    茶点故事阅读 35,744评论 2 323
  • 正文 我和宋清朗相恋三年,在试婚纱的时候发现自己被绿了。 大学时的朋友给我发了我未婚夫和他白月光在一起吃饭的照片。...
    茶点故事阅读 37,858评论 1 333
  • 序言:一个原本活蹦乱跳的男人离奇死亡,死状恐怖,灵堂内的尸体忽然破棺而出,到底是诈尸还是另有隐情,我是刑警宁泽,带...
    沈念sama阅读 33,479评论 4 322
  • 正文 年R本政府宣布,位于F岛的核电站,受9级特大地震影响,放射性物质发生泄漏。R本人自食恶果不足惜,却给世界环境...
    茶点故事阅读 39,080评论 3 307
  • 文/蒙蒙 一、第九天 我趴在偏房一处隐蔽的房顶上张望。 院中可真热闹,春花似锦、人声如沸。这庄子的主人今日做“春日...
    开封第一讲书人阅读 30,053评论 0 19
  • 文/苍兰香墨 我抬头看了看天上的太阳。三九已至,却和暖如春,着一层夹袄步出监牢的瞬间,已是汗流浃背。 一阵脚步声响...
    开封第一讲书人阅读 31,278评论 1 260
  • 我被黑心中介骗来泰国打工, 没想到刚下飞机就差点儿被人妖公主榨干…… 1. 我叫王不留,地道东北人。 一个月前我还...
    沈念sama阅读 45,245评论 2 352
  • 正文 我出身青楼,却偏偏与公主长得像,于是被迫代替她去往敌国和亲。 传闻我的和亲对象是个残疾皇子,可洞房花烛夜当晚...
    茶点故事阅读 42,590评论 2 343

推荐阅读更多精彩内容