前言
大家好,我是阿光。
本专栏整理了《PyTorch深度学习项目实战100例》,内包含了各种不同的深度学习项目,包含项目原理以及源码,每一个项目实例都附带有完整的代码+数据集。
正在更新中~ ✨
🚨 我的项目环境:
- 平台:Windows10
- 语言环境:python3.7
- 编译器:PyCharm
- PyTorch版本:1.8.1
💥 项目专栏:【PyTorch深度学习项目实战100例】
一、文心大模型ERNIE-ViLG
AIGC(Artificial Intelligence Generated Content)登上舞台,以高效、精准、定制化等能力特征,重新定义了内容生产方式。
- 面向语言理解、语言生成等NLP场景文心大模型提供的ERNIE 3.0 系列模型,可以处理几乎所有自然语言理解和生成的任务。我们提供“零样本”的直接体验功能,您可以在页面体验预置的
写作文、写文案、写摘要、对对联、自由问答、写小说、补全文本等任务 - 面向跨模态
文生图场景的文心大模型提供ERNIE-ViLG提供支持文图生成,通过文本描述来生成相应图片的能力 - 面向开放域
对话的PLATO能力
目前ERNIE-ViLG的文心大模型API已经登入PaddleHub,只需通过4行代码就能实现强大的图文生成能力! 你可以输入一段文本描述以及生成风格,模型就会根据输入的内容自动创作出符合要求的图像。
PaddleHub旨在为开发者提供丰富的、高质量的、直接可用的预训练模型
- 【模型种类丰富】: 涵盖大模型、CV、NLP、Audio、Video、工业应用主流六大品类的 360+ 预训练模型,全部开源下载,离线可运行
- 【超低使用门槛】:无需深度学习背景、无需数据与训练过程,可快速使用AI模型
- 【一键模型快速预测】:通过一行命令行或者极简的Python API实现模型调用,可快速体验模型效果
- 【一键模型转服务化】:一行命令,搭建深度学习模型API服务化部署能力
- 【十行代码迁移学习】:十行代码完成图片分类、文本分类的迁移学习任务
- 【跨平台兼容性】:可运行于Linux、Windows、MacOS等多种操作系统
二、效果说明
效果一: 宇航员

效果二: 戴着眼镜的猫 迷幻艺术
[站外图片上传中...(image-3a7154-1670978867667)]
效果三: 云雾间有白色城堡,远处有花海,玄幻华丽 油画
[站外图片上传中...(image-bb374f-1670978867667)]
三、模型介绍与加载
文心ERNIE-ViLG参数规模达到100亿,是目前为止全球最大规模中文跨模态生成模型,在文本生成图像、图像描述等跨模态生成任务上效果全球领先,在图文生成领域MS-COCO、COCO-CN、AIC-ICC等数据集上取得最好效果。你可以输入一段文本描述以及生成风格,模型就会根据输入的内容自动创作出符合要求的图像。
import paddlehub as hub
from docarray import DocumentArray, Document
ernie_vilg_module = hub.Module(name='ernie_vilg')
四、模型生成说明
result = erniv_vilg_module.generate_image(text_prompts=text_prompts, style=style, topk=6, output_dir='./output')
参数
- text_prompts(str): 输入的语句,描述想要生成的
图像的内容。 - style(Optional[str]): 生成
图像的风格,当前支持'油画','水彩','粉笔画','卡通','儿童画','蜡笔画'。 - topk(Optional[int]): 保存前多少张图,最多保存10张。
- output_dir(Optional[str]): 保存输出图像的目录,默认为"ernievilg_output"。
返回
- images(List(PIL.Image)): 返回生成的所有图像列表,PIL的Image格式。
五、Prompt 设计原则
- text_prompts:图像生成内容
- style:图像风格
古风|油画|水彩画|卡通画|二次元|浮世绘|蒸汽波艺术|low poly|像素风格|概念艺术|未来主义|赛博朋克|写实风格|洛丽塔风格|巴洛克风格|超现实主义
例如text_prompts:"山水,亭子,动物"
style:"油画"

六、项目源码
【PyTorch深度学习项目实战100例】—— 使用文心大模型ERNIE-ViLG生成图片 | 第1例_咕 嘟的博客-CSDN博客_ernie-vilg