随着深度学习的崛起, Hugging Face 如今已非常流行,对于什么是Hugging Face,以及它有什么能力,很多人可能并不清楚,本文就详细的来介绍一下,后续还会对如何使用Hugging Face提供的模型库,做详细的分析。
Hugging Face Hub
Hugging Face Hub 可以说是 Hugging Face 提供的最核心的能力了,它实际上可以理解为机器学习领域的 Github,目的是为了发挥社区的力量,让AI或Machine Learning,发展的更快更好!
截止2024年7月,Hugging Face Hub 上已经拥有了120k+ models,20k+ datasets,50k+的Demo应用。它是一个中心的仓库,用户可以在上面去共享、检索、尝试
它开放的机器学习能力。
Hugging Face Hub提供了:
- models:NLP,vision,audio领域,最新的models
- datasets:不同领域、多模态的数据集
- spaces:交互式的一些app,展示了各种ML models的能力
那提到这里,我们也要介绍一下 Transformers 库,Hugging Face 里面的模型大多是基于该库构建,它是Hugging Face开发的一个NLP的包,支持加载目前绝大部分的预训练模型,后面会专门对该库进行介绍。
Models
Hub里面提供了大量open-source ML models
,还会对模型的限制、偏差、tasks、支持的语言等进行描述,可以查看这里。
Datasets
提供了NLP, Computer Vision, Audio
等方面的数据集,可以查询、下载和上传数据集。可以使用datasets library操作数据,可以查看这里。
Spaces
Spaces 里面有很多 ML demo app,hugging face还提供了两个 Python SDKs,分别为Gradio、Streamlit,让我们能够快速的构建 apps。
关于如何使用Spaces,可以查看相关的文档:Space文档。
Organizations
除了个人,还可以在Hugging Face里面创建组织,利用组织的维度管理datasets, models, Spaces.
Security
Hugging Face Hub 作为一个Hub、一个社区,提供了安全的保证,包括安全的访问控制,保护用户的code、models,及其 data 安全。