斯文攸归 - 简书

斯文攸归

IP属地：广西

Hunyuan-Video
简介 CausalConv3D VAE，降采样倍数为时间上4倍，空间上8x8倍扩散模型：FLUX的结构（Dual-Stream DiT Blc...

1337 0 0
排序算法
排序算法大的分类有两类：一类是比较类排序，通过比较来确定元素间的相对次序，由于其时间复杂度不能突破O(nlogn)，因此也称为非线性时间比较类...

1333 0 1

如题
当这一天真的来临的时候，我很淡然，好像心里早已经接受，又很无措，似乎还没做好准备。时光只解催人老，人生匆匆啊，路上是诉不尽的别离，您不是第一个离...

1.7 1063 0 4
IP-Adapter
https://github.com/tencent-ailab/IP-Adapter.git 如何更精准地控制SD生成图片的结果，不需要复杂的...

5045 0 0
Imagen：Photorealistic Text-to-Image Diffusion Models with Deep Language Understanding
相较于之前一些基于扩散模型的text2image方法，Imagen一个基本的认识是：用更大的在纯文本上训练的自然语言模型（T5）作为text ...

5842 0 1
DALL-E-2:Hierarchical Text-Conditional Image Generation with CLIP Latents
OpenAI Text2Image based on CLIP and Diffusion Model 虚线以上部分表示CLIP的训练过程，预训...

5540 0 1
GLIDE: Towards Photorealistic Image Generation and Editing with Text-Guided Diffusion Models
扩散模型(diffusion model)可以生成高质量的合成图像，尤其当基于某种条件引导(guidence)时，可以用多样性换保真性。针对基于...

8715 0 0

CLIP:Learning Transferable Visual Models From Natural Language Supervision
一般的计算机视觉方法总是在一个类别已知且固定的数据集上去训练和预测，这限制了模型的泛化能力，而直接从文本来学习图像是有有前景的，因为利用了更广泛...

0.1 3892 0 2
SimSwap
上交+腾讯支持图片视频任意身份换脸(finetuning free);并且保持脸部属性如表情/姿态/光照等。换脸的方法一般分两类： Sour...

6660 0 0