斯文攸归 - 简书

发简信

斯文攸归

10
关注
30
粉丝
56
文章
77657

字数
57

收获喜欢
6

总资产

IP属地：海南

斯文攸归

Hunyuan-Video
简介 CausalConv3D VAE，降采样倍数为时间上4倍，空间上8x8倍扩散模型：FLUX的结构（Dual-Stream DiT Blcok+Single-Strea...

1007 0 0
斯文攸归

排序算法
排序算法大的分类有两类：一类是比较类排序，通过比较来确定元素间的相对次序，由于其时间复杂度不能突破O(nlogn)，因此也称为非线性时间比较类排序。一类是非比较类排序，它...

890 0 1

斯文攸归

如题
当这一天真的来临的时候，我很淡然，好像心里早已经接受，又很无措，似乎还没做好准备。时光只解催人老，人生匆匆啊，路上是诉不尽的别离，您不是第一个离开我的，也不会是最后一个，天地...

708 0 4
斯文攸归

IP-Adapter
https://github.com/tencent-ailab/IP-Adapter.git 如何更精准地控制SD生成图片的结果，不需要复杂的描述工程，不需要重新微调bas...

4897 0 0
斯文攸归

Imagen：Photorealistic Text-to-Image Diffusion Models with Deep Language Understanding
相较于之前一些基于扩散模型的text2image方法，Imagen一个基本的认识是：用更大的在纯文本上训练的自然语言模型（T5）作为text encoder比用更大的dif...

5743 0 1
斯文攸归

DALL-E-2:Hierarchical Text-Conditional Image Generation with CLIP Latents
OpenAI Text2Image based on CLIP and Diffusion Model 虚线以上部分表示CLIP的训练过程，预训练CLIP模型在生成图片的过程...

5469 0 1
斯文攸归

GLIDE: Towards Photorealistic Image Generation and Editing with Text-Guided Diffusion Models
扩散模型(diffusion model)可以生成高质量的合成图像，尤其当基于某种条件引导(guidence)时，可以用多样性换保真性。针对基于文本条件的图像合成扩散模型，比...

8621 0 0

斯文攸归

CLIP:Learning Transferable Visual Models From Natural Language Supervision
一般的计算机视觉方法总是在一个类别已知且固定的数据集上去训练和预测，这限制了模型的泛化能力，而直接从文本来学习图像是有有前景的，因为利用了更广泛的监督信号。因此将任务定义为预...

3783 0 2
斯文攸归

SimSwap
上交+腾讯支持图片视频任意身份换脸(finetuning free);并且保持脸部属性如表情/姿态/光照等。换脸的方法一般分两类： Source-oriented Met...

6523 0 0
斯文攸归

Encoding in Style: a StyleGAN Encoder for Image-to-Image Translation
https://github.com/eladrich/pixel2style2pixel[https://github.com/eladrich/pixel2style2p...

3938 0 0
斯文攸归

Enhancing photorealism enhancement
图片增强现实——NVIDIA即使是最复杂的游戏，其实时渲染依然无法实现真实的现实场景，人眼一眼就能分辨模拟图片和真实图片。因此利用游戏引擎渲染过程中产生的中间缓冲（G-Buf...

4868 0 1
斯文攸归

YOLOX:Exceeding YOLO Series in 2021
对于YOLO-Nano，所提方法仅需0.91M参数+1.08G FLOPs取得了25.3%AP指标，以1.8%超越了NanoDet。方法网络设计 YOLOv3+DarkN...

3843 0 0

斯文攸归

CenterMask:Real-Time Anchor-Free Instance Segmentation
https://github.com/youngwanLEE/CenterMask[https://github.com/youngwanLEE/CenterMask] 主要...

3541 0 0
斯文攸归

@对心kiss天空结构参数就是对应超网中每个路径/操作的权重，比如一个cell中有N种可能的操作/路径，那么结构参数就表示为（N,1）的向量，每个分量表示对应路径的权重，网络的权重参数就是卷积、全连接等的参数矩阵，这应该好理解

DARTS: Differentiable Architecture Search
深度学习可以自动学习出有用的特征，脱离了对特征工程的依赖，在图像、语音等任务上取得了超越其他算法的结果。这种成功很大程度上得益于新神经网络结构的出现，如ResNet、Ince...

斯文攸归
8232 5 0
斯文攸归

@Sponge_Bob1202 理论上是可以的，将数据集划分为train-train，train-val，val就行

DARTS: Differentiable Architecture Search
深度学习可以自动学习出有用的特征，脱离了对特征工程的依赖，在图像、语音等任务上取得了超越其他算法的结果。这种成功很大程度上得益于新神经网络结构的出现，如ResNet、Ince...

斯文攸归
8232 5 0
斯文攸归

Adagrad应该是对频繁变化的参数以更小的步长进行更新，而稀疏的参数以更大的步长更新，意即某个元素的偏导数较大，学习率应该较小，某个元素的偏导数较小，学习率应该较大

深度学习优化算法

斯文攸归
775 1 0
斯文攸归

IOU-Based Loss in Object Detection
目标检测的定位回归损失为Smooth L1损失但是这种loss假设4个点独立，但是实际上边框的4个点之间是有联系的，而且实际评价框检测的指标是使用IOU，这两者是不等价的，多...

3902 0 0

斯文攸归

是有出入，建议看原文附录，对比源码，作者为了方便描述，论文的图跟实际实现有差异

Resnest:Split-Attention Networks
亚马逊张航李沐提供Gluon版本和Pytorch版本，新SOTA 摘要 ResNet的变体：Split Attention模块，在不同feature map group上的...

斯文攸归
8141 3 0
斯文攸归

NMS Series
NMS: 算法流程：1.将所有检出的output bbox按类别进行划分；2.在每个类别的集合内根据各个bbox的cls score做降序排列，得到一个降序的list_k，从...

4296 0 0
斯文攸归

YOLOv1——YOLOv5
YOLOv1 YOLOv1提出单阶段anchor-free的目标检测方法将图像分为SxS的grid cell，每个有物体中心落入的grid cell对应回归B个BBox，每个...

5651 0 6