- OpenMMLab概述
OpenMMLab诞生于2018年,是一个计算机视觉开源算法体系,和Theano/Caffe/pytorch等工具都属于开源Ai框架。
每一个计算机视觉任务都对应OpenMMLab的一个开源算法库,目前已经累积开源了超过30个算法库,2400个预训练模型,涵盖了图像识别分类,目标检测,语义分割等计算机视觉任务。
- OpenMMLab各开源算法库详细介绍
下面具体介绍OpenMMLab的开源算法库。
- MMDetection
MMDetection是OpenMMLab在业界最有影响力的算法库,涵盖了计算机视觉中最重要的两大任务:目标检测和实例分割,在github有超过2w的star。
MMDetection不光包括教科书级别的经典算法,还包括很多前沿顶会论文的算法,避免了重复造轮子。
MMDetection也被广泛应用于学术、科研和工业界。
- MMYOLO
另一个做目标检测的算法库叫MMYOLO,专门用于解决YOLO(You Only Look Once)目标检测,YOLO是经典的单阶段目标检测算法,它的特点是十分快速,既可以解决目标检测问题,又可以解决实例分割问题。
- MMOCR
MMOCR是专门用于文字识别的算法库。
- MMDetection3D
专门做3D目标检测的算法库。
- MMRotate
专门做旋转目标检测的算法库。
- MMSegmentation
语义分割算法库。
语义分割最常见的两个应用场景就是医学图像处理 和卫星遥感分析上面。
- MMPretrain
做预训练、图像分类、多模态的算法库。
- MMPos
专门做姿态估计(关键点检测)的算法库
- MMHuman3D
3D人体姿态估计算法库。
- MMAction2
视频动作识别算法库。
- MMagic
用于生成模型+底层视觉+AIGC的算法库。如text-to-image、图像去噪、重建、超分辨率、去雾、视频超分辨率(把模糊变成高清,还原细节)、插帧(把卡成ppt的视频变得丝滑) ,或者使用条件/非条件GAN网络生成图片、黑白照片上色、图像填充(打了马赛克的图片复原)、Mapping(抠出图片前景)等等。
- MMDeploy
要实时推理的模型需要线上部署
- Playgroud
趣味应用游乐场。
- OpenMMLab开源生态
- 加入OpenMMLab社区