Task01MMLab介绍

  1. OpenMMLab概述

OpenMMLab诞生于2018年,是一个计算机视觉开源算法体系,和Theano/Caffe/pytorch等工具都属于开源Ai框架。

每一个计算机视觉任务都对应OpenMMLab的一个开源算法库,目前已经累积开源了超过30个算法库,2400个预训练模型,涵盖了图像识别分类,目标检测,语义分割等计算机视觉任务。

  1. OpenMMLab各开源算法库详细介绍

下面具体介绍OpenMMLab的开源算法库。

  • MMDetection

MMDetection是OpenMMLab在业界最有影响力的算法库,涵盖了计算机视觉中最重要的两大任务:目标检测和实例分割,在github有超过2w的star。

MMDetection不光包括教科书级别的经典算法,还包括很多前沿顶会论文的算法,避免了重复造轮子。

MMDetection也被广泛应用于学术、科研和工业界。

MMDetection被广泛应用于科研、学术和工业界
  • MMYOLO

另一个做目标检测的算法库叫MMYOLO,专门用于解决YOLO(You Only Look Once)目标检测,YOLO是经典的单阶段目标检测算法,它的特点是十分快速,既可以解决目标检测问题,又可以解决实例分割问题。

  • MMOCR

MMOCR是专门用于文字识别的算法库。

MMOCR的效果

AI自动给文字打马赛克
AI自动提取发票信息
Kaggle Baseline
  • MMDetection3D

专门做3D目标检测的算法库。

  • MMRotate

专门做旋转目标检测的算法库。

  • MMSegmentation

语义分割算法库。



语义分割最常见的两个应用场景就是医学图像处理 和卫星遥感分析上面。


MMSegmentation用于医学图像处理
  • MMPretrain

做预训练、图像分类、多模态的算法库。

  • MMPos

专门做姿态估计(关键点检测)的算法库


一些应用

一些应用
  • MMHuman3D

3D人体姿态估计算法库。

image.png
  • MMAction2

视频动作识别算法库。

  • MMagic

用于生成模型+底层视觉+AIGC的算法库。如text-to-image、图像去噪、重建、超分辨率、去雾、视频超分辨率(把模糊变成高清,还原细节)、插帧(把卡成ppt的视频变得丝滑) ,或者使用条件/非条件GAN网络生成图片、黑白照片上色、图像填充(打了马赛克的图片复原)、Mapping(抠出图片前景)等等。

image.png
image.png
image.png
  • MMDeploy

要实时推理的模型需要线上部署

  • Playgroud

趣味应用游乐场。


image.png
  1. OpenMMLab开源生态
image.png
image.png
  1. 加入OpenMMLab社区
image.png
image.png
最后编辑于
©著作权归作者所有,转载或内容合作请联系作者
【社区内容提示】社区部分内容疑似由AI辅助生成,浏览时请结合常识与多方信息审慎甄别。
平台声明:文章内容(如有图片或视频亦包括在内)由作者上传并发布,文章内容仅代表作者本人观点,简书系信息发布平台,仅提供信息存储服务。

相关阅读更多精彩内容

友情链接更多精彩内容