媒体类型用于声明随之而来的数据的格式。又称:MIME(Multipurpose Internet Mail Extensions,多用途互联网邮件扩展)类型、MIME Type、Content Type。 是一种用于在异构系统、网络之间传递信息时时声明其格式的方法。
一般的,在文件系统中,我们会使用扩展名来表示文件类型,例如:.exe
表示可执行文件、.txt
表示纯文本文件、.png
表示png编码的图片、.mp4
表示mp4视频。这种方法,在独立系统中运行的很好,但在网络传输中不是一个好的方法。首先扩展名并不权威,不同系统之间是有歧义的。其次扩展名的惯例是采用缩写的方式,不能准确表意。
为了便于在网络中准确描述与传递内容的类型声明,多方组织制定出媒体类型表示方法和注册规程(Media Type Specifications and Registration Procedures :rfc6838)。 这种方法最初用于电子邮件(MIME),故也称之为 MIME Type。
标准形式:T1/T2
1个Media Type 由2部分组成:大类/子类。 在册大类有10个,经常用到的大类有6个:text
、image
、audio
、video
、application
,multipart
。而子类就太多了,总计有近2000+种。
复合类型
multipart
大类指复合类型。表示随后的数据是由多个不同媒体类型的信息块组成,每个块可以有单独的media type声明。
例如,在web中常见的multipart/form-data
,可以用来上传附件,每个附件的媒体类型都可以不一样。再如,电子邮件中可以传不同类型的附件,邮件也是 multipart
的
结构后缀
对子类型要注意一点,子类声明时可以附加结构说明后缀(Structured Syntax Name Suffixes,rfc6838 4.2.8)。例如:application/soap+xml
表示W3C Web Service报文,报文采用xml语法;application/calendar+xml
表示采用xml语法承载的icalendar报文;application/calendar+json
表示用json语法承载的icalendar报文。
通配符
要注意的是,media type 并不仅表示唯一确定类型。在网络协商时,media type支持传递通配符。*/*
表示任意类型,text/*
表示文本大类。因此,在程序中不能简单对mime type进行字符串比较。你需要考虑通配符的场景。
参数
在实际传递媒体类型时,可以在媒体类型后面附加参数: 大类/子类;参数1=值1;……;参数n=值n
。例如:text/plain;charset=utf-8;bom=no
注册一个类型
IANA(互联网数字分配机构),承担 media type的注册管理。
在子类型的管理上,IANA目前设置有四个序列(Tree):1. 标准化(Standards Tree),2. 供应商(Vendor Tree),3. 个人用途(Personal or Vanity Tree),4. 未注册(Unregistered x. Tree)。
举例:
text/plain
application/vnd.openxmlformats-officedocument.wordprocessingml.document
application/prs.xsf+xml
-
application/x.abc
随意起的
注:历史上,有过用x-开头表示未注册的子类型的情况,但后来改用 x.
了。但application/x-www-form-urlencoded
是一个正式类型。
小结
看到这儿你会发现对于处理 http报文头中的content-type,不能简单按照字符等于来判断,也不能简单将字符串用/
来分割成大类子类。一个完整的mime type解析要能正确识别大类、子类、结构后缀、通配符、参数。 你可以参考:org.springframework.util.MimeTypeUtils.parseMimeTypeInternal(String)或 javax.activation.MimeType.MimeType(String)
学习资料
- MDN文档:MIME 类型
- MDN文档:常见 MIME 类型列表
- IANA文档:在册Media Types清单
- IANA文档:Media Type Specifications and Registration Procedures
- 术语在线 MIME https://www.termonline.cn/search?searchText=mime
2022年11月10日 修订2
2023年12月27日 修订4