1.背景介绍
微格式:建立在已有的、被广泛采用的标准基础之上的一组简单的、开放的数据格式
(microformats.org官方定义)。是把语义嵌入到HTML以便有助于分离式开发而
制定的一些简单约定,是兼顾人机可读性设计的数据表达方式,对Web网页进行语义注解的方法。
这种方法依托于标准的Web页面写作技术,例如,XHTML,这样引入语义信息对浏览器等所有现存
的Web技术冲击最小。采用Microformat的 Web页面,在XHTML文档中给一些标签(Tag)增加一些属性
(attribute),这些属性对信息的语义结构进行注解,处理XHTML文档的软件,例如,浏览器等,
如果不认识这些属性可以跳过,并不造成任何不良影响(ITPUB)简单点说:通过语意相关让内容人机可读
2.知识剖析
网页上的允许的微格式数据包括事件、人物、地点等,它可以被其他的软件检测到,并提取出相应的信息,以及对信息进行索引、搜索、跨平台的参考,把这些信息以其他形式重复使用或组合。目前已具备完整规范的微格式还包括:hCard、hCalendar、XOXO、XFN、VoteLinks和3个“rel-”微格式:rel- license、rel-nofollow和rel-tag。
3.编码实战
北京:39.90556;116.39139
简单的微格式
我们从上面的描述知道,微格式实际就是为现有的(X)HTML元素添加元数据
和其他属性,增强语义。那么我们就来看一个简单的微格式应用吧。
而现在我们要为这个代码元素a加上rel属性。
上面的链接标记的a标签包括rel=”home”属性,该属性显示链接的目标页面是该网站的首页。
通过为已有的链接元素添加语义化属性,就为这个链接添加了具体的结构和意义。
4.扩展思考
微格式在实际应用中的意义和作用又是什么呢?
在爬取Web内容时,能够更为准确地识别内容块的语义;
对内容进行操作,包括提供访问、校对,还可以将其转化成其他的相关格式,提供给外部程序和Web服务使用。
5..参考文献
参考一:博客
6.更多讨论
Microformat有效地在Web文档中增加语义信息,然而,现有Web上的海量信息
全部改造成符合该标准的内容显然是不现实的,一种替代方法就是给现有的互联网内容增加一个
语义描述层,这一层可以独立于原信息页面进行建设,MetaSeeker工具包是这类解决方案的佼佼者。
ppt:ptteng.github.io/PPT/PPT/css-12-Microformat.html#/
视频: