WordprocessingML 内容概述
WordprocessingML 文档是一个包,包含许多不同的部分,主要是XML文件。然而,大多数实际内容都在主文档部分中找到。而且该内容主要由段落和表格组成。
Paragraphs(段落)
段落(<w:p>)是块级内容的基本单位。也就是说,这是对内容的划分,从新的一行开始。它通常有两块。首先声明段落的格式(或属性),然后声明内容。
可以直接声明格式(“本段应居中”),也可以通过引用样式来间接声明格式(“本段应使用 X 样式,使段落居中”)。或者可以将两者结合起来。段落格式在 <w:pPr> 中。段落的内容包含在一个或多个运行(<w:r>)中。运行是非块级内容(运行级内容);它们定义了不一定在新行开始的文本区域。与段落一样,它们由 格式/属性定义 以及内容组成。格式是在 <w:rPr> 中指定的,可以是直接声明格式,通过样式引用的间接声明格式或两者结合。
如果运行(run)具有相同的属性,则可以将其划分为较小的运行,也可以将其合并。因此,例如,如果一个句子包含一个加粗的单词,则必须将该句子分成多个部分,以说明该句子的粗体和非粗体部分。
运行的内容主要由文本元素(<w:t>)组成,它们本身包含构成阅读内容的实际字符数据。运行中可能还包含中断,制表符,符号,图像和字段。下面是一个非常简单的段落的示例。
<w:p>
<w:pPr>
<w:jc w:val="center">
<w:pPr>
<w:r>
<w:rPr>
<w:b/>
</w:rPr>
<w:t>This is text.</w:t>
</w:r>
</w:p>
上面的示例以及您将在此站点上看到的几乎所有示例XML中都省略了可添加到跟踪编辑部分中的可选信息。这些信息(通常以属性的形式)会使您在查看 XML 基础 Word 文档时看到的 XML 变得混乱。为了清楚起见,此处将其省略。一个例子如下所示。
<w:p w:rsidR="00D57EDE" w:rsidRDefault="00D57EDE">
. . .
</w:p>
Tables(表格)
表是块级内容的另一种类型。表格由行和列组成。表格由行和列组成。表(<w:tbl>)的规范可以分为三部分。与段落和运行类似,首先要有属性,对于表,它们是在 <w:tblPr> 中定义的。
但是,与段落和运行不同,表将内容分为行,并且各行不需要具有相同的列数。这给表的定义增加了一定程度的复杂性。 WordprocessingML 通过在 <w:tblGrid> 中为表定义“网格”来解决这一难题。该表格网格定义是表格定义的第二部分。