非常教程

HTML参考手册

其他 | Miscellaneous

Microdata

微数据是一种 WHATWG 的 HTML 规范, 用于在 web 页上的现有内容中嵌套元资料. 1 搜索引擎、网络爬虫和浏览器可以从网页中提取和处理微信息, 并使用它为用户提供更丰富的浏览体验。搜索引擎可以从直接访问这些结构化数据中获益良多, 因为它允许搜索引擎了解网页上的信息, 并为用户提供更相关的结果。微数据使用支持词汇来描述项和名称-值对, 以便为其属性赋值。微微观是一种用机器可读的标记来为 HTML 元素提供一种简单的方法, 而不是使用 RDFa 和微的类似方法。

W3C HTML 工作组未能找到该规范的编辑器, 并在2013年以 "注释" 终止其开发。

在较高的层次上, 微微观由一组名称-值对组成。这些组称为项, 每个名称-值对都是一个属性。项和属性由常规元素表示。

  • 若要创建项, 请使用 itemscope 属性。

  • 若要向项添加属性, itemprop 属性将用于该项的子体之一。

词汇

Google 和其他主要的搜索引擎支持结构化数据的 Schema.org 词汇。此词汇表定义了一组标准的类型名称和属性名称, 例如, Schema.org 音乐事件表示音乐会性能, 具有 "和位置属性来指定音乐会的关键细节。在这种情况下, Schema.org 音乐事件将是类型和 "使用的 URL 和位置将是 itemprop 的 Schema.org 音乐事件定义。

:有关类型属性的更多信息可以在http://schema.org/Thing中找到

微观词汇表提供项的语义或含义。web 开发人员可以设计自定义词汇表或使用 web 上可用的词汇表, 如广泛使用的 schema.org 词汇。Schema.org 提供了常用标记词汇表的集合。

常用词汇:

  • 创意作品:CreativeWork,书,电影,音乐录制,食谱,电视节目

  • 嵌入的非文本对象:AudioObject、ImageObject、VideoObject

  • 事件
  • 健康和医疗类型:关于MedicalEntity下健康和医疗类型的说明
  • 组织
  • 地方,本地业务,餐厅
  • 产品,提供,合计报价

  • 评论,聚合评分
  • 行动
  • 事物
  • 无形

主要的搜索引擎运营商, 如谷歌, 微软和雅虎, 依靠 schema.org 词汇来提高搜索结果。出于某些目的, 特定的词汇量是足够的。对于其他人来说, 需要设计一个词汇表。在可能的情况下, 鼓励作者重新使用现有的词汇表, 因为这使得内容重新使用变得更容易。

本地化

在某些情况下, 覆盖特定区域的搜索引擎可能会提供本地特定的微信息扩展。例如,Yandex,一个主要的搜索引擎在俄罗斯,支持微,如hCard(公司联系信息),hRecipe(食品配方),hReview(市场审查)和hProduct(产品数据),并提供自己的格式定义的条款和百科全书的文章。这个扩展是为了解决西里尔字母和拉丁字母之间的音译问题。由于实施了图式词汇的附加标记参数, 俄语网页中信息的指数化变得更加成功。

全局属性

itemid - 项目的唯一全局标识符。

itemprop - 用于向项目添加属性。每个HTML元素可以有一个指定的itemprop属性,itemprop由一个名称和值对组成。

itemref - 具有属性的元素的后代不itemscope属性的属性可以使用itemref与项目相关联。Itemref提供了itemid文档中其他属性的附加属性的元素ID列表(不是itemid)。

itemscope – itemscope (通常) 与类型一起工作, 以指定块中包含的 HTML 与特定项有关。itemscope 创建该项并定义与之关联的类型的范围。类型是描述该项及其属性上下文的词汇 (如 schema.org) 的有效 URL。

itemtype – 指定将用于定义数据结构中的 itemprop (项属性) 的词汇的 URL。Itemscope 用于设置数据结构中类型所设置的词汇表的活动范围。

示例

HTML

<div itemscope itemtype="http://schema.org/SoftwareApplication">
  <span itemprop="name">Angry Birds</span> -

  REQUIRES <span itemprop="operatingSystem">ANDROID</span><br>
  <link itemprop="applicationCategory" href="http://schema.org/GameApplication"/>

  <div itemprop="aggregateRating" itemscope itemtype="http://schema.org/AggregateRating">
    RATING:
    <span itemprop="ratingValue">4.6</span> (
    <span itemprop="ratingCount">8864</span> ratings )
  </div>

  <div itemprop="offers" itemscope itemtype="http://schema.org/Offer">
    Price: $<span itemprop="price">1.00</span>
    <meta itemprop="priceCurrency" content="USD" />
  </div>
</div>

结构化数据

itemscope

itemtype

SoftwareApplication (http://schema.org/SoftwareApplication)

itemprop

name

Angry Birds

itemprop

operatingSystem

ANDROID

itemprop

applicationCategory

GameApplication (http://schema.org/GameApplication)

itemscope

itempropitemtype

aggregateRating AggregateRating

itemprop

ratingValue

4.6

itemprop

ratingCount

8864

itemscope

itempropitemtype

offers Offer

itemprop

price

1.00

itemprop

priceCurrency

USD

结果

:从HTML中提取微数据结构的方便工具是Google的结构化数据测试工具。试试在上面显示的HTML。

浏览器兼容性

Feature

Chrome

Edge

Firefox (Gecko)

Internet Explorer

Opera

Safari

Basic support

No support

?

16 (16) Removed in 49 (49)

No support

No support

No support

Feature

Android

Chrome for Android

Edge

Firefox Mobile (Gecko)

IE Mobile

Opera Mobile

Safari Mobile

Basic support

?

?

?

?

?

?

?

HTML

超文本标记语言,它通过标记符号来标记要显示的网页中的各个部分。网页文件本身是一种文本文件,通过在文本文件中添加标记符,可以告诉浏览器如何显示其中的内容(如:文字如何处理,画面如何安排,图片如何显示等)。浏览器按顺序阅读网页文件,然后根据标记符解释和显示其标记的内容,对书写出错的标记将不指出其错误,且不停止其解释执行过程,编制者只能通过显示效果来分析出错原因和出错部位。但需要注意的是,对于不同的浏览器,对同一标记符可能会有不完全相同的解释,因而可能会有不同的显示效果。