元数据目的
❶ 几种常见的元数据类型
元数据是关于信息的信息( information about information )。有时候,它也被称作是关于数据的数据(data aboutdata)。这个术语常用来表示那些可以用来识别、描述和定位某些基于网络的电子资源。元数据最根本的目的就是作为管理内容的工具,提供对某一内容和结构的描述,它有利于提升信息的关联性、有效性,对于信息的升级和交互操作也具有重要意义。 其主要功能有:(1)管理:通过元数据可以管理信息,比如著作权追踪,获得途径和要求,信息的位置,版本情况等。(2)描述:通过元数据可以描述信息,比如目录记录,索引,注解等(3)保存:通过元数据可以保护信息管理,比如对资源的物理状态的记录,它们的保存方法等。(4)技术:指的是元数据如何在某个系统中运行,比如需要的软件和硬件记录,追踪和认证情况等。(5)应用:元数据可以记录信息的类型和适用层次。 根据不同的依据,可以对元数据进行分类: 如果元数据在设计之前经过了周密的考虑,那么形成的信息管理系统将会高效得多。在传统的目录系统中,关键词和元数据被用来查找一本书,一篇文章或一本期刊,而不是为了服务更广大的用户和交叉参考。网络作为一种研究工具,一种传播信息的工具,使得元数据和关键词的精确度和相关性变得尤为重要。 元数据应当具有一定的连续性,以保证它能在不同的应用平台和不同的标准框架中使用。到目前为止,并没有权威性的原数据标准出现,使得图书(包括其他类似图书的产品)产业中出现的不同类型的元数据标准更加繁杂。如何应对这么多有的甚至相互交叉的标准,至今仍然是一个大问题。解决了这一问题,将使得人们能够更加高效的应用互联网上的资源。 正确使用元数据和元数据标准,对各种大小企业、政府组织向网络环境发展都是十分关键的。日益增加的互联网用户和数字化技术也对开发统一的元数据标准提出了严峻考验。一些机构,比如IMS和DublinCore就联合起来致力于开发一套通用的元数据标准框,以适应不断增长的互联网应用的需求,政府机构和各类企业的信息化需求,知识经济不断变化的需求和全求画的需求。 大多数的原数据标准都在不断的改进之中,包括IMS、MPEG、DublinCore以及其他没有提到的标准。 创建元数据系统的技术也在不断变化,这使得那些较为依赖传统的计算机技术的公司更加难以做出抉择。 有研究者称,在十年之内,出版商、印刷商、批发商、物流业、书店和图书馆完全有可能在基于网络技术基础之上重建的商业环境中相互协作。作者和读者的经历也将随着越来越多的电子装置和技术的出现而改变。
❷ 什么叫元数据
元数据最本质、最抽象的定义为:data about data (关于数据的数据)。它是一种广泛存在的现象,在许多领域有其具体的定义和应用。
在数据仓库领域中,元数据被定义为:描述数据及其环境的数据。一般来说,它有两方面的用途。首先,元数据能提供基于用户的信息,如记录数据项的业务描述信息的元数据能帮助用户使用数据。其次,元数据能支持系统对数据的管理和维护,如关于数据项存储方法的元数据能支持系统以最有效的方式访问数据。具体来说,在数据仓库系统中,元数据机制主要支持以下五类系统管理功能:(1)描述哪些数据在数据仓库中;(2)定义要进入数据仓库中的数据和从数据仓库中产生的数据;(3)记录根据业务事件发生而随之进行的数据抽取工作时间安排;(4)记录并检测系统数据一致性的要求和执行情况;(5)衡量数据质量。
在软件构造领域,元数据被定义为:在程序中不是被加工的对象,而是通过其值的改变来改变程序的行为的数据。它在运行过程中起着以解释方式控制程序行为的作用。在程序的不同位置配置不同值的元数据,就可以得到与原来等价的程序行为。
在图书馆与信息界,元数据被定义为:提供关于信息资源或数据的一种结构化的数据,是对信息资源的结构化的描述。其作用为:描述信息资源或数据本身的特征和属性,规定数字化信息的组织,具有定位、发现、证明、评估、选择等功能。
此外,元数据在地理界,生命科学界等顶域也有其相应的定义和应用。
❸ 什么是元数据
元数据是关于数据的组织、数据域及其关系的信息,简言之,元数据就是关于数据的数据。 [编辑]元数据的特点[1] ①元数据是关于数据的结构化的数据,它不一定是数字形式的,可来自不同的资源。 ②元数据是与对象相关的数据,此数据使其潜在的用户不必先具备对这些对象的存在和特征的完整认识。 ③元数据是对信息包裹(Information Package)的编码的描述。 ④元数据包含用于描述信息对象的内容和位置的数据元素集,促进了网络环境中信息对象的发现和检索。 ⑤元数据不仅对信息对象进行描述,还能够描述资源的使用环境、管理、加工、保存和使用等方面的情况。 ⑥在信息对象或系统的生命周期中自然增加元数据。 ⑦元数据常规定义中的“数据”是表示事务性质的符号,是进行各种统计、计算、科学研究、技术设计所依据的数值,或是说数字化、公式化、代码化、图表化的信息。 [编辑]元数据的类型[1] 根据功能可将元数据划分为管理型元数据、描述型元数据、保存型元数据、技术型元数据、使用型元数据。根据结构和语境可将元数据划分为三组:第一组为全文索引;第二组为简单结构化的普通格式,如DC、RFCl807、Template等;第三组为结构复杂的特殊领域内的格式,如FGDC、GILS、TEI、EAD等。 根据元数据的应用范围,可分为通用性元数据、专业性元数据、Web元数据、多媒体元数据。 [编辑]元数据的结构[1] ①内容结构。包括描述性元素、技术性元素、管理性元素、复用性元素。 ②句法结构。包括元素的分区分层分段组织结构、元素结构描述方法、DTD描述语言、元数据复用方式、与被描述对象的捆绑方式。 ③语义结构。包括元素内容编码规则定义、元素定义、元素语义概念关系、元数据版本管理。 [编辑]元数据的作用[2] 元数据是网络信息资源描述的重要工具,可以用于网络信息资源管理的各个方面,包括信息资源的建立、发布、转换、使用、共享等。元数据在网络信息资源组织方面的作用可以概括为五个方面:描述、定位、搜寻、评估和选择。 (1)描述作用:根据元数据的定义,它最基本的功能就在于对信息对象的内容和位置进行描述,从而为信息对象的存取与利用奠定必要的基础。 (2)定位作用:由于网络信息资源没有具体的实体存在,因此,明确它的定位至关重要。元数据包含有关网络信息资源位置方面的信息,因而由此便可确定资源的位置之所在,促进了网络环境中信息对象的发现和检索。此外,在信息对象的元数据确定以后,信息对象在数据库或其他集合体中的位置也就确定了,这是定位的另一层含义。 (3)搜寻作用:元数据提供搜寻的基础,在著录的过程中,将信息对象中的重要信息抽出并加以组织,赋予语意,并建立关系,使检索结果更加准确,从而有利于用户识别资源的价值,发现其真正需要的资源。 (4)评估作用:元数据提供有关信息对象的名称、内容、年代、格式、制作者等基本属性,使用户在无需浏览信息对象本身的情况下,就能够对信息对象具备基本了解和认识,参照有关标准即可对其价值进行必要的评估,作为存取利用的参考。 (5)选择作用:根据元数据所提供的描述信息,参照相应的评估标准,结合使用环境,用户便能够做出对信息对象取舍的决定,选择适合用户使用的资源。