1. 华北大区地质资料数据中心设计方案探讨

周小希 陈安蜀 张良军 邓凡 王心华

(中国地质调查局天津地质调查中心)

摘要 地质资料是地质工作取得的重要信息资源,随着信息化建设的发展及社会对服务需求及服务质量的不断提升,通过建设地质资料数据中心,实现数据资源的集群化管理,服务系统集成及数据共享,提供多元化的服务,从而提升管理及服务水平是十分必要的。本文提出了华北大区地质资料数据中心设计方案,阐述了数据中心框架设计及采用的关键技术。

关键词 地质资料 数据中心 虚拟化

1 建设背景及定位

地质资料是地质工作取得的重要信息资源,是地质工作服务社会的主要载体,其作为社会信息的组成部分,已日益成为经济建设的重要信息资源。随着经济发展和社会信息化的全面推进,社会各界对生存环境、地质灾害、基本资源情况等地质知识与信息的需求日益增强。2006年1月发布的《国务院关于加强地质工作的决定》(以下简称《决定》)正式提出了“地质资料数据中心”概念。《决定》明确要求:“建立健全地质资料信息共享和社会服务体系,加快利用现代信息共享技术,建设国家地质资料数据中心”和“全面公开地质资料目录,向社会提供有效快捷的地质资料信息服务”。在信息化建设面临“挑战越来越严峻、需求越来越迫切”的新形势下,构建地质资料数据中心,实现信息资源的集群化管理,提供多元化的社会化应用服务,已成为当今国内外地质信息服务的主流。

天津地质调查中心作为华北地质资料管理和服务机构,在中国地质调查局地质信息共享服务体系中定位为区域性服务结点,主要负责集成整合区域内地质信息提供区域性地质信息的共享服务,建设并维护本区域地质信息服务平台,发布区域性地质调查成果服务产品。中心多年来积累了大量的华北地区地质资料数据资源及地质资料数据库,并开发建设了地质资料全文服务系统、空间数据服务系统及地质调查资料服务平台等服务系统。随着信息化建设的发展及社会对服务需求及服务质量的不断提升,通过构建华北地质资料数据中心,实现数据资源的集群化管理及数据共享,提供多元化的服务,从而提升管理及服务水平是十分必要的。

2 数据中心框架设计

华北地质资料数据中心的建设指导思想应以汇集、建立华北地质资料数据共享资源,坚持以需求为导向,从地质资料数据应用效益及现实情况出发,确定重点建设内容,注重数据共享应用。坚持采用现代信息技术中的先进成熟技术,保证系统的安全性、可靠性、可扩充性、易维护性及开放性。

数据中心系统设计参考原则:①先进性、标准性。采用先进成熟的技术和技术规范,保证系统稳定高效运行,选用符合国际标准的技术和产品,以保证系统的一致性。②经济型、实用性。选择适合的性价比高的设备,既能满足业务系统的应用需求,又能适应应用需求的扩展。③开放性。采用符合OSI(开放系统互联)标准的技术和通信协议,采用国际和国家标准的网络规范,并充分考虑与软硬件兼容性,使符合标准的不同厂商的商品可以无缝添加到数据中心中。④可扩展性。采用标准化的实现技术和产品,系统结构应易于扩展,使系统具有良好的可持续性及可扩展性。⑤结构的合理性。采用合理高效的系统结构,系统应能合理安排冗余和负载,实现有效流量控制和负载均衡,确保系统的正常、畅通运行,并能适应数据中心业务发展的需求。⑥高可靠性。关键节点设计中应选用高可靠性设备及产品,并有合理的冗余和可靠的系统备份策略,确保系统可靠运行。⑦高性能性。保障服务器、网络及设备的高吞吐能力,保证数据的高质量传输。⑧安全性。数据中心系统应具有足够的安全性,能够防止来自系统内部及外部的恶意攻击,能有效地防止因人为误操作带来的影响。应采用有效的安全防范措施和安全手段,保证系统的完整性和机密性。应能提供有效的容灾、容错等保障机制,对雷击、火灾、盗窃等意外问题有良好的预防和恢复措施。

按照上述指导思想及设计原则,华北地质资料数据中心的总体框架设计采用4层结构:基础设施层、信息资源层、应用支撑层、应用层。另外还需要信息技术标准、安全防护、运维管理所组成的支撑体系予以支撑,保证数据中心运行及地质资料信息服务规范持续开展。数据中心框架设计图见图1。

图1 华北地质资料数据中心框架图

2.1 基础设施层

主要指数据中心运行的软硬件基础环境,包括机房设施、网络架构、服务器配置、系统软件配置等。机房环境具有防尘、防静电、防雷、防震、防火、恒温等特点,并可实现对视频设备、门禁、配电、温湿度、消防等进行管理和监控,机房供电采用双路电源冗余供电方式,同时采用市电、UPS电双电源并机供电形式,以满足机房设备双电源供电要求。从数据集成管理,满足多层次服务需求及信息安全角度考虑,数据中心网络划分为中心内网、涉密网、局广域网(地调局专网)及外网(互联网服务区),网络内部按逻辑功能划分为主功能区、核心存储备份区、涉密区、数据交换区、服务发布区5个功能逻辑分区。从信息数据安全角度出发,涉密区以物理隔离方式独立部署,其中主功能区、核心存储备份区及数据交换区部署在中心内网,服务发布区部署在互联网服务区,局广域网区域进行局属单位之间的数据交换,网络架构示意图见图2。数据中心在统一网络管理基础上,采用服务器虚拟化技术、负载均衡技术、统一交换技术(FCoE)及存储备份技术等建立起应用服务器与存储体系及信息安全防护体系。

图2 网络架构示意图

2.2 信息资源层

信息资源层主要包括数据中心的各类数据、数据库,负责整个数据中心的数据存储和交换,为数据中心提供统一的数据交换平台。中心地质资料数据已达到TB级别,从表现形式划分,包括成果资料、原始资料;从地质专业划分,包括区域地质、矿产地质、水文地质、工程地质、环境地质、地球物理、地球化学等;从数据形式划分,包括纸质档案、图文数字化资料、数据库、软件等;从共享方式划分,包括涉密数据、保护数据和公开数据。中心现存馆藏数据库包括华北地区数字地质图空间数据库、同位素地质测年数据库、地质工作程度数据库、区域地球化学数据库、1:20万自然重砂数据库、1:20万重力数据库、航磁数据库、矿产地数据库、专题图件空间数据库、华北平原地下水资源空间数据库等。

在信息资源层实现对中心各种地质数据及数据库进行集成管理,在数据中心内网核心存储备份区建立核心数据库。另外在局广域网及外网建立交换数据库,根据业务及服务需求,通过建立数据更新机制及数据更新同步工具在数据交换区完成从内网到局广域网、外网的数据交换。

2.3 应用支撑层

应用支撑层构建应用层所需要的各种服务组件及数据交换平台,包括地质资料数据管理、数据交换、元数据管理、数据分析、GIS资源服务发布、GIS空间分析、全文检索等其他业务支撑服务组件。

2.4 应用层

应用层为数据中心定制开发的应用系统,按照地质资料数据管理及服务需求,在数据中心内网建设中心地质资料数据管理系统实现对馆藏成果地质资料、原始地质资料数据资源的统一管理,在内网建设华北地质资料阅览室系统及借阅系统,实现地质资料内部浏览及借阅业务处理,在外网部署华北地质资料服务平台作为华北地质资料对外服务一站式窗口,在互联网上面向社会提供地质资料目录查询、地质资料全文服务、空间地质数据服务。

3 采用的关键技术

3.1 云计算技术

云计算就是IT整体资源的“按需分配”与服务交付。由于数据中心的集中化、整合特性,传统的烟囱式系统建设方式会导致资源难以共享、利用率低、标准程度差,建设和扩容成本难以控制。云计算技术的出现,可以云化数据中心需要承载的IT系统。云计算系统具有低成本、大规模特点,以低成本运算单元取代传统大型IT系统设备,降低IT系统的建设和扩容成本,同时通过软件技术实现大量低成本IT硬件单元协同工作,保证高可靠性。云计算系统具有平滑扩展能力,具备高度的扩展性和弹性,可以方便、快速地增加或减少资源。云计算系统具有资源共享能力,可提供多种形式的计算、存储、网络能力资源池,可为多种上层应用提供服务,同时实现资源的自动分配与管理。利用云计算技术和模式,数据中心将成为云计算数据中心,形成私有云、公有云或混合云。云计算的IaaS、PaaS和SaaS服务模式成为数据中心业务模式创新的源泉。基于IaaS,数据中心可以升级传统的资源类出租业务,提供弹性资源出租,实现按需服务;基于PaaS,数据中心可以在传统增值服务基础上,提供有特色的能力服务;基于SaaS,数据中心可以深化服务内容,进一步提高收益水平,打造差异化竞争能力。

3.2 服务器虚拟化技术

新一代的数据中心的发展方向是私有云,而私有云以虚拟化技术为核心。所谓服务器虚拟化,指的是通过一台服务器的设置,使其能够同时运行多种操作系统,并且实现其相互之间的独立性。引入服务器虚拟化软件,能够把在物理上唯一的服务器进行逻辑上的划分,使之能够以多个虚拟机的模式运行。服务器虚拟化的信息系统部署模式能够有效提升服务器的利用率,降低信息化成本。计划选择VMware vSphere作为数据中心服务器虚拟化软件,其是业界领先且可靠的虚拟化平台,vSphere 是VMware公司推出一套服务器虚拟化解决方案,目前的最新版本为5.5。vSphere5主要包含ESX Server、vCenter Server和vSphere Client三部分,其中ESX Server直接部署于物理服务器上,作为基础架构全面虚拟化服务器、存储,虚拟机运行在ESX Server上,vCenter Server能够快速部署虚拟机,监控物理服务器和虚拟机的性能。vSpher Client用于管理配置ESX Server,对VMware虚拟化环境进行集中管理。

3.3 数据交换平台

数据交换平台是数据中心数据与其他应用系统沟通的桥梁,是进行数据交换的基础。数据交换平台负责从各个业务系统或数据库中采集数据,对数据进行整合,按照数据标准规范,形成核心数据库,并提供其他应用系统使用。数据交换平台功能由支撑功能与应用功能组成,支撑功能是数据交换平台的基础,主要由数据采集、元数据管理、数据交换服务总线、平台监控机安全管理子功能组成;应用功能主要为具体业务系统服务,应用系统通过数据交换服务总线,以数据交换服务的形式为各个应用系统提供数据共享服务。

4 结语

本文提出了华北大区地质资料数据中心的设计方案,主要阐述了数据中心的框架设计,介绍了框架中基础设施层、信息资源层、应用支撑层、应用层的建设内容,以及各层之间的协作关系,并对建设采用的关键技术进行了介绍。地质资料数据中心的建设,将有效提高华北大区地质数据资源的积累速度,并大幅度提升地质资料的利用率,改善地质资料服务环境,全面推进地质资料的现代化管理和社会化服务工作。另外随着IT技术发展,如绿色数据中心技术及大数据技术等的快速发展,还可以从数据中心能耗降低、数据整理挖掘等方面对方案进行进一步的优化。

参考文献

[1]林小村.数据中心建设与运行管理[M].北京:科学出版社,2011.

[2]谢思铭.城市空间数据中心的应用研究[J].北京测绘,2013(5):23~26.

[3]黄河清,严正伟.国土资源数据中心服务器网络存储虚拟化解决方案[J].国土资源信息化,2013(3):47~52.