网格研究概况

  网格技术是继Internet技术和Web技术之后的第三代互联网技术,主要是把因特网连接成一个巨大的超级计算机,使高性能计算机、服务器、信息处理系统、模拟系统等各种系统集合在一起,为各种开发技术提供支持,实现各种资源共享和协调分布,网格技术的实现能够最大限度地进行网络资源的共享和调度。
  网格技术凭借其独特的计算力联合和分布式计算模式,在科学研究方面有着广泛的应用。目前科学研究的问题越来越复杂化,复杂科学领域的计算通常使用超级计算机来进行数据处理,由于超级计算机本身的造价极其高昂,并不是所有的研究机构都有能力配备。网格技术的出现,可以最大限度地发挥和提高现有网络计算资源的利用率。
  目前,利用网格技术提高现有资源利用率主要有两种办法。一是利用网格技术将各个实验室的超级计算机连接起来,形成一个超级信息处理中心。如美国国家科学基金会正在建立的“分布式兆兆级网格”,利用网格技术将伊利诺州立大学超级计算中心、圣地亚哥大学超级计算中心、阿贡国家试验室和加州理工学院计算中心连接起来,形成一个处理能力约为每秒1.35万亿次浮点操作,存储容量接近700兆兆字节的超级计算中心,以供许多领域的研究机构共享和使用。另外一种方式就是充分利用互联网个人用户的闲置计算机资源进行科学研究。这种方式最为著名的项目就是寻找外星生命的计划。1999年,美国行星学会发表一项公告,呼吁互联网上的天文爱好者参与寻找地球外文明的科学实验。该实验将阿雷西博射电天文望远镜所拍摄到的外太空数据分成若干“小片”,参与该项目的天文爱好者通过下载载有“数据小片”的客户端,该客户端以屏幕保护程序的形式出现,只要计算机处于闲置状态,屏幕保护程序就开始工作,利用本地运算资源分析该“数据小片”,分析完后再将分析结果传回小组。该实验从1999年起已经有超过500多万台个人计算机在闲置之余参与了这项工作,这些利用零星时间所累计起来的计算总量相当20台价值千万美元的超级计算机昼夜不停地工作所能达到的计算能力。
  尽管网格技术有着广阔的发展和应用前景,在其走向大规模应用时也遇到了不少问题,如各个公司之间的技术标准不统一、并非所有的软件都支持分布式计算、分享服务器会带来数据安全问题等,也还有一些非技术性的问题,如人们对新技术成熟与否、共享资源会不会丧失对资源控制权的担忧,也成为网格技术进一步普及的障碍。不过,这些问题都不影响网格正在成为一些国家研究与开发的竞争焦点,很多国家都相继投入巨额资金开展了各种网格研究项目。以下是我们收集到的目前国内外的一些网格研究组织和项目的情况,希望这些情况能够为已经受到国家“863”计划支持的中医药网格研究工作提供些参考和帮助。
  1 网格研究组织和项目
  1.1 全球网格论坛
  全球网格论坛[Global Grid Forum(GGF),http://www.gridforum.org]是由一些技术人员和研究人员创建的,其目标是如何把网格计算成功应用于商业领域。全球网格论坛于2002年6月公布了开放网格架构(Open Grid Services Architecture,OGSA)。这是一组基于现有开放标准的技术规格和标准,旨在为世界各地的网格提供一个公共的技术基础。OGSA以服务为中心,它的服务概念很广,包括各种计算资源、存储资源、网络、程序、数据库等。
  1.2 Globus网格项目
  Globus网格项目是由美国Argonne国家实验室等科研单位共同研发,是目前国际上最有影响的网格计算项目之一。它发起于20世纪90年代,其最初目的是希望把美国境内的各个高性能计算中心通过高性能网络连接起来,提供给美国的大学和研究机构方便地使用,提高现有高性能计算机的使用效率。
  Globus项目组认为,大型应用项目应该由许多组织协同完成,这些组织通过网格计算环境形成一个统一的“虚拟组织”,网格计算环境中的用户、成员、资源可随时加入这种虚拟组织中,各个组织拥有的各种资源都可被虚拟组织中的成员共享,并且各成员之间可以方便地协同完成各种分布式应用和工作。Globus项目组对信息安全、资源管理、信息服务、数据管理及应用开发环境等网格计算的关键理论和技术进行了广泛的研究,开发出能在多种平台上运行的网格计算工具包软件(Globus Toolkits)。Globus工具包的源码向公众开放,任何人可以从其网站上下载源代码进行研究和改进。目前,Globus工具包已经在美国国家网格和欧洲数据网格等多个项目中得到应用。
  1.3 欧盟第六个框架计划中的网格
  欧盟第六个框架计划涵盖IT、生物技术、纳米技术、天文学、食品、环境、能源和知识社会,该项目计划共投资3亿欧元构建各领域的网格应用。
  1.4 欧盟数据网格
  由欧洲核研究中心(CERN)、海德堡大学、英国IBM、法国国家科学研究中心、意大利国家核物理研究院、英国粒子物理与天文研究理事会(PPARC)、SARA等实施,主要进行网格应用开发,包括分子生物模拟、气象预测、计算机辅助工程仿真、网格中间件等方面的研究。
  1.5 EuroGrid
  该项目由Forschungszentrum、Pallas Gmbh、挪威卑尔根大学、法国国家科学研究中心、华沙大学、曼彻斯特大学、瑞士苏黎世高等技术学院等共同参与,研究内容包括网格应用开发,包括分子生物模拟、气象预测、计算机辅助工程仿真、网格中间件等方面的开发。
  1.6 网格协议项目
  由南安普敦大学、DeutcherWetterdienst、曼彻斯特大学、华沙大学、Pallas Gmbh等共同承担,进行UNICORE和GLOBUS之间的兼容性方面的研究。
  1.7 MAMMOGRID
  由西英格兰大学、比萨大学、牛津大学、剑桥大学、Mirada Solutions等共同参与,开发了卫生保健研究的乳房X线照片数据库。
  1.8 Astro Grid
  由爱丁堡大学、莱斯特大学、剑桥大学、贝尔发斯特女王大学等合作参加进行欧盟AVO和美国NVO共同开展的天文学的观测和研究。
  1.9 分布式飞机保养环境
  由约克大学、牛津大学、雪菲尔德大学、利兹大学等共同参与,进行飞机的保养中共享航空数据和发动机数据等方面的研究。
  1.10 网格粒子物理学
  由伯明翰大学、布里斯托尔大学、剑桥大学、爱丁堡大学、格拉斯哥大学、兰开斯特大学、利物浦大学、曼彻斯特大学、牛津大学、雪菲尔德大学、苏塞克斯、皇家学院、CERN等共同合作参与,致力于使欧盟数据网格(CERN)、美国GriPhyN和PPGrid共同开展粒子物理方面的研究。
  1.11 Reality Grid
  由伦敦大学、曼彻斯特大学、爱丁堡大学、拉夫堡大学、牛津大学等共同参与完成,开发材料研究方面的工具。
  1.12 myGrid
  由曼彻斯特大学、南安普敦大学、诺丁汉大学、纽卡斯尔大学、雪菲尔德大学等共同参与,目标为建设一种环境,在这种环境中IT工程师和医生可以共享生物数据和其他数据。
  1.13 日本以IT为基础的实验室
  参与其中的单位有机构原子能研究所、物理化学研究所等,目标为建设通过超级SINET连接超级计算机的虚拟研究环境。
  1.14 日本科学研究费特定领域研究“情报学”A05网格
  由大阪大学、东京工业大学、国立天文台等单位共同参与,目标为建立大阪大学的医疗网格、东京工业大学松冈研究组的P2P数据网格、国立天文台等。
  1.15 东京工业大学校园网格
  由东京工业大学承担,目标为构建大学校园网格。
  1.16 大阪大学生物网格中心
  由大阪大学承担,目标为进行网格基础设施。
  1.17 日本e科学实现项目“超级计算机网络建设”
  由大阪大学等承担,目标为进行连接大规模数据网格和计算网格的技术研究。
  1.18 日本网络计算技术开发项目“网格集群联盟”
  由产业技术综合研究所、东京工业大学、筑波大学、东京大学等单位共同参与,进行实现集群技术、网格技术和10皮字节级大容量数据处理方面的研究。
  1.19 韩国网格计划
  以韩国科技信息研究所(KISTI)为主承担,进行网格中间件开发、数据存取、应用开发等方面的研究。v   1.20 中国科学院计算技术研究所“织女星网格”
主要由中国科学院计算技术研究所承担,主要包括知识网格、信息网格、服务网格、基础研究和网格操作系统5个部分。与国内外其他网格研究项目相比,“织女星网格”的最大特点是“服务网格”的概念。
  网格计算技术的初期主要集中在高性能科学计算领域,研究如何通过资源共享来提升计算能力。网格技术在生物医药方面的应用主要有以下两种。
首先,在高性能计算方面,网格技术主要用来进行科技数据的计算。例如,在分析水稻的基因时,如果单纯用多台计算机进行计算,那么预计需要3万个小时的工作量;而如果采用网格技术,只要400 h就能完成。
  其次,网格技术能满足生物科技对数据的存储和管理等方面相当高的要求。生物数据由于包括物体本身、细胞、染色体、DNA、单个细胞的循环等各个方面的信息,所以非常复杂。这样,数据库的整合就成为关键问题。比如说,在研究水稻的蛋白结构时,可能会用到基因数据库、蛋白质数据库、基因表达数据库和蛋白质相互作用数据库,在这种情况下,应用网格技术,能在较短时间内把需要的数据从不同的数据库中挑选出来综合在一起,省去了多次访问不同数据库的时间。
  目前,网格的另一个研究热点是知识网格。知识网格主要研究内容是:利用网格、数据挖掘、推理等技术从大量在线数据中集中抽取和合成知识,使搜索引擎能够智能地进行推理和回答问题,并从大量数据中得出结论。中国科学院计算技术研究所诸葛海研究员领导的中国知识网格研究组成立于2001年,是最早研究知识网格的课题组之一,目前中国知识网格研究组正在从事知识网格在eScience领域的应用研究工作。
  1.21中国国家网格中国国家网格是国家“863”计划重大专项支持的项目,聚合了高性能计算和事务处理能力的新一代信息基础设施试验。通过资源共享、协同工作和服务机制,有效支持科学研究、资源环境、先进制造和信息服务等应用。以技术创新推动国家信息化建设及相关产业的发展。
  CNGrid以我国自主研制的曙光4000A和联想深腾6800两台面向网格的高性能计算机为主要资源,由分布在全国的10个网格结点组成。其中两个主结点分别设在中国科学院计算机网络信息中心和上海超级计算中心,其他结点分布在清华大学、北京应用物理与计算数学研究所、西安交通大学、中国科技大学、华中科技大学、中科院深圳先进技术研究院、山东大学和香港大学。CNGrid通过专项自主开发的网格软件,集成了各个结点的计算、存储、数据、软件等资源,实现了资源共享和协同工作,形成了科学研究、技术开发和应用示范的网格环境。
  2 结语
  网格技术作为下一代互联网技术目前受到了世界各国的高度重视,在这种背景下,被列为国家高技术研究发展计划(863计划)的《中国中医药科学数据网格服务应用》项目已经启动。网格技术为我们展现了一个资源共享的美好前景,我们期待着中医药数据网格的建立和应用能够为中医药事业的创新和发展做出重要贡献。

摘自: 中国论文下载中心 作者:刘红

 
   
 

 
 
版权所有:石家庄铁道大学四方学院