当前位置 >>  首页 >> 科学普及

科学普及

中国机构CNS月报(2014年8月)

来源: 时间:2014-10-01
目录

  • 一、导语
  • 二、8月份中国机构CNS发文与学术领域热度
  • 三、8月份城市&地区在CNS的论文和影响因子
  • 四、8月份中国机构发文CNS的走势
  • 五、8月份CNS发文机构论文量统计
  • 六、8月份CNS论文通讯作者的项目数和经费
  • 七、受关注的权威看法

 一、导语

自然系列期刊在2012年的论文统计显示,发文140篇论文的中国科学院超过日本东京大学排名亚洲机构第一位,这也是Nature Index统计以来中国科研机构首次排名第一,反映出中国顶尖科研机构在数量上领跑亚洲。据生物探索统计,2014年6月份中国科研机构在Nature、Cell和Science三大系列期刊的总发文量是58篇,略低于上月发文数量。

在生物学领域,三大期刊(Cell、Nature和Science)及其子刊,简称CNS,倍受中国研究人员推崇,他们希望凭借CNS在学术界的威望将中国尖端、前沿的研究成果向全世界传达。这些研究动态代表了中国科研机构的最高水平。生物探索希望对此进行统计,从发文成果追踪国内科研经费动向,便于生物医药圈内的研究人员和学生能够实时了解中国顶尖研究人员从事研究的领域和方向。

 

二、8月份中国机构CNS发文与学术领域热度

(饼状图表示期刊论文百分数)

2014年8月份中国研究机构在三大系列期刊共发表77篇论文,包括Cell系列19篇、Nature系列56篇和Science系列2篇,其中Nature主刊,Science主刊及Cell主刊的发文量分别为6篇、0篇和0篇。从发文比例上看,中国机构发表的论文一直处于上位的Nature系列期刊略高于7月,Cell系类期刊发文数量与上月持平,而Science发文数量为2篇,低于上月。从地区上看,大陆仍然是中国机构发表CNS论文的主体,台湾地区本月发文量数量为2篇,略低于上月,香港地区发表文章数量为1篇,与上月持平。

8月份,CNS发表的中国机构研究论文中,分子生物学领域(29篇)排在第1位,基因组学排在第二位,有22篇文章入列,细胞生物学有9篇文章入列,排在第三。从学术热度上看,8月6日,来自北京生命科学研究所邵峰(Feng Shao)研究员,揭示了炎症caspases是细胞内脂多糖(LPS)的天然免疫受体。Caspase家族是一类与细胞凋亡和炎症反应重要相关的蛋白酶,该家族14个成员之间同源性很高,结构相似。根据结构和功能的不同,可把Caspase家族分为三类:凋亡启动组、凋亡执行组和炎症反应组。炎症反应组由人源Caspase-1、Caspase-4、Caspase-5及鼠源Caspase-11、Caspase-12组成,称为炎症Caspase。相关研究发现发表在的《自然》(Nature)杂志上。

来自杜克大学、杭州师范大学的研究人员鉴别出了一个有可能帮助科学家们培育出抗旱作物的基因。这一叫做OSCA1的基因编码了植物细胞膜中的一种蛋白,它能够感知水分可利用量的变化,相应地调整植物的节水机器。相关论文发表在8月28日的《自然》(Nature)杂志上。杜克大学的裴真明(Zhen-Ming Pei)教授和杭州师范大学的远方是这篇论文的共同通讯作者。

 

三、8月份城市&地区在CNS的论文和影响因子

(影响因子源自MedSci查询系统,取小数点后一位)

从CNS论文影响因子看,8月份北京以440.683分卫冕排行榜,从上图可以看出,上海以152.543分居第二,北京和上海的CNS论文影响因子领先其它城市&地区。

在2014年8月份,北京(27篇)和上海(13篇)是发表CNS论文较多的城市,而其它城市&地区发表CNS论文数都不多。另外,本期CNS实际发文量77篇。

对城市&地区的CNS影响因子统计,生物探索网站希望向用户提供关于地区研究水平的一项指数,让科研人员在从事各自研究领域的同时选择较高的研究平台和学术氛围。此外,由于论文来自不同的经费项目,因此城市&地区的CNS影响因子能从一个方面反映国家经费的分配比例。

 

四、8月份中国机构发文CNS的走势

(数据统计源自NCBI网站Pubmed)

对2014年1月至2014年8月中国机构发文CNS进行统计,数据表明:Nature及其子刊发表的中国研究论文数量处于高位,总计291篇,月最高发文量达到56篇。相比较而言,Science及其子刊发表一直处于中国研究论文数量的低位,总计12篇,其月最高发文量也仅为3篇,本月为2篇。Cell及其子刊共发表的文章数量为141篇,本月与上月持平。

 

五、8月份CNS发文机构论文量统计

研究机构 CNS论文
  8月份发文量 近5年总数 总数
中国科学院上海生命科学研究院 6 209 377
北京大学 6 169 246
中国科学院生物物理研究所 6 105 217
清华大学 8 156 213
复旦大学 5 117 164
中国科学院动物研究所 1 94 156
深圳华大基因 3 128 151
上海交通大学 4 115 148
中国科学技术大学 2 67 103
南京大学 1 69 102
浙江大学 1 73 97
中国医学科学院 1 47 96
中国医学科学院 北京协和医学院 1 47 96
第二军医大学 1 59 95
中山大学 2 63 82
四川大学 3 47 69
山东大学 4 47 67
华中科技大学 2 36 58
同济医科大学 1 25 49
阳明大学 1 30 48
国立清华大学 1 27 48
北京生命科学研究所 2 32 47
香港中文大学 1 35 45
南京医科大学 3 29 39
同济大学 1 36 38
中国科学院上海药物研究所 1 21 36
南开大学 1 26 31
中国医药大学 1 26 31
中南大学 1 18 31
华东师范大学 1 21 23
南方医科大学 2 17 21
天津医科大学 2 13 18
大连医科大学 1 12 16
首都医科大学 1 13 16
台湾国立卫生研究院 1 12 16
南京农业大学 1 7 15
暨南大学 1 4 14
重庆医科大学 1 11 14
中国科学院植物研究所 1 9 13
哈尔滨医科大学 1 10 12
河北医科大学 1 7 11
杭州师范大学 1 9 9
青岛大学 1 3 9
西北农林科技大学 1 8 8
中国海洋大学 1 6 7
军事医学科学院 1 5 7
徐州医学院 1 4 7
中科院华南植物园 1 2 4
中国科学院武汉病毒研究所 1 4 5
南方科技大学 1 3 3
福建师范大学 1 3 3
新乡医学院 1 2 3
江苏省农业科学院 1 3 3
东北林业大学 1 3 3
电子科技大学 2 2 2
(数据源于NCBI网站Pubmed)

从8月份中国机构CNS论文榜单上看,排名前三的分别是中国科学院上海生命科学研究院、北京大学和中国科学院生物物理研究所。针对每个机构的发文量,超过1篇的研究机构是清华大学(8篇)、中国科学院上海生命科学研究院(6篇)、北京大学(6篇)、中国科学院生物物理研究所(6篇)、复旦大学(5篇)、上海交通大学(4篇)、山东大学(4篇)、深圳华大基因(3篇)、四川大学(3篇)、南京医科大学(3篇)、中国科学技术大学(2篇)、华中科技大学(2篇)、中山大学(2篇)、北京生命科学研究所(2篇)、南方医科大学(2篇)、天津医科大学(2篇)、电子科技大学(2篇)。

在8月份CNS论文的统计数据中,发表CNS论文数量共77篇,其中,杭州师范大学、西北农林科技大学、中国科学院武汉病毒研究所、南方科技大学、福建师范大学、江苏省农业科学院、东北林业大学、电子科技大学的CNS论文全都在近5年内。

 

六、8月份CNS论文通讯作者的项目数和经费

研究机构 通讯作者 项目金额/万 项目数/个
北京大学 程和平 8381 8
北京大学
中国医学科学院
天津医科大学
尚永丰 2603.5 13
中国科学院上海生命科学研究院 罗振革 2275 6
南京大学物理学院 王炜 1880.5 17
清华大学生命科学学院 陈晔光 1677.4 14
清华大学 施一公 1418 8
清华大学 李蓬 1263.3 9
北京大学
南开大学
中国科学院
施章杰 1078.2 15
上海交通大学 房静远 787 7
中国科学院植物研究所 种康 778.9 12
军事医学科学院生物工程研究所 杨晓 680 11
南方医科大学 高天明 670.4 14
中国科学院生物物理研究所
中国科学院武汉病毒研究所
唐宏 661.1 8
中国科学院上海生命科学研究院 王慧 631 7
南京医科大学 沈洪兵 624.5 7
重庆医科大学 杨培增 605 7
南京医科大学 朱东亚 590 6
清华大学 周兵 584 9
清华大学 欧光朔 560 3
中山大学 贾卫华 547 5
北京大学血液病研究所 黄晓军 546 5
中国科学院动物研究所 王海滨 495 6
清华大学 潘俊敏 493 5
同济医科大学
华中科技大学
马丁 484 8
深圳华大基因 王俊 470 3
复旦大学 陈国颂 424 3
山东大学医学院 赵伟 423 11
中科院生物物理研究所 范祖森 413 7
天津医科大学肿瘤医院 陈可欣 408 4
中国科学院上海生命科学研究院 张雷 354 6
暨南大学 洪岸 350 4
清华大学 董晨 350 3
电子科技大学四川省人民医院 杨正林 344.5 5
中国科学院武汉病毒研究所 陈新文 337 4
浙江大学医学院 王建莉 328 7
中山大学 李隽 310 1
第二军大学 陈涛涌 305 9
中山大学 宋立兵 290 6
复旦大学 孙兴怀 277 4
上海交通大学 许杰 265 4
上海交通大学 高维强 260 1
中国医学科学院
北京协和医学院
林东昕 260 5
中国科学技术大学生命科学学院 王光辉 255 4
中科院生物物理所 张凯 249 8
上海交通大学 黄钢 240 4
清华大学 李景虹 238 6
华东师范大学 翁杰敏 236 2
中国科学院动物研究所 段恩奎 230.8 13
山东大学医学院 韩丽辉 227 11
复旦大学 江明 214.5 10
军事医学科学院生物工程研究所 滕艳 213 7
中南大学湘雅医院 易斌 210 6
南京农业大学 窦道龙 196 6
中国科学院生物物理研究所 王艳丽 190 4
中国海洋大学
青岛大学
南京医科大学
郁金泰 185 4
华中科技大学 王宁 173 5
大连医科大学 燕秋 158.4 9
中国海洋大学
青岛大学
南京医科大学
谭兰 153 4
南京医科大学 罗春霞 152 3
中国科学院上海药物研究所
同济大学
谢欣 150 2
福建师范大学 程栋梁 137 3
天津医科大学 汤华 126.5 5
北京大学 张研 125 3
北京大学 熊敬维 122 2
四川大学 肖波 116 2
江苏省农业科学院 张保龙 112 2
首都医科大学 段钟平 109 3
山东大学附属医院 高聆 107 3
复旦大学 钟涛 103 2
中国科学院上海生命科学研究院 冯英 103 2
南京大学物理学院 曹毅 102 2
中国科学院生物物理研究所 秦燕 97 2
哈尔滨医学大学 张瑞杰 94 5
上海交通大学附属新华医院 刘颖斌 87 2
上海生命科学研究院 季红斌 82 4
香港中文大学
四川大学
陈小章 70 1
中科院上海生命科学研究院 朱健康 65 2
中科院上海生物化学与细胞生物学研究所 周界文 61 1
中国科学技术大学 张志勇 60 1
中国科学院动物研究所 陈琦 56 2
复旦大学附属肿瘤医院 魏庆义 40 1
西北农林科技大学 许金荣 40 1
新乡医学院 王立东 35 1
中国医学科学院 赫捷 31 1
军事医学科学院生物工程研究所 杨冠 30 2
山东大学医学院 孙金鹏 25 1
北京生命科学研究
中国科学院生物物理研究所
邵峰 20 1
南方科技大学 魏志毅 20 1
山东大学医学院 于晓 20 1
南方医科大学 安靓 15 2
(数据源于NSFC)

对于2014年8月份中国机构发文CNS的90位通讯作者(统计量不完全),国家自然科学基金项目提供了详细的项目金额和数量(从1986年至2014年)。北京大学的程和平以8341万元高举榜首,项目个数为8个;北京大学、中国医学科学院、天津医科大学的尚永丰以2603.5万元项目数为13个位居第二;中国科学院上海生命科学研究院的罗振革以2275万元项目数为6居第三。

排名前10的通讯作者来自3个城市,分别是:北京(7位)、上海(2位)、南京(1位)。其中,北京地区7位通讯作者位于项目金额榜前十位之内,这反映出北京位列8月份CNS中国机构影响因子之首的经费基础。

 

七、受关注的权威看法

贺林:基因测序发展需要更多顶层设计

今年2月,国家卫生计生委和国家食品药品监督管理总局联合对二代基因测序技术发布“叫停令”,曾在业界引起广泛喧哗和质疑,如今又对一家企业的两款产品应用突然放开,基因检测研究和应用相关人士对此政策可能对未来产业发展带来的实际效果均不乐观,更多的是喜忧参半。业内人焦虑的是:国家对产业政策的制定该如何更具有前瞻性和战略意义,而不是简单的“一收一放”,该如何减少“随心所欲”给产业发展带来的不利影响?如何以顶层设计通盘考虑一项技术研发及其产业化的应用?面对中国特有的遗传和基因市场,如何确立具有中国特色的基因产业发展步骤,使基因检测技术真正为国民造福。针对上述质疑,科技日报记者日前采访了中国科学院院士、著名遗传生物学家、上海交通大学Bio-X研究院院长贺林教授。

创新启示录:基因测序产业应用前景广泛

《中国出生缺陷防治报告(2012)》指出,我国出生缺陷发生率为5.6%,每年新增出生缺陷患儿89.6万,其中结构畸形25万,防治形势严峻。这些实际仅是来自刚出生时的统计数据,如果把后发的也进行统计,出生缺陷人数要远远高于此数。

“冰岛的人口不过30万人,如果将中国具有出生缺陷的人数相比较的话,就相当于我国每年产生三个冰岛人口的‘残疾’人,这不是一个小数目。如何更早地发现这些遗传基因缺陷,就要依靠基因检测技术的发展和临床应用”,贺林教授告诉记者。

2003年,人类基因组计划完成真正改变了人类,颠覆了世界,带给人们的是一个势不可挡的新兴的巨型产业。花费30亿美元,耗时13年所完成的人类基因组计划,如今已经获得了广泛的应用。据不完全统计,到目前为止已为人类产生7000亿美元的回报,这一势头仍在扩大。贺林教授认为,我国在这一领域离世界的领跑线并不远,甚至齐平或超出。7月初,华大基因“千万家庭远离遗传出生缺陷”计划中开展的一些罕见病检查,以及目前6种单基因疾病(地中海贫血、先天性耳聋、枫糖尿病、肾上腺皮质增生、鱼鳞病、假肥大性肌营养不良DMD)的无创产前基因检测在国内都具有一定的市场应用前景。贺林教授本人的团队正在与合伙人计划开展一项全球最大的单基因病致病基因的检测诊断项目,而这一技术的核心正是基因测序。

“一项新的技术发展到产业应用阶段需要具有前瞻性的战略规划,如果真是由于一个不够成熟政策使我国痛失市场发展良机,岂不成了历史的罪人!”贺林教授说,“叫停令”的解冻虽然来得有些突然,但对于产业发展的确是个“福音”。

推广测序技术需要战略高度

基因检测技术有广泛的市场前景,在应用中监管政策的制定是不可或缺的市场保障,但是,该如何使政策的制定更具有可持续性?有业内人士普遍认为,针对基因测序诊断产品(包括基因测序仪及相关诊断试剂和软件),国内目前仍按照《医疗器械监督管理条例》及相关产品注册的规定申请产品注册。这或许是一个最为简单和机械的管理办法,注重形式不重内容的管理办法,没有考虑到基因组医学和基因测序发展的特征和现状。

贺林教授提出,从美国的经验看,除了FDA认证之外,更侧重一项临床实验室改进修正案(Clinical Laboratory Improvement Amendments,CLIA),目前有近25万个CLIA实验室由另外一个政府机构CMS(The Centers for Medicare & Medicaid Services)管理。其中,FDA管公司生产出来的产品,而CMS则管实验室服务。只要对应实验室的人员执照齐全,通过了政府认证的严格质量管理,就可以对外提供自己验证过的收费临床服务。犹如政府管理餐厅卫生,碗、筷干净度消毒状况,桌子清洁,厨房没有老鼠等;但不管做出来的菜味道,更不管菜品是否卖得出去。这样做的好处就是:在巨大的医疗需求和日新月异的新技术面前,所有的CLIA可以跟据市场需求,快速开发出各种新的诊断应用。“政府不必对应接不暇的每个新应用做出回应,而病人可以根据自己的需要,即时得到新的诊断服务”,贺林教授认为这样的操作将有利于技术与市场的最佳结合。

基因测序在内的基因检测结果解读需要专业人士在计算机的帮助下完成。然而,所需的遗传咨询门诊在我国仅局限在妇产科辅助生殖等部门,在其他的科室中,遗传咨询还很少见。这是目前最值得忧虑的。未来的医生应该具有一定的遗传和基因检测的知识,遗传咨询师的培训和教育是国家要关注的重要环节,对于基因测序市场的发展具有战略意义。

“遗传咨询师也不只是临床医生的专利,应该向社会推广,让他们能够为社会化的基因检测进行正确的解读,”贺林教授说,“与此相配合,我国急需要建立‘临床遗传学’学科。”

除了用于出生缺陷的防治以外,基因测序对于肿瘤治疗的指导用药也有着非常重要的意义。贺林教授提到,以Life Technologies公司开发的肿瘤热点突变试剂盒为例,可以一次检测50个肿瘤核心基因的2800个热点突变,为FDA批准的28种肿瘤靶向药物提供靶点基因候选,为癌症的化疗、放疗和靶向治疗提供用药指导和预后预测,只需1—2天,并比现有技术更准确。这一类以基因测序技术为核心的药物基因组学产品可以为临床工作者带来非常大的帮助,药物与基因的共同研发应用将成为下一步医药产业发展的重点。

找寻切实可行发展之路

围绕无创产筛应用为主的二代测序技术,3月6日国家卫计委发布《关于开展高通量基因测序技术临床应用试点单位申报工作的通知》,全国众多医疗机构,包括部分从未接触该技术的单位,都积极申报;6月30日,两个二代测序仪器和无创产筛的配套试剂获得了国家药监局批文。业界人士提出,以尚未获得原产国批文的进口仪器,换个商标以“国产化”申报获批的现象,不得不引起人们的警觉和深思。

对此,贺林教授也谈到了他的见解,自主创新二代测序仪器开发方面,我国还没有较好的产业基础,目前几乎只能依靠整机进口。如果有一些厂商,将进口整机换个外壳甚至只更换一个商标,就作为自主研制生产的医疗器械进行申报,那是欠妥的(对于企业间的购置兼并可另行考虑)。他还说,“历史无数次证明,水龙头不掌握在自己手里,一定会受制于人”。

记者了解到,目前,国内强烈反弹的意见主要集中在拿批文资质应该正规。贺林教授对此指出,二代测序应用于产前筛查,技术复杂、流程繁多、费时费力,对人员、场地、质量控制和管理要求苛刻,仪器和技术的完全国产化还需时日,因此,断不能饮鸩止渴,以换商标的伪国产化仪器去获取医疗器械证书,使舆论普遍担心两个风险:(1)阻滞我国高端医疗器械的自主化进程,(2)获证后,一些不具备条件的医疗机构立即自主开展个体化应用。多数或由仪器投放公司派出不具备资质的人员进行实验操作,必将带来严重后果。这一可以预见风险应引起高度的事先关注。

贺林教授表示,除以上社会的普遍性担忧外,技术准入和物价也尚需时日。对于基因测序这一革命性的新技术的应用,全社会需要更多关注,临床与科研需要密切结合,发展转化医学,同时鼓励社会资本的介入,走出产学研结合一体的创新之路。此外,除了政府部门批准新一代测序以外,传统的一代测序在临床上也有广泛的应用需要。他说,“我作为中国遗传学会副理事长,希望与各相关人士一道为我国的基因测序检测找出一条切实可行的路,以合理和高效地推动我国人口健康事业的有序发展”。

贺林教授,1991年获英国佩士来大学博士学位,1992年在英国爱丁堡大学完成博士后研究,1995年在英国MRC爱丁堡人类遗传学研究所完成高年资研究者工作,1996年任中国科学院研究员,先后担任上海生命科学中心(上海脑研究所)、上海生理研究所、上海生命科学研究院营养科学研究所PI,2000年任上海交通大学教授,Bio-X研究院院长,2007年任复旦大学教授,2007-2012年复旦大学生物医学研究院院长。

2009年,贺林教授团队揭开了倍受世人关注的遗传界百年之迷——第一例孟德尔常染色体遗传病A-1型短指(趾)症致病基因的精确定位、克隆、突变检测与致病机理的揭示。发现和报道了世界上第一例以中国人姓氏“贺一赵缺陷症”命名的罕见的恒齿缺失为特征的孟德尔常染色体显性遗传病,并成功完成致病基因定位工作,由此结束了中国作为遗传资源大国而又从来没有自己发现和命名遗传病的尴尬局面。此外,建立了世界上最大的精神神经疾病样品库并利用这一样品库系统地研究和分析了中国人群精神分裂症的易感基因与疾病发生的关系;在精神疾病的营养基因组学和药物基因组学研究方面取得了重要进展,证实了出生前的营养缺乏会显著增加成年后精神分裂症的发病风险。在DNA计算与技术方面取得了数项有显示度的工作。并且,还结合国情特点提出“百家姓”与药物开发相关性的新思路。他的发现得到国际公认。

中科院李亦学:生物大数据“行路难”

“大数据”时代已经到来。目前,大数据成为继云计算、物联网之后IT行业又一大颠覆性的技术革命。而随着技术的普及,大数据在生物、金融、零售、能源、交通等领域已得到应用,正在渗透到人们生活的各个方面。

同其他领域相比,我国在大数据方面和国外起点一致,可以说,大数据时代也是我国一次新的发展机遇。为此,本报将开设专栏介绍大数据在不同领域的应用现状及我国大数据发展亟需破解的难题,与读者共迎大数据时代的来临。

虽然我国数据产生量很大,但是生物大数据与国外相比仍比较落后。

世界杯预测、高考预测、当前哪种男性最受欢迎……这些大家所熟悉的分析都用到了大数据,但是很少人知道,大数据早将“手”伸到了生物医学领域,开始了疾病预测。

欧美国家对生物领域发展大数据十分重视。今年3月,英国宣布,英国医学研究理事会(MRC)将投资3200万英镑资助首批5大项目,来提高医学生物信息学的能力、产能和核心基础设施。这项“医学生物信息学计划”预计总投资5000万英镑,将通过建立耦合复杂生物数据和健康记录的新方法,来解决关键的医学难题。

早在2012年3月,美国奥巴马政府就宣布推出“大数据的研究和发展计划”,将大数据提升到了国家战略层面,承诺将投资两亿多美元。2014年,美国政府就如何充分利用生物医学大数据,又启动了Big Data to Knowledge计划。

虽然我国企业也频频在大数据上有所动作,但是上海生物信息技术研究中心主任、中科院上海生命科学研究院生物信息中心主任李亦学对《中国科学报》记者指出:“虽然国内大数据在其他方向的发展远超国外,但是生物大数据与国外相比仍比较落后。”

没有免费的午餐

生物大数据发展相较国外落后,并不是因为没有数据量产生。

据我国最早从事理论生物学和生物信息学研究的科研人员之一、中国科学院院士陈润生介绍,以华大基因为代表的基因测序机构为生物大数据的产生作出重要贡献。

华大基因当前的测序量大约占据国际数据量的40%左右,而且随着技术发展和测序手段成本的下降,几乎所有的研究型大学和研究单位,无论是在农业、林业还是医学,都对基因测序有所涉及。

“基因组层面的生物大数据的发展带动了蛋白质组、代谢组、生物网络等各个层级的相关生物大数据的海量产生,但是我国当前还未能建立统一的生物数据信息中心。”陈润生指出。

李亦学也认为,生物大数据滞后于国外的最根本原因在于我国没有大型的综合生物大数据库,也没有生物大数据中心平台。

这意味着,我国开展研究时只能向国外的大数据库“求助”。虽然这些大数据库都宣称,只要递交申请就可免费共享数据,但是,天下并没有免费的午餐。

记者了解到,国际一些大型生物学数据库要求数据使用申请者提交详细的数据使用说明,即使数据库中已存有我国科学家所提交的相当规模的数据,但想再取出使用却绝非易事。

李亦学称:“免费共享数据仅是从理论上而言,实际核心数据不会及时交给申请者,内行会发现获得的数据都是非核心的或不完整的。临床医学相关的大数据库则有专门委员会来审核数据申请者,如果拒绝申请,也不会给出理由。”

因此,为了具备拿数据的资格,我国科学家们常需反复准备申请材料,却往往再也没有下文。“受制于人,非常恼火。”李亦学感叹道。

建大平台遇“难题”

国家级生物数据库的建立,往往带有公益色彩,需要有长期稳定的投入和专业的技术队伍。据专家介绍,上世纪90年代,我国有关部门已考虑建立国家层面的数据中心,但直到现在,仍未讨论出具体的实施方案。

那么,为何数据中心迟迟未能建立?

李亦学向记者算了一笔账,英美国家对数据库的建立投入了很多资金,引进的人才大部分有博士学位,每年的费用都由国会拨款支持,来源比较稳定,一年约需投入1亿美元。

“我国如果建立一个类似的生物大数据中心,应该也要有数百人的编制和每年几亿元的长期稳定投入。这笔钱如果由政府支付,障碍仍然不小。”李亦学分析。

陈润生也指出,建立一个国家层级的数据平台虽然在科学界是共识,但是这个中心建立的地点、呈现的方式(实体还是虚拟)、囊括的内容、涉及的权利范围以及怎么管理、由谁来管理都有很多不同的方案。

在这样的形势下,不能集中精力、统一调配全国的生物数据成了一道难题。

“用基因组数据得跟华大商量,用蛋白数据得跟其他人商量,小数据中心虽然有,但都是各自的,没有统一的协调管理。没有全国的生物数据中心,则无法统筹。”陈润生道出了难处。

同时,我国生物数据虽然产出量大,但利用率远远不够。尽管产生的数据提供了很好的信息,但是挖掘其全部价值还牵扯到很多方面。如数据量很大,能否在短时间内分析和挖掘其价值是个问题。

而且,大数据产生后需要相应的理论、技术和方法来跟进,也需要新的工具和方法。业内人士指出,国内现有的生物大数据分析能力虽然与欧美相差不大,但是在数据分析构架、软件系统与先进的IT技术接轨上有待提升。

植根中国“土壤”

李亦学指出,生物大数据虽然面临这些障碍,但是可以靠“抓目标、强合作”追上国际的脚步。

他认为,中国发展生物大数据的优势在于有海量样本。

当下应该做的,就是保护国内的生物数据资源并且寻找有价值的利用方向。

“一是要明确生物大数据发展的目标和途径,二是敞开胸怀和国内的研究单位合作,将生物大数据这项事业做好。”李亦学强调。

例如,我国目前实行的医联工程在上海地区已经取得了一些成果。

三甲医院和社区医院把就诊居民的就诊记录和健康档案全部联网,建立了数据库体系,包含了3400万份电子病历和档案。

李亦学表示,在征得病人同意后调用健康档案和检查结果,既提高了看病效率,又不会妨碍隐私保护,像小水珠一样的数据最终也能汇聚成汪洋大海,有益于生物大数据这项国家战略资源的保护与利用。

陈润生也指出,生物大数据发展应该脚踏实地,植根于中国的“土壤”,挖掘自身特色。

“中国的物种自身具备多样的特点,完全有可能形成有特色的生物大数据体系。在这样的形势下,瞅准问题,发展生物大数据的目的性更强一些,这才是我们要关注的。”陈润生说。

 

http://www.biodiscover.com/news/cns/113183.html

附件下载: