起名
男孩起名 女孩起名 公司起名 店铺起名 牛年起名 虎年起名 生辰八字起名 英文起名 诗词起名
励志
励志文章 励志故事 励志文案 励志电影 励志名言 励志句子 励志歌曲 励志签名 励志格言 高考励志 励志诗句 励志网名 励志书籍 励志演讲稿 励志小说 励志座右铭 励志人物 励志对联 励志说说 励志作文
句子
伤感的句子 唯美的句子 爱情的句子 优美句子 正能量句子 经典句子 表白的句子 哲理句子 友情的句子 好词好句好段 美好的句子 朋友圈说说的好句子 搞笑的句子 想你的句子
个性签名
微信个性签名 QQ个性签名 伤感个性签名 霸气的个性签名 情侣个性签名 男生个性签名 女生个性签名 英文个性签名 超拽个性签名 非主流个性签名 搞笑个性签名 火星文个性签名 唯美个性签名
十二星座
白羊座 金牛座 双子座 巨蟹座 狮子座 处女座 天秤座 天蝎座 射手座 摩羯座 水瓶座 双鱼座 星座知识
十二生肖
属鼠 属牛 属虎 属兔 属龙 属蛇 属马 属羊 属猴 属鸡 属狗 属猪 生肖基础知识
祝福语大全
生日祝福语 结婚祝福语 订婚祝福语 新年祝福语 情人节祝福语 母亲节祝福语 父亲节祝福语 建党节祝福语 七夕节祝福语 教师节祝福语 国庆节祝福语 中秋节祝福语 爱情祝福语 毕业祝福语 开业祝福语 升学祝福语 高考祝福语 中考祝福语 考试祝福语 搬新家祝福语
说说大全
个性说说 伤感说说 搞笑说说 心情说说 爱情说说 经典说说 qq说说 朋友圈说说 情感说说 晚安说说 下雨说说 霸气说说 七夕说说
范文大全
入党申请书 入团申请书 自我鉴定 工作总结 工作计划 个人简历 辞职报告 检讨书 演讲稿 心得体会 实习报告 转正申请书 导游词 述职报告 策划书 加油稿 慰问信 感谢信 介绍信 邀请函

科学数据要像学术论文一样积极“共享”(科学数据是什么意思)

更新时间:2023-12-28 来源:互联网 点击:

  科学数据是国家科技创新发展和经济社会发展的重要基础性战略资源

  科学数据是国家科技创新发展和经济社会发展的重要基础性战略资源。近年来,随着我国科技投入不断增长、科技创新能力持续提升,科学数据呈现“井喷式”增长,质量也大幅提高。在科技创新越来越依赖于科学数据的当下,各学科的研究范式正因此发生变革。如何进一步加强和规范科学数据管理,成为科技界关心的热点问题。

  为此,本报今推出“如何用好科学数据”系列报道,讲述中国科学院三家科学数据中心的真实故事,剖析它们在科学数据管理方面遇到的问题和挑战,为如何用好科学数据提供可资借鉴的案例和经验。

  中国科学院青藏高原研究所(以下简称青藏高原所)研究员张国庆看着电脑屏幕,手上移动着鼠标,光标在Landsat(陆地卫星)影像上以毫米计的距离移动,定位于中国范围内每一个湖泊。之后,他将有关遥感影像和数据下载。

  在数以千万次地拖动点击鼠标、初步完成数据集后,张国庆再次紧盯每一个湖泊,比对、检查、修正。遇到看着很像湖泊的水体单元,张国庆要耗费更多的精力和时间,确保湖泊边界的准确性。

  这样的动作,张国庆和他的学生持续了3年多,他的目标是了解过去50年全国大于1平方公里的湖泊数量与面积变化及其驱动因素。最终在2019年,张国庆利用超过3831景遥感卫星影像获得长时间序列全国湖泊编目数据集,较现有数据更新、更完整。

  在数据集完成的第一时间,张国庆将其上传到了国家青藏高原科学数据中心(以下简称数据中心),并开放给所有需要者免费获取使用。很快,这一数据集被国家水利部门、湖泊水文研究学者等用于完善我国水资源管理战略、研究生态资源与环境变化趋势、开展乡村调查等。

  “做出来高质量的数据,本应该开放共享。”张国庆告诉《中国科学报》。他从事的是冰冻圈和环境遥感研究,大部分科研工作与数据有关。他还共享了青藏高原湖泊水位、水量变化等数据集。

  数据中心于2019年成立3年来,像张国庆这样愿意开放共享的科研人员越来越多。在数据中心主任、青藏高原所研究员李新看来,在中国实现科学数据的公开共享不仅需要自上而下地授权,还需要激励机制,以增强研究人员对数据共享实践的信心和意愿。

  2020年,一项对我国超过2000名科研人员的调查显示,我国研究人员虽有分享研究数据的意愿,但也担心数据误用及版权、许可受到侵犯。在我国,与同事和合作者私下共享数据的情况更为普遍,而不是更广泛的公开共享。

  “科研人员发论文,谁也没有犹豫,都很乐意公开发表,科学数据也应该是一个道理。”李新笑称,“与十几年前相比,总体上我国数据开放共享的状态是乐观积极的。不过,在我国研究人员中更为广泛地树立数据共享的理念,仍需做大量工作。”

  比如,科学数据哪些该保密、哪些不该保密,边界仍不清晰;科研人员采集的数据还需要整理、描述、质量控制和中英文编辑等,这些“额外”的劳动成果难以被认定;科研人员辛苦付出,其知识产权有时却没有被保护好。

  此外,如今已是“数据洪流”时代,然而由于一些技术问题,诸多质量高、描述好的数据在互联网搜索引擎上难以检索到,或是可以被检索到却难以获取和应用;数据质量和规范化水平不高。有调查显示,只有不到10%的中国地球科学元数据有英文版本,这阻碍了广泛的国际交流。

  促进数据开放共享,从政策、管理到技术等方面都存在一定壁垒,需要更具体的行动,尤其是科研人员的主观意愿和动力。

  不少人在网络平台上“吐槽”不愿共享的原因“工作量大,科技含量低”“又累又苦,有时还有危险”“没有回报”

  清华大学教授阳坤团队用了10余年时间开发了一套中国区域地面气象要素驱动数据集(19792018),为中国区陆面过程模拟提供驱动数据。阳坤的学生何杰博士是这套数据的主要开发人员之一,从2008年还是研究生时便开始采集整理数据。“尽管不需要有技术突破,但很多时候依赖上游数据,需要用各种各样的办法排除可能存在疑问的数据,做出高质量的数据产品。这个过程是繁琐、耗时的。”

  谈及愿意共享的原因,何杰告诉《中国科学报》,气象要素驱动数据集在地学研究中不可或缺。以气象为例,只有给模型输入高质量的数据,才能获得科学的气候环境模拟结果。“做数据集的初衷,就是因为之前使用的数据模拟效果不理想,想为我国地学学者提供一套可靠数据。有人用,才能够体现我们研究的价值。”

  10余年来,何杰与导师开发的这套数据集的精度高于国际上已有再分析数据的精度,成为国内研究广泛使用的气象数据集之一。如今,何杰是青藏高原所的工程师,“没有更多论文考核的压力,可以更充分地完善数据集”。

  自身研究驱动,是数据采集者开放、共享的初衷。但要提高积极性,在李新看来,“数据贡献者的认同感和工作的价值感需要被体现”。

  李新先后承担了国家自然科学基金委“中国西部环境与生态科学研究”和“黑河流域生态水文过程集成研究”两个重大研究计划的项目。这两项计划均要求,受资助课题得到的科学数据必须公开共享。在项目的年度评估、中期考核及最终评估环节,数据提交共享和数据质量都是被评定的内容。

  这两项先导性计划的成功让李新感触颇深,“这种自上到下对公开数据共享予以支持的政策、自下到上对数据贡献者予以激励的机制,是实现中国更为广泛数据共享的关键”。

  前不久,在青藏高原所组织的国际评估中,不少国际专家对张国庆的科研能力以及他的数据工作给予了认可和肯定。

  数据中心也努力让数据贡献者有“价值感”,为每个自有产权的数据赋予唯一的数字对象标识符,体现数据的跟踪价值、引用价值、集成价值和互联价值。

  但这还不够。李新建议,研究成果或项目资助中,除了考查其高质量论文的发表情况,还可增加其所贡献科学数据质量等相关的条款。此外,数据出版也是促进科学数据开放共享的重要手段,主要参考学术论文的出版方式,规范地描述科学数据本身,并接受严格的同行评审,遵从学术出版规范。比如,国内一流综合期刊可率先尝试要求在论文投稿时,同步提交论文相关数据,并且优先选择国内数据中心作为数据仓储。

  “数据计量和规范化数据引用方面,还缺乏统一的规范,不利于对科学数据贡献者的激励和科学数据的开放。”李新表示,加强数据引用,科学论文应按照标准的数据引用格式,引用支持论文成果的关键数据集;同时,加强数据引用计量,体现数据作者的知识产权和贡献,激励数据共享。

  “只有对数据贡献者进行适当的评估、肯定和鼓励,数据共享才能成为一种自愿的机制。当大家都愿意共享时,一种良好的氛围也就形成了。”李新说。

  在数据开放中,不少科研人员有“开放数据可能会给自己的科研工作带来风险”的顾虑,一定程度上影响了他们自下而上开放科学数据的意愿。

  一方面希望应该开放的数据“不设任何边界”开放,另一方面希望需要保密的数据保密,这对矛盾体依然是摆在数据开放共享面前的问题。

  李新说,科学数据已经从“全面开放”原则过渡到目前普遍遵循的“FAIR”原则,即可发现性、可获取、可互操作、可重用。我国2018年颁布的《科学数据管理办法》中按照“开放为常态、不开放为例外的原则”的要求,为解决这个矛盾提供了“指引”。

  不过,政策上还需进一步细化。李新表示,为最大程度地实践数据共享,对敏感数据有清晰的定义及制定具体的共享限制政策显得尤为重要,比如那些涉及国家安全、商业机密和个人隐私的数据当然可以保密,而其他数据应该充分开放共享。开放科学的知识产权协议,如知识共享协议,可作为一种通用协议被引入科学数据共享。

  数据中心采取行动试图打消科研人员的顾虑,保护数据贡献者的知识产权。保留数据贡献者的版权,授权他人在协议限定范围内的转载、使用和二次演绎等;兼顾数据作者对特殊数据保护的诉求,比如可以设置不超过两年的数据保护期,或根据数据作者对数据共享需要附加额外条件的要求,设置数据申请审批流程等。

  “数据中心会不定期地进行安全自查,发现有可能涉密的数据就进行下线处理。”李新说。

  数据中心不断开发新技术践行“FAIR”原则,采用国际标准提供数据引用方式和数据关联文献引用方式,支持数据出版,开发在线大数据分析、模型应用等功能。

  在数据集描述页面添加相关元数据信息,使得数据中心的数据能够在谷歌数据搜索引擎中被查询到;尽量采用地学数据领域广泛认可的标准和规范,减少互操作性障碍;免登录下载,降低数据下载门槛,开发中英文双语数据管理与共享平台,由专业编辑和公司“双重把关”英文数据质量

  今年1月底,李新在总结会上公布,目前已收集并发布青藏高原及周边地区的科学数据集4600多个,累计页面访问量超过1.5亿次,月均下载量达50TB,为青藏高原区域科技创新发展和地球系统科学研究提供了重要的数据支持。数据中心也成为国内首个通过《自然》数据期刊《科学数据》认证的数据仓储中心,大大提高了数据中心的影响力和权威性。

  李新对于数据中心有着更“开放”的愿景:通过整合来自大数据和机器学习的技术,将大数据转化为信息和知识,更有效地为数据用户服务,研发更多青藏高原及周边的高质量再分析数据产品;建立一个平台,使用者无需下载便可在线使用数据集,就像“谷歌地球引擎”一样,使得数据检索更容易、数据访问更广泛。

  “实现数据共享的范式转变,仍需要政府、研究人员和数据中心的积极努力。数据开放和数据贡献者越受到激励,就越有利于科学和社会的发展。”李新对此充满期待。

上一篇:教师教学发展中心举办“结果导向的O-AMAS有效教学设计与实践”工作坊(结果导向的三个标准) 下一篇:返回列表
心得体会推荐
  • 2023年小学科学实验教学计划表 小
  • 小学科学实验教学计划总结(汇总12
  • 最新小学科学实验教学计划级 小学
  • 幼儿园科学公开课活动方案【通用10
  • 中国最大的贪官落马排名情况(中国历史最大贪高官排行)
  • 教师学习党的二十大精神心得体会精选8篇
  • 党员与群众谈心谈话记录内容最新13篇 党员与群众谈心谈话记录内容最新13篇范文
  • 看守所执法细则(看守所执法细则(2013最新版本))
  • 2017年中国最大的黑帮排名(中国黑道排名前十名)
  • 党的创新理论教育心得体会5篇 党的创新理论教育心得体会5篇文章
  • 猜你喜欢的心得体会