13910160652
010-52852558
| |EN
首页 > 实务探讨 > 行政机关 > 观点综述
  • 13910160652
  • ciplawyer@163.com

数据知识产权在科学数据领域的适用

日期:2024-06-14 来源:《科技中国》 作者:顾昕 国家知识产权局 浏览量:
字号:

科学数据的开放共享具有支撑各领域科学研究、降低研究成本、增强科技创新能力的重要作用。正如陈润生院士所言,“科学数据的开放共享和应用,会促进科学界带来新的知识”,特别是与“大数据、人工智能和大模型的融合发展,将激活科学研究的创新力和生命力”。


一、科学数据开放共享的政策及现状


近些年,我国出台一系列鼓励科学数据开放共享的政策。2018年国务院出台《科学数据管理办法》,规定“政府预算资金资助形成的科学数据应当按照开放为常态、不开放为例外的原则……面向社会和相关部门开放共享”。2018年科技部、财政部联合印发的《国家科技资源共享服务平台管理办法》规定,利用财政资金资助形成的科学数据应汇交到指定国家平台,基于公益性科学研究等目的时,国家平台应当无偿提供。2023年国家数据局等17部门印发《“数据要素×”三年行动计划(2024—2026年)》,在“数据要素×科技创新”行动中明确提出“推动科学数据有序开放共享”。


科学期刊关联数据是科学数据的重要来源,以该类数据为例,Science、Nature、Cell等国际知名科技期刊对支撑论文的数据均提出了比较高的公开性要求。国内期刊已逐步开始制定数据政策,譬如《数据分析与知识发现》在2022年发布数据政策,要求在该杂志上发表的论文支撑数据应保存在平台上并按规定开放共享。相较于国际科技期刊普遍制定数据利用政策的现状,国内科技期刊关联数据的管理与共享整体尚处在发展阶段。2022年中国科学技术协会与中国科学院共同组织期刊论文关联数据汇交工作,依托双方共同支持的科学数据银行(ScienceDB)数据库,推动科学数据的存储和利用。


二、权属不清是影响科学数据开放共享的重要因素


近些年我国科学数据的开放共享取得了显著进展,但调查结果显示,依然存在一些阻碍因素。2023年中国科学院计算机网络信息中心联合施普林格·自然、数字科研公司向不同领域的国内科研工作者发放了642份有效调查问卷,调研结果经分析整理后形成《中国开放数据白皮书2023》。该白皮书显示,虽然高达78%的中国受访者赞成将研究数据公开作为常规惯例,“但关于科学数据的权属究竟应如何界定和规制,目前仍无明文规定予以落实。实践中,科学数据权益、论文版权、出版转让协议等内容往往相互交织,其中所涉权利纷繁复杂,研究人员在共享数据时不免顾虑”。


受访者的回答显示,“不确定数据的权属”以及相关的“数据滥用”“被抢先发布成果”是影响科学数据共享的前几位原因,另一个重要的因素是对数据安全和个人信息泄露的顾虑。


三、围绕科学数据开展的数据知识产权登记探索


为了解决因数据集合权属不清所造成的数据流通使用障碍,国家知识产权局探索构建数据知识产权保护规则,对数据处理者付出劳动或投入资本进行一定规则处理的大规模数据集合提供一种“有限”的弱保护,禁止他人的不正当获取或利用行为,目前已在全国17个省市开展了数据知识产权试点工作。截至2024年3月,试点地方已颁发证书超7 000张,接收申请超过1.3万份,包括了销售消费和制造生产等领域的数据,应用场景非常广泛,申请的主体中企业占比90%以上。与其他类型的数据类似,科学数据在开放共享的过程中,也存在因权属不清影响数据流通使用的情况,为了打消这种顾虑,数据知识产权试点地区积极对接科学数据管理机构,探索对科学数据开展数据知识产权登记。


北京试点颁发首例科学数据证书。2023年12月,北京市知识产权保护中心颁发北京市首个科学数据知识产权登记证书“中国区域30米分辨率LS因子数据集”,可用作各种尺度的土壤侵蚀评估模型的输入数据,对环境保护、生物多样性研究等工作具有重要意义。


浙江试点与科学数据银行实现系统对接。2024年1月,浙江省知识产权局与中国科学院计算机网络中心签署合作协议,约定就科学数据知识产权登记、数据标识服务、科学数据存证、科学数据价值研究等问题展开合作。2024年3月,双方实现登记平台的集成联动,科学工作者既可以登陆浙江试点平台完成操作,也可以选择直接在科学数据银行完成科学数据提交、区块链存证、数据知识产权登记申请等系列操作。


四、数据知识产权对促进科学数据流通使用的作用


在开展科学数据的登记过程中,有专家提出反对意见,指出科学数据既然秉持开放共享的理念,不以商业利用为目的,就没有必要进行科学数据权属的登记。对此观点,以下试从基础研究数据和产业应用数据两方面进行分析。


一是基础研究数据。科学数据的开放共享以保障数据安全和不侵犯个人信息为前提,在此基础上,无论是主要用于基础研究的数据,还是适合产业应用的数据,都要按照国家和国内外科技期刊制定的数据政策进行分享利用。但是,实践中科学数据的共享存在不够及时、不够全面、不够准确的现象。


究其原因,一部分科研工作者在不违反前述强制性规定的前提下,并不愿意无偿地分享辛苦科研产生的科学数据,特别是花时间、花精力进行高质量的分享。《中国开放数据白皮书2023》调查显示,科研群体最关注的仍是研究成果是否获得认可,及由此产生的学术影响力,这也是中国受访者共享数据最主要的驱动力。通过数据知识产权登记,从整体上把握大规模科学数据集合的内容特征,明确产生或者加工科学数据的科研工作者是相关数据权益的主体,让科研工作者可以通过分享数据获得科研认可和成就感,有助于提升其高质量地分享科学数据的主观意愿,进而促进科学数据的共享利用。


此外,科技工作者即便获得数据知识产权,也并不妨碍管理机构执行国家和各个科学期刊制定的数据政策,开放分享符合条件的科学数据。


二是与产业应用密切相关的数据。《科学数据管理办法》明确了科学数据的概念,除了基础研究之外,在“工程技术科学”“应用研究”领域产生的原始及其衍生数据,也属于科学数据的范畴。在实践中,一般认为能源、材料、医疗等领域的科学数据与产业应用的关系比较密切。


国家数据局等部门印发的《“数据要素×”三年行动计划(2024—2026年)》,在“数据要素×科技创新”行动中也同时对基础研究和产业应用两方面提出要求。一方面提出“科学数据面向基础学科,提供高质量科学数据资源与知识服务,驱动科学创新发现”;另一方面也明确要“以科学数据支撑技术创新,聚焦生物育种、新材料创制、药物研发等领域,以数智融合加速技术创新和产业升级”。


对于这些与产业应用密切相关的科学数据,一旦运用到具体的商业应用场景,只有明确相对清晰的权属关系,才能做好利益分配,让数据在不同主体之间真正流转利用起来。数据知识产权登记就是通过明确数据集合的权属,为后续商业开发利用提供相应的依据。以湖北省2022—2024年城乡适龄妇女宫颈癌免费筛查项目采集的上百万份样本数据为例,将这些经过加工的海量样本数据用于训练宫颈癌筛查的人工智能大模型时,由于项目的公益属性,采集的海量样本数据可以视为医学研究领域的科学数据,但如果这些数据获得合法授权后拟用于商业活动,譬如用于训练其他肿瘤筛查人工智能大模型时,虽然仍是用于医学研发,但同时也兼具了商业数据的属性。


在《中国开放数据白皮书2023》中,与产业应用密切相关的科学数据就体现出这种权益诉求。譬如该白皮书在介绍《中国对地观测科学数据开放共享的现状和趋势》时指出,对地观测“63%的科学研究人员在保证合法权益的前提下愿意共享自己的科学数据给其他人”,在对地观测领域科学数据开放共享的背景下,当前面临的挑战包括“如何平衡商业利益和科学家需求”,“所有者的权益和贡献如何体现和保证”等,并进一步分析认为“只有实现不同群体间利益的平衡才能进一步促进对地观测科学数据的开放共享”。 


五、小结


科学数据以开放共享为基本导向,但共享不够及时、不够全面、不够准确的现状表明,现阶段仍缺乏一定的激励措施。调查显示,缺乏科研认可及成就感是科研工作者不能或不愿分享科学数据的重要原因之一。数据知识产权登记通过整体上把握大规模数据特征的方式,在不用全部公开科学数据的基础上明确科研工作者对科学数据进行加工处理的贡献点所在,通过设定一种有别于传统专利权的“弱权利”,既阻止他人不正当获取和利用该数据,也允许他人合法自行产生类似甚至相同的数据,避免产生科学数据的垄断。


需要留意两点,一是通过互联网已经全部开放共享处于公开状态的科学数据,视为已经完全进入公有领域,即便在目前国家知识产权局开展的数据知识产权试点中获得登记,因为不再符合“不正当”获取这一侵权构成要件,实践中也无法再寻求有效保护。二是我国大量科技研究文献存在将整体数据、个体数据,甚至将“论文”都称之为“数据”的现象,在讨论数据权益时,也并不区分个体数据中蕴含的著作权、隐私权、个人信息与整体数据权益的差异。数据知识产权保护的数据仅是指具有相当规模的整体数据,不包括个体数据及其蕴含的权益。