解读美材料基因组计划:数据共享乃大势所趋
时间:2017-12-07

  美国物质基因组项目解读:数据共享是时代的潮流

  MGI于2011年6月启动,旨在将能源,运输和安全等领域尖端材料的开发时间和资金成本减半。

  图片来源:AMANDA BARNARD

  美国基因组计划(MGI)启动两年后,五位专家在“自然”杂志上发表了一篇文章,指出材料科学家应该如何在计划中工作。

  Sally Tinkle:从其他项目中学习

  华盛顿科学和技术政策研究所政策分析员

  MGI于2011年6月由总统巴拉克•奥巴马(Barack Obama)推出,旨在将能源,运输和安全等领域尖端材料的开发时间和资金成本减半。两年后,已有数亿美元投资于学术界,工业界和联邦机构的项目。

  数据共享和计算工具的发展对于MGI的成功至关重要。先进材料的复杂的物理和化学性能可以根据不同的应用需求量身定做,在合成,生产和使用过程中可以改变。跟踪这些特性是一项艰巨的任务,MGI的努力包括术语标准化,数据存档格式和指导报告。

  幸运的是,MGI可以利用现有的纳米技术合作。 10年前成立的国家纳米技术计划(NNI)是一个为MGI提供1到100纳米范围材料的合作项目。 MGI的材料范围在纳米至微米范围内。

  MGI可能会考虑加入NNI的纳米技术知识基础设施计划,该计划于2012年5月启动,旨在开发数字数据和信息框架,并加强科学和建模社区之间的协作,该计划模仿NASA的技术准备标准,这套数据准备标准旨在为传达材料数据的质量和成熟度提供基础。

  MGI也可以加入NNI和欧盟委员会的合作关系,支持两岸对话,讨论数据共享的具体细节。

  数据共享是一项固有的协作活动,有可能加速材料科学的发展。 MGI可以使现有项目更具活力,成为各种材料信息共享的平台。

  David L. McDowell:鼓励分享

  佐治亚理工学院材料研究所执行主任

  MGI必须避免项目完成时的所有目标。对于合作和共享数据和技术的科学家和工程师而言,激励措施至关重要。 MGI必须有每个人都可以从中受益的东西。

  数据共享的环境必须吸引和促进合作。除了检索他们想要发现新材料的现有数据之外,利益相关者也有广泛的兴趣,并期待改进产品。直观和健康的在线环境以及分散和有机的网络基础设施可以激励不同的用户贡献更多的集中式网络环境。

  社交网络策略可以使不同技能的用户追求共同的兴趣。应该鼓励双赢的方式。例如,上传实验数据集以交换建模工具将推动进一步建模。但是,需要制定一个明确的协议来管理数据使用伦理等等。

  最大限度地利用信息对MGI基础设施投资者来说是最重要的。例如,从国家同步加速器和中子衍射设施衍生的实验数据集应该最大限度地归档和使用,以便从大型超级计算机模拟器获得数据。

  开放存取的规则是可取的,遵循国家科学基金会赞助的nanoHUB项目纳米建模和仿真工具,以及LAMMPS分子动力学代码和DREAM.3D软件的例子。

  阿曼达巴纳德:拥抱不确定性

  澳大利亚联邦科学与工业研究所

  MGI正在形成一种协作式的风格,这种风格已经引发了技术和个人的挑战。材料科学家必须更适应不确定性。他们必须放弃自己的控制,相信自己的同事,并抵制把一切事情都清楚的冲动。

  从可用数据中获得新的科学结果需要集中资源。一些见解和突破只能通过具体的方式来实现,其他方式是无法完成的。电子显微镜可以揭示亚原子表面特性,光学显微镜可以显示光从亚原子表面如何反射。

  结合不同来源的结果是非常困难的。错误通常来自实验或计算技术本身的性质。许多实验者对实验室结果随着实验室条件变化而变化多么令人沮丧感到沮丧,即使是那些基于理论的结果也可能得到不同的答案。

  混合来自不同来源的数据通常会导致更多的不确定性,而不是简单地将来自纯数据集的测量或统计错误相结合。如果我们想从数据共享中受益,就必须学会适应这种情况。

  MGI用户不得不适应的另一种不确定性是人为因素,我们对创建原始数据的人的看法及其能力。科学家应该习惯于客观的怀疑。为了快速推进材料研究,我们需要假定每个贡献者都非常有能力并且能够与数据本身交谈。

  只有我们能够像MGI数据一样方便,自信地从MGI获取数据,才能展示MGI的价值。

  Francois Gygi:使模拟可重现

  加州大学戴维斯分校计算机科学教授

  MGI最快的回报来自共享材料结构模拟。

  数值模拟不如其理论和计算基础所表明的那样可靠和可重复。由于近似的复杂性和所用参数的数量,它们通常会给出不同的结果。

  克服这些困难对设计新材料至关重要。例如,通过模拟材料中晶格缺陷的形成来预测可以提高我们优化材料强度或电子特性的能力。

  只有经过不同研究团队的独立验证和成功复制,数据才是可靠的。自由共享数据将使交叉验证成为可能。

  在传播模拟数据时,研究人员必须牢记两件事情。首先,仿真软件应该公开访问,而不仅仅是数据。软件供应商不能禁止原始数据或性能数据。其次,常见的数据格式和中央数据库并不总是必要的。材料R团队可以使用现有的框架来共享数据。

  通过适度的投资,研究人员可以在自己的服务器上发布数据,其他人可以访问数据。通过鼓励在特定领域开发网络工具,我们将减少数据交换验证和验证的障碍。

  Peter B. Littlewood:发现多样性

  伊利诺州阿贡国家实验室物理科学与工程实验室助理主任

  从同步加速器到电子扫描显微镜,纳米技术工具在信息革命中得到了锻炼。现在,在MGI,我们需要通过扩大我们的视野和结合各种各样的材料来推进分子制造业。

  这个过程有基本的障碍。尽管MGI的名字听起来雄心勃勃,但事实上,原子与基因是不一样的,生物基因组既是一种理论,也是一种执行算法,在材料科学中,量子力学可能会破坏从编码到功能的完美翻译。

  这种理论僵局只反映了材料的多样性。组成或结构的小变化可以产生全新的功能。

  但化学是系统的。由于门捷列夫制定了物种的周期表,我们已经到了不同形式的物质结构和功能,现在可以用强大的计算机和高通量实验进行筛选。我们正在构建一个与材料,功能和功能类型相匹配的套件。 MGI将扩大其影响力。 (张冬)

  “中国科学”(2013-12-04第3版国际)