Workflow
科学地平线(SciHorizon)平台
icon
搜索文档
大模型科研能力哪家强?评价参考来了
科技日报· 2025-05-12 07:42
在科学地平线网站的高质量科学数据推荐榜单页面上,分别列出了地球科学、生命科学、材料科学领域 排名前十的数据集。其中,在地球科学领域,由中国科学院青藏高原研究所等机构发布的"中国气象驱 动数据集(1979—2018)"暂列首位。 祝恒书介绍,为确保评价体系的合理性和公平性,研究团队共收集国内高校、科研院所等上百家机构发 布的数据集,并从规范性、可用性、可解释性、合规性4个维度对数据集作出评价。每一维度下,还设 置了不同子指标。"通过考核子指标,我们可以发现数据是否在某一维度内符合标准,从而对科学数据 的质量作出综合评价。"祝恒书说。 人工智能正在科研方面展现出巨大潜力。然而,随着其应用逐步加深,一些问题也浮出水面:大模型解 决学科领域问题的效能如何?科学数据供给的质量如何?是否有"裁判员"对大模型科研能力进行评价? 近日,由中国科学院计算机网络信息中心牵头建设的科学地平线(SciHorizon)平台正式上线。作为国 际首个聚焦"数据+模型"角度、面向人工智能驱动科学研究的综合评价平台,科学地平线旨在评估大模 型在科研领域的应用能力以及科学数据质量,为科研人员使用大模型高效解决科学问题提供参考。 在科学地平线网站 ...