
软文发稿|公关软文|软文营销|媒体传播
继 Google Scholar(Google 学术搜索)之后,Google 又为科研工作者推出了一款重磅产品——Google Dataset Search(Google 数据集搜索)。
Dataset Search 与谷歌的其他专用搜索引擎一样可以免费使用,它基于拥有者对文件和数据库的分类方式来查找文件和数据集。该引擎读取文件内容的方式与搜索引擎搜索网页的方式不同。
政府机构、科学出版社、研究机构甚至是个人研究者在全世界维护着成千上万的开源数据资源库,包含了数百万个数据集。
数据集搜索领跑者
数据,可以说是当今世界众多科学家与工作人员赖以生存土壤。而在网络中存在成千上万个数据存储库,科研人员亦可以访问及使用这些数据集。
与谷歌Scholar工作方式类似,不论数据集是托管、发布在哪个网站、数字图书馆或个人网站,都可以轻松的查找与访问。
谷歌的方法基于一个开放标准(schema.org),任何发布数据的人都可以采用上述方式对他们的数据集做描述。
在这个新版本中,用户可以找到有关环境和社会科学的大多数数据集的引用,以及来自其他学科的数据(包括政府数据和新闻机构提供的数据)。随着越来越多的数据存储库使用schema.org标准来描述它们的数据集,用户在数据集搜索中发现的数据集的多样性和覆盖范围将继续增加。
数据集搜索抢先体验
目前 Google Dataset Search 已经支持多种语言,中英文均不在话下。
最近 Google 联手哈佛发布了一款 AI 工具用于预测地震余震位置,那么我们就来分析一下地震数据,可以在 Google Dataset Search 的搜索栏中输入 earthquake,结果如下图所示:
左侧会呈现出所有与关键词有关的数据来源,右侧则会显示每一个数据来源的详细信息,包括数据集名称、数据集更新日期、提供者、支持的下载格式和说明。
下面我们再试试输入中文的“地震”,得到的搜索结果如下:
比如下面这个中国地震灾后恢复重建财政支出的数据集。
如果你想分析每天的天气记录,你可以在数据集搜索中尝试输入daily weather:
正如搜索结果所示,你可以看到来自NASA、NOAA的数据集,同时也是可以看到来自学术存储库的数据,例如哈佛的Dataverse和ICPSR。
目前 Google Dataset Search 仍然处于测试阶段,虽然已有中文界面且支持中文搜索,但中国大陆的用户想要使用依然需要“梯子”科学上网
大家可以动手试试哦:
https://toolbox.google.com/datasetsearch
软文发稿|公关软文|软文营销|媒体传播