bob手机登录网址体育:大数据:70多个网站让你免费获取大数据存储库 发布时间:2024-03-06 20:29:24 来源:bob手机体育app 作者:BOB体育多特


  你是否需求许多的数据来查验你的APP功能?最简略的办法是从网上免费数据存储库下载数据样本。但这种办法最大的缺陷是数据很少有共同的内容而且不一定能够到达预期的成果。以下是70多家能够得到免费大数据存储库的网站。

  Wikipedia:Database:向感兴趣的用户更好的供给一切可用的内容的免费副本。能够取得多种言语的数据。内容连同图片能够下载。

  Common crawl树立并保护一个一切人都能够拜访的敞开的网络。这个数据保存在亚马逊s3bucket中,请求者或许花费一些钱来拜访它。

  Apache MahoutTLP项目创立一个可扩展的机器学习算法。Mahout有许多免费的和付费的语料库语料。

  ClueWeb09用来支撑信息检索和相关人类言语技能讨论研讨的资料库。它包含了从2009年1月到2月间搜集的大约10亿个网页,包含10种言语。资料库被若干TREC会议的追寻检测运用。

  DMOZ–最大的、最全面的人工修改的敞开式网站目录。它搜集了不一样的网站链接。Dmoz是网络搜索引擎的一个首要来历。

  Bioassay data:研讨文章“生物测定数据的虚拟挑选”,由Amanda Schierz编写,有21个生物测定数据集(活性/非生理活性成分),能够下载。

  Canada Open Data:有许多政府和地舆空间的数据集的试点项目

  Datacatalogs.org:来自美国、欧盟、加拿大、CKAN以及其他的揭露政府数据

  Data.gov/Education:关于教育数据资源的首要攻略,包含高价值的数据集、数据可视化、讲堂资源、创立自揭露数据的应用程序以及其他。

  DataMarket:可视化的世界经济、社会、天然和工业,具有来自联合国,世界银行,欧盟计算局和其他重要数据供给者的一亿时刻序列。

  DataFerrett:一个用来拜访和运用The Data Web的数据发掘东西,许多网上美国政务数据集的调集。

  Enron Email Dataset:来自大约150个用户的数据,这些用户大多数是安定公司高档管理人员

  Europeana Data:包含2000万文字,图片,视频敞开的元数据,以及由欧洲数位图书馆搜集的声响,关于欧洲文化遗产内容让人服气的、全面的资源。

  GDELT:关于事情、方位和腔调的全球数据,被英国卫报描述为“生命、世界和一切的大数据前史”

  GEO (GEO Gene Expression Omnibus):一个支撑MIAME兼容数据提交的基因表达/分子丰度信息库,一个精心策划的网上资源,用于基因表达数据的阅读,查询和检索。

  Infochimps:一个数据敞开的目录和调集,答应共享、出售和下载关于任何内容的数据。

  KONECT:科布伦茨网络搜集,具有许多许多类型的网络数据集,以便在网络发掘范畴进行研讨。

  National Government Statistical Web Sites:来自大约70个网站的数据、陈述、计算年鉴、新闻和其他,包含非洲、欧洲、亚洲和拉丁美洲的国家。

  National Space Science Data Center(NSSDC):美国国家航空航天局的数据集,包含行星探究、空间和太阳物理学、生命科学、天体物理学以及其他方面。

  Open Source Sports:许多运动数据库,包含棒球、足球、篮球和曲棍球

  Wikiposit:一个(虚拟的)交融了来自许多不同网站的数据(大多数是金融的),答应用户兼并来自不同来历的数据

  Yelp Academic Dataset:30家大学的250个最接近商业的一切数据和谈论,为学生和学者来讨论和研讨

上一篇:通信大数据行程卡使用指南(入口+功能+规则+常见问答) 下一篇:通讯大数据行程卡在哪里找(二维码汇总)