bigquery

The entire quarter-billion-record GDELT Event Database is now available as a public dataset in Google BigQuery.

完整的25亿记录的GDELT事件数据库现在可以作为公共数据集在Google BigQuery中使用。

This is the sentence at the top of the release post, and it’s a really big deal.

这是发布文章顶部的句子,这确实很重要。

加特 (GDELT)

The Global Database of Events, Language and Tone is one of the largest datasets on the planet. It is the quantitative database of human society, relying on thousands of news sources from every corner of the globe dating back to 1979.

全球事件,语言和语气数据库是地球上最大的数据集之一。 它是人类社会的定量数据库,它依赖于追溯到1979年的全球各个角落的数千个新闻来源。

It was thought up by Kalev Leetaru, who is also the author of the Google release post referenced above. The GDELT covers all countries globally spanning a third of a century, and consists of daily updates during that time period. Hundreds of millions of records, each with 59 fields narrating into detail the actors and events having taken place. Every record is georeferenced, so you can globally place it, and all actors are tagged with appropriate ethnic and religious affiliation. All this – free and available for your perusal, and you don’t even have to have the computing power to handle it.

Kalev Leetaru曾想过,他也是上述Google发布帖子的作者。 GDELT涵盖了跨越一个世纪的全球所有国家,并在此期间进行每日更新。 数以亿计的记录,每个记录都有59个字段,详细介绍了演员和已发生的事件。 每条记录都经过地理定位,因此您可以在全球范围内放置它,并且所有演员都被标记为具有适当的族裔和宗教信仰。 所有这些都是免费的,可供您细阅,您甚至不必具备计算能力即可处理。

Google BigQuery, “Google’s powerful cloud-based analytical database service” is, basically, the world’s fastest SQL engine, and it’s completely free for any and all uses of GDELT. Due to the sheer power of BigQuery, you can get results on GDELT queries in near real-time and any permutation of fields and values you can think of won’t be enough to bog it down to a halt – unless you really mess things up and go against the grain. If you deal with databases in any regards and the following paragraph doesn’t send chills down your spine, you’re probably dead:

基本上,Google BigQuery是“ Google强大的基于云的分析数据库服务”,它是世界上最快SQL引擎,它对GDELT的所有使用都是完全免费的。 由于BigQuery的强大功能,您可以近乎实时地获得GDELT查询的结果,并且您认为无法对字段和值进行的任何排列都不足以使它陷入停顿–除非您真的搞砸了并反对谷物。 如果您以任何方式处理数据库,而以下段落都没有使您不寒而栗,则您可能已经死了:

For us, the most groundbreaking part of having GDELT in BigQuery is that it opens the door not only to fast complex querying and extracting of data, but also allows for the first time real-world analyses to be run entirely in the database. Imagine computing the most significant conflict interaction in the world by month over the past 35 years, or performing cross-tabbed correlation over different classes of relationships between a set of countries. Such queries can be run entirely inside of BigQuery and return in just a handful of seconds. This enables you to try out “what if” hypotheses on global-scale trends in near-real time.

对于我们来说,在BigQuery中使用GDELT最具突破性的部分是,它不仅为快速复杂的数据查询和提取打开了方便之门,而且还允许首次在数据库中完全运行真实世界的分析。 想象一下,计算过去35年中每月最重要的冲突互动,或者对一组国家之间不同类别的关系执行交叉表关联。 这样的查询可以完全在BigQuery内部运行,并且只需几秒钟即可返回。 这使您可以近乎实时地对全球规模趋势进行假设假设。

Currently, GDELT on BigQuery is updated daily, but there are plans to move to a near real-time update schedule – updating the dataset every 15 minutes.

当前,BigQuery上的GDELT每天进行更新,但计划将其更新为接近实时的更新时间表-每15分钟更新一次数据集。

Before you get too excited – there is a limit, but it’s not a quota you’ll easily hit. To read more about free quotas, see here and keep in mind you can always pay for more if you actually develop a commercially viable application on top of this data.

你太激动之前- 有极限的,但它不是你会很容易打配额。 要了解有关免费配额的更多信息,请参见此处 ,请记住,如果您实际上是在此数据之上开发出具有商业可行性的应用程序,则可以始终为更多的价格付费。

运行示例查询 (Running a sample query)

You can start playing around with GDELT on BigQuery by visiting this URL – you might have to make a new project if you don’t have one already. After gaining access, you should see a screen not unlike the following:

您可以通过访问以下URL在BigQuery上开始使用GDELT-如果您还没有一个新项目,则可能需要创建一个新项目。 获得访问权限后,您应该会看到一个与以下内容相似的屏幕:

To run the sample query from the release post, click the red “Compose Query” button, paste the SQL into the newly opened textarea and click “Run Query”. Mine took 20 seconds, yours may take anywhere from 5 to 30, but you should get a result not unlike this one:

要从发布发布中运行示例查询,请单击红色的“撰写查询”按钮,将SQL粘贴到新打开的文本区域中,然后单击“运行查询”。 我的花费了20秒,您的花费可能是5到30,但是您应该得到的结果与以下内容完全相同:

在PHP中使用它 (Using it with PHP)

To see how you can use BigQuery and PHP, stay tuned on SitePoint for articles that target that specific combination – they’re coming in June. For now, you can check out this excellent Lever.rs post post that runs through it in a very approachable manner.

要了解如何使用BigQuery和PHP,请继续关注SitePoint上针对该特定组合的文章-它们将在6月发布。 目前,您可以通过非常平易近人的方式查看这篇出色的Lever.rs帖子 。

In a nutshell, you need to use the PHP library Google provides and install it with Composer or through alternative means. Once done, you need to include the lib in your project as you normally would, through Composer’s autoload file, and you can start using the API.

简而言之,您需要使用Google提供的PHP库 , 并通过Composer或通过其他方式进行安装。 完成后,您需要像通常一样通过Composer的自动加载文件将lib包含在项目中,然后就可以开始使用API​​。

For a full introduction on how to get started, obtain API keys and get deep into using Google APIs for access to BigQuery and similar services, please see this guide. You can also RSS subscribe to the Google App Engine tag and you’ll be instantly notified of new posts in that category.

有关如何入门,获取API密钥以及深入使用Google API访问BigQuery和类似服务的完整介绍,请参阅本指南 。 您也可以RSS订阅Google App Engine标记,并且该类别中的新帖子会立即收到通知。

结论 (Conclusion)

The GDELT project has long been an admirable one, but the advent of its BigQuery release marked a new milestone – a general availability to the public never before seen. Everyone now has the ability to query the world’s history, and we can’t wait to see what you build – judging by Kalev, the author, neither can the GDELT team. They’re inviting you to share your queries and experiments with them and if impressive enough, they just might share them with the world on the official blog. If you do come up with anything stunning, let us know – we’re keen to publish tutorials and analyses on it!

GDELT项目长期以来一直是令人钦佩的项目,但BigQuery版本的出现标志着一个新的里程碑–公众从未见过的普遍可用性。 现在,每个人都有能力查询世界的历史,我们迫不及待想看到您的建筑-由作者Kalev判断,GDELT团队也不能。 他们邀请您与他们分享您的查询和实验,如果足够令人印象深刻,他们可能会在官方博客上与世界分享。 如果您确实提出了任何惊人的建议,请告诉我们-我们渴望发布有关它的教程和分析!

翻译自: https://www.sitepoint.com/googles-bigquery-provides-free-access-gdelt/

bigquery

bigquery_Google的BigQuery提供免费访问GDELT的权限相关推荐

  1. ca服务器证书鉴定计划,Let’s Encrypt 项目计划自动化地提供免费的 CA 证书

    Let's Encrypt Mozilla.思科.Akamai.IdenTrust.EFF 和密歇根大学研究人员联合宣布了 Let's Encrypt CA 项目,计划为网站提供免费的基本 SSL 证 ...

  2. PyTorch 1.0稳定版正式发布,并向开发者提供免费AI课程

    晓查 发自 凹非寺 量子位 出品 | 公众号 QbitAI Facebook今天在NeurIPS大会上正在发布PyTorch 1.0稳定版. Facebook在5月份公布了该版本的新功能,并在10月举 ...

  3. 微软正式提供免费杀毒软件公测版下载

    6月23日晚间消息,微软于北京时间今晚11点40分起正式提供免费杀毒及防恶意软件产品"Microsoft Security Essentials"的测试版下载,用户可以访问http ...

  4. 免费参加全球最大的Spark+AI峰会(Databricks 2020年6月22-26日)!免费访问峰会主题演讲及分组会议!

    免费参加全球最大的Spark+AI峰会(Databricks 2020年6月22-26日)!免费访问峰会主题演讲及分组会议! Spark + AI 2020峰会现在是虚拟和免费的!六月22-26日即将 ...

  5. phpstudy免费安全检测服务_Phpstudy联合各大安全厂商为用户提供免费安全检测服务...

    [猎云网(微信号:ilieyun)]9月28日报道 对于前段时间PHPstudy软件被黑客植入"后门"事件,PHPstudy发出了官方声明,称将联合各大安全厂商为用户提供免费的安全 ...

  6. 在Ubuntu为Android硬件抽象层(HAL)模块编写JNI方法提供Java访问硬件服务接口 6...

    在上两篇文章中,我们介绍了如何为Android系统的硬件编写驱动程序,包括如何在Linux内核空间实现内核驱动程序和在用户空间实现硬件抽象层接口.实现这两者的目的是为了向更上一层提供硬件访问接口,即为 ...

  7. 网易有道将为微信用户提供免费外语微信翻译服务

    微信聊天时经常有些逼格高的朋友突然给你来一句英文,看了半天没明白,不回也不是.现在,微信与网易有道正式宣布达成合作,将为微信用户提供免费外语微信翻译服务.应对逼格的利器啊!(据腾讯第二季度财报信息显示 ...

  8. 【SQL Server配置管理器】提示:无法连接到 WMI 提供程序。您没有权限或者该服务器无法访问...

    [SQL Server配置管理器]提示:无法连接到 WMI 提供程序.您没有权限或者该服务器无法访问 //开始运行Cmd.exe进命令行 //进入MSsql2008安装目录cd /Program Fi ...

  9. 数据3分钟丨Oracle宣布从JDK17开始提供免费版本和更新​;ClickHouse 宣布独立成立公司...

    数据 3 分钟 由 ACDU (中国 DBA 联盟) 与墨天轮联合出品的全新视频节目上线啦-三分钟带你来了解数据行业动态,节目内容主要包含数据行业最新的产品发布.公司大事件.行业新闻等. 本期内容概览 ...

最新文章

  1. JAVA基础10-继承(1)
  2. OSChina 周日乱弹 —— 比996更先进的是365工作制
  3. go微服务框架go-micro深度学习(五) stream 调用过程详解
  4. The 2014 ACM-ICPC Asia Mudanjiang Regional First Round A
  5. Boost:双图bimap与lambda表达式的测试程序
  6. C#调用C++DLL传递结构体数组的终极解决方案
  7. 西瓜书机器学习总结(一)
  8. 移动端开发touchstart,touchmove,touchend事件详解和项目
  9. PostgreSQL 10.1 手册_部分 II. SQL 语言_第 12 章 全文搜索_12.4. 额外特性
  10. 如何在应用系统中实现数据权限的控制功能
  11. [编辑器]_从 VI 编辑器谈 FreeBSD 的前世今生以及编辑器本质
  12. leadbbs 上ID为Robin·H的东西,有空瞧瞧....
  13. iOS越狱之Mac登录iPhone
  14. ICP-MS测试/电感耦合等离子体质谱仪(型号Perkin Elmer Nexion 300)
  15. 用Java写的连连看小游戏——步骤分析
  16. 在连接至 Steam 服务器时发生了一个错误。请稍后重试。
  17. UDS-RequestDownload(0x34) service
  18. oracle 10g 新特性中文笔记(第五章)
  19. [Python机器学习]Nagel-Schreckenberg(交通流)模型
  20. 医院CRM管理中随访的重要性

热门文章

  1. Android之——实现应用卸载功能
  2. React Native 0.59.x新特性解读
  3. tomcat7介绍(一)
  4. 常见正则表达式以及写法
  5. 指令系统 - CISC 和 RISC
  6. 王者荣耀测试自己本命英雄软件,王者荣耀中谁是你的本命英雄测试地址 趣推测试王者荣耀中谁是你的本命英雄...
  7. 记录Android Killer反编译时遇到的异常
  8. matlab形变监测,徕卡隧道形变监测程序
  9. python Word 文档
  10. 男性:曹云金再恋嫩模:男人最重要的是有趣