MPHの経営に役立つWebコンサルティングコラム

Webコンサルティングコラム
経営目線でのWeb戦略について発信しております。

Google BigQueryとは?費用や何がすごいのかを解説!

Google BigQueryとは?

Google BigQuery(グーグル・ビッグクエリ)とは、一体どのようなサービスなのでしょうか。「名前は聞いたことがあるけれど、まだ理解できていない」「はじめて聞いた」という方もいるでしょう。

こちらはGoogle Cloud Platform(GCP)で提供されているビッグデータ解析サービスのことを指します。

データ解析に関心がある方でも、使ってみたいと思っていても、「使用料が高そう」「扱いが難しそう」などというイメージで躊躇してしまっている方もいるかもしれません。

この記事では、Google BigQueryとはどのようなサービスなのか、費用がどれくらいで一体何がすごいのか、など詳しく解説していきます。

Google BigQueryとは何か?

Google BigQueryは、Google社が提供する大規模なクエリ(処理要求)を実行機能として持つ、クラウド型のデータウェアハウス(Data Ware House・DWH)サービスです。データウェアハウスを直訳すると「データの倉庫」です。つまり、時系列に整理された大量のデータを整理・格納し、要求に応じて素早く取り出すことができる、データ分析に特化した管理システムのことです。Google BigQueryは、膨大なデータの中から、高速かつ高度な分析結果を取得することができるのです。

Google BigQueryというのは、もともとGoogle社内でDremel(ドレメル)というサービスとして利用されていました。それを社外ユーザー向けに利用できるサービスとして公開したのが始まりで、2012年に公式サービスとしてリリースしています。

また、クラウドなので面倒な管理をすることなく、サーバー上でプログラムを実行できます。システムの規模の変化に柔軟に対応できる上に、コストパフォーマンスも大変優れています。他のGoogle Cloudの提供するサービスとも簡単に連携できるという点も大変扱いやすく、あらゆるユーザーにとってデータ分析に向いているサービスでしょう。

Google BigQueryとは何か?

Google BigQueryのサイトへ

Google BigQueryの何がすごい?

Google BigQueryの称賛すべき点は数多くありますが、大きく3つに分けて詳しく解説していきます。

高速なデータ処理

最大の特徴としてデータ処理が超高速ということが挙げられます。数十億行のデータの処理であっても、数秒もしくは数十秒で検索・集計し、細かい分析まで可能です。

例えば、大量のデータをフルスキャンし、結果をユーザーに返すとします。通常の分析サービスの場合、GB(ギガバイト)程度であれば難なく分析できますが、GBの1000倍となるTB(テラバイト)となるとデータがなかなか返ってこないことが多いようです。しかし、Google BigQueryはTBのさらに1000倍ともなるPB(ペタバイト)規模のデータも驚異のスピードで分析可能ということになるのです。

サーバレスなデータウェアハウス

サーバレスのサービスなので、メンテナンスや管理を委託できます。通常、データウェアハウスのデータベースはチューニングや、データベースのスペシャリストなどが必要となります。スペシャリストがいるかどうかもチューニングパフォーマンスに影響します。しかし、Google BigQueryの場合は、スペシャリストの必要はなく、ビッグデータの取り扱いだけを行えば良いのです。

SQL(Structured Query Language)での操作

Google BigQueryは、2016年頃から標準SQLのサポートを始めています。通常のデータベースを操作するのと同様にSQLを書けるため、エンジニアでなくてもSQLを学習すれば扱うことができます。また、既存のコードの再利用もしやすくなっています。

Google BigQueryのデータ処理が高速な理由

Google BigQueryのデータ処理が高速なのは、ビッグデータの検索を目的に設計しており、多くのサーバーでクエリの処理をします。その処理を実現できる理由が以下の2つの仕組みにあります。

カラム型データ構造

一般的なデータベースでは、行(レコード)単位でデータ保存をします。一方、Google BigQueryは列(カラム)単位にまとめてデータを格納しています。Google BigQueryはクエリ対象となる列のデータだけにしかアクセスをしないため、トラフィックの最小化(処理の高速化)になります。また、通常のデータベースでの圧縮率は3:1ですが、カラム型データ構造の圧縮率は10:1となり高い圧縮率です。このデータ構造がクエリ実行時の高速データ処理を可能にするというわけなのです。

ツリーアーキテクチャ

Google BigQueryは、ツリーアーキテクチャという大規模な分散並列処理を行っています。ツリーアーキテクチャとは、ツリーの根となるルートサーバーが、クエリを受け取ったSQL文を解析します。そして、実際にクエリ処理を実行する無数のリーフサーバーに対して、クエリがツリー構造で広がっていくのでこのように呼ばれています。サーバー上で同時に大規模な分散処理をしています。

これら2つの仕組みを効率的に利用することで、Google BigQueryの超高速データ処理が可能になっているのです。

料金・費用について

費用検討

Google BigQueryは、クエリを実行するときにサービスが起動され、検索などの操作を行えます。

課金の特徴として、サービス(コンテナ)が起動している間、つまりクエリ操作をしている間だけ料金が発生します。

大きく分けて、クエリ分析料金とストレージ料金が発生するので、基本的な料金体系について解説していきます。

クエリの分析料金

クエリ実行用のスキャンするデータ量の課金です。「オンデマンド料金」と「定額料金」の2種類の料金モデルがあります。ニーズに合わせて両方のモデルを組み合わせることもできます。

・オンデマンド料金

クエリが処理したバイト数つまり、読み取りバイト数に基づいて料金が課金されます。クエリデータは毎月1TBまで無料となります。エラーまたはキャッシュされたクエリには料金はかかりません。クエリで処理されるバイト数を減らすことで、コストを抑えることができます。

・定額料金

企業などで大容量を使用する場合には、お得な定額料金プランもあります。スロットは100スロット単位で追加購入可能です。クエリの実行に使用できる専用の処理容量を購入することになり、年・月のいずれかの単位で選択が可能です。長期的なコミットメントのため、割引価格で保証された容量を購入できます。クエリを最適化するとスロットの使用量を削減につながる場合もあります。

ストレージ料金

ストレージの料金とは、Google BigQueryに読み込むデータを保存する費用になりますが、こちらも低コストで利用可能です。「アクティブ」と「長期保存」と2種類あり、データ保存期間によって料金が変わります。パフォーマンス、耐久性、可用性に違いはありません。どちらも毎月10GBまで無料となります。

・アクティブ

過去90日以内に更新されたデータが含まれます。

・長期保存

90日間連続して更新されていないデータが含まれます。古いデータは自動的に値引きされます。

データを1TB保存したとしても、月額は約2,530円、月間で10TBのクエリを処理したとしても月額は約6,600円です。しかも、毎月1TBのクエリ処理までは無料になります。

(※細かい料金は変更になる可能性があるため、公式ドキュメントの最新のものを参照する必要があります)

 

Google BigQueryは扱いやすさはもちろん、予想以上に低価格なビッグデータ分析サービスであると言えます。いくら高速で便利なサービスであっても、コストが高くて手が出しにくいものは導入が難しくなります。しかし、Google BigQueryを導入することで、運用コストを何倍も削減できる可能性があります。分析開始前に、処理するデータ量の確認ができ、目安料金がわかるというのも嬉しいポイントの一つです。ビッグデータ活用手段の一つとして、ぜひGoogle BigQueryを取り入れてみてはいかがでしょうか。

この記事を書いた人

MPH WEBコンサルティング事業部

MPH WEBコンサルティング事業部

専門分野:WEBコンサルティング,WEB広告,SEO,DX,MA

様々な企業・事業者のWEBマーケティングを支援してきたMPHのWEBコンサルティング事業部が、経営に役立つIT・WEBに関するノウハウや最新情報を発信しています。

WEBを活用して業績UPをされたい皆様
ご相談は無料です。お気軽にお問い合わせ下さい。
受付 / 9:00~18:00定休日 / 土日祝
24時間受付けのお問い合わせ・ご依頼はこちら
公式LINE 登録特典 Webマーケティング改善チェックリスト配布中
【MPH】資料請求(無料)はこちら!
主に以下についての資料をダウンロードできます!
・MPH事業紹介資料
・広告運用代行サービス紹介資料
・美容クリニック向けコンサルティングサービス紹介資料
・MPH開発のWebサイトテンプレート「MEDICA」紹介資料
ダウンロード一覧ページへ