catch-img

Google Cloud Platform(GCP)ではじめるデータ分析と機械学習の活用

トランスコスモスでは、人々の生活の隅々に行き渡る「Google」の各プロダクトをテーマに、具体的なソリューションや事例などをご紹介するセミナーを実施しました。

今回は、そのセミナー内容をふまえ、Google Cloud Platform(GCP)をテーマに、データ分析と機械学習についてお届けします!


「Google Cloud Platform(GCP)ではじめるデータ分析と機械学習の活用」担当:永井


目次[非表示]

  1. Google Cloud Platform(GCP)とは?
    1. 料金について
    2. データ分析におけるGoogle Cloud Platform(GCP)の活用領域
  2. 「データの整理」:収集したデータを統合し、データ活用が可能な状態へ
  3. Big Query上で、機械学習モデルを簡単に構築できる
  4. データ分析の課題「非構造データ(画像、音声、文章)」の解決策
    1. 非構造データ用・各種ソリューション
    2. 活用例:ECサイト向け画像検索ソリューション
  5. まとめ

Google Cloud Platform(GCP)とは?

ビジネスデータの統合・分析・活用などもできるプラットフォームのことです。

YouTube、Googleマップ、Google Chrome、Gmailなど、Googleの各サービスで使用している高品質でスケーラブルなインフラ環境が、企業や個人に対して提供されます。


料金について

なお、料金ですが、12ヶ月の無料トライアルも可能です。

有料の場合、重量課金制の料金体系となっているため、活用方法によって変動します。実施する施策を基に、データの処理量やネットワークのトラフィック量、稼働する期間などを想定した上で、個別お見積もりとなります。


データ分析におけるGoogle Cloud Platform(GCP)の活用領域

  1. データの収集
  2. データの整理 ★
  3. データの分析 ★
  4. データの可視化
  5. 施策の実行

★ビジネスゴール達成のためのデータ活用における主要な5ステップのうち、Google Cloud Platform(GCP)では「データの整理」および「データの分析」を主に担うことができます。

「データの整理」:収集したデータを統合し、データ活用が可能な状態へ

ひとつの企業の中でも「顧客データ」と呼ばれるデータはさまざま。Webサイトのアクセスログ、広告、決済情報、会員の属性情報、ポイント利用履歴…などなど、各担当部門での個別管理となっている場合も多くあるかと思います。

しかし、それぞれ単独のデータでは、「誰が、何の施策に、どう反応したのか」をカスタマージャーニーの中で理解することは困難。バラバラに管理しているデータを統合することが必要です。

そこで活用するのが、Google Cloud Platform(GCP)を構成する要素のひとつである「Big Query」。データを分析するための基盤(データウェアハウス)の役割を果たします。


▼Big Queryの導入メリット4つ:

  1. ペタバイト級のデータ処理 :4G通信ダウンロードで27年かかる容量
  2. データエンジニアの負荷削減:サーバ性能チューニング、監視など不要
  3. 基幹のDBに影響を与えない:ビジネスサイドには参照権限のみ付与
  4.  すぐに始められる:Google開発者管理画面から簡単にセットアップ可能


Big Query上で、機械学習モデルを簡単に構築できる

データウェアハウス・Big Queryの中には、機械学習モデルをシンプルに作ることができる機能「Big Query ML※」が用意されています。

※ ML:Machine Learning=機械学習

Big Query MLでは、RやPythonでコードを書くことや、ハイスペックな動作環境の調達は必要なく、機械学習の経験が浅くても容易にモデルの構築が可能。

まず、SQLの変種のようなもので作りたいモデルの種類と入力データを指定すると、Big QueryMLがモデルを構築開始し、そこから予測が得られる仕組みになっています。

この時、大きなメリットとなるのは、機械学習アルゴリズムを実行するためにBig Queryサーバからデータを移動させなくて良いこと。時間が短縮化されることはもちろん、セキュリティに関する問題も回避できます。


連携イメージ・Big Queryに集めたデータは移動の必要なし

データ分析の課題「非構造データ(画像、音声、文章)」の解決策

画像、音声、動画など、人のコミュニケーションをより表現するデータの活用は重要性を増す一方。

しかしながら、たとえば画像そのままでは「画像に含まれている文字」などを、活用するデータとして格納することはできません。

こうした構造化されていない大量のデータ整理・分析を解決する機能も提供されています。

「非構造データ(画像、音声、文章)」の解決策


非構造データ用・各種ソリューション

【画像】


・Cloud Vision API


機械学習済みのモデルを使用して、画像にラベル付や様々な情報の検出ができる機能。


・Cloud AutoML Vision


ユーザーが画像に対して自社製品の名称など、独自のラベル情報を学習させられる機能。



【音声】


・Google Cloud Speech API


120 の言語と方言を認識し、音声をテキストに変換できます。リアルタイム ストリーミング音声も、録音された音声も処理できます。



【文章】

・Google Cloud Natural Language


テキストの構造と意味を解析できるようにします。ドキュメント、ニュース記事、ブログ記事に含まれる人、場所、イベントなどに関する情報や感情に係る情報を抽出。


・AutoML Natural Language


独自のルールに基づく文章のカテゴリ分類を構築。


活用例:ECサイト向け画像検索ソリューション

具体的な活用イメージのひとつがこちら。ユーザーがECサイトで商品購入を進めるときに、「自分が欲しい商品の詳細」の検索を簡単にする仕組みです。

ユーザーは、自分の欲しい商品の画像を写真に撮り、サイト側へ送るだけ。そうすると、ECサイト側に蓄えられているラベルづけされた商品データの中から、最適な商品が探され、ともにデータベースに格納されている価格や素材などの情報とともに、ユーザーへ返答してもらえるようになります。

ユーザーにストレスなく商品検索を楽しんでもらえるため、コンバージョン率や、顧客満足度の向上が期待できるソリューションです。

まとめ

データ分析において、Google Cloud Platform(GCP)で担える主なこと

・データの整理
・データの分析

「データ分析」や「機械学習」と聞くと、なんだか大仰で、実現ハードルが高いイメージをお持ちの場合もあるかも知れません。

ただ、ご紹介したように、データ分析を実施するにあたり、統合したデータを活用したり、あるいは、写真や独自の解析モデルを構築したり…という取り組みは、「機械に任せられることは機械に、マーケターなど担当者は本来注力すべき本質的な業務に注力する」ことを支えていきます。

データの参照から広告効果を高めたり、購入率を高めたりと、期待できる効果はさまざま。もちろん、トランスコスモスでは導入から支援し、ビジネスゴール達成へ向けたお手伝いをさせていただきます。

新しくなったGoogleプロダクトを試すことが、ビジネスのゴール達成への近道になるかも知れません。


阿部 智英美
阿部 智英美
トランスコスモス社員。Webディレクター、営業支援・提案担当を経て、現在はトランスコスモス応援隊。勤務中のモットーは「できるだけ楽しく、あとで美味しいお酒が飲めるように」。
 

関連記事:

trans+(トランスプラス)に掲載しているコンテンツや、サイト内で紹介したサービスに関することなど、どうぞお気軽にお問い合わせください。

フォローする:

この記事をシェアする:

人気記事ランキング