テクノロジーの最新トレンドと日本HPのデバイスを中心に紹介しています。

2019.11.08

ビッグデータ×地理情報で発想力を生み出す ― GPUアナリティクスプラットフォーム「OmniSci」

リンクをクリップボードにコピーしました
img

ここ10年で耳にすることが増えてきた言葉の1つに「ビッグデータ」がある。多種多様な要素をもった大量のデータを指す言葉で、今までにはない有益な情報・知見を得る目的でデータサイエンスの要素として活用されている。
POSデータから見えてくる年齢別購買傾向などは私たちもよく知っているものだが、他にも医療、生産、雇用など、様々な分野でビッグデータが活用されている。またIoT(スマートセンサーなど、インターネットアクセス機能をもつモノの総称)の普及によってより多くのビッグデータが収集できることから、あらたなビジネスの創出も期待されている。

その中で、地図データと組み合わせてビッグデータを分析できるツール「OmniSci」が日本に上陸した。アメリカではテレマティクス業界やテレコム業界、インフラ業界、エネルギー業界で導入実績のあるツールで、視覚的に大きなデータから細部のデータを観察・分析しやすいのが特徴。特にGPUを活用することで、ハイレスポンスな動作環境を構築できるのがポイントとなっている。

このOmniSciの具体的なメリットはいかなるものか。OmniSciの日本正規代理店である株式会社アスクの鈴木信雄氏に話を聞いた。

img

ソリューション&コンポーネント事業部 エンタープライズ営業部 鈴木信雄氏

GPUを活用することでデータ処理の問題に応えることができる

—— データサイエンスの業界において、ユーザーのニーズや課題感についてお感じになるところを教えてください。

鈴木 昨今、データサイエンスの重要性が高まってきています。その背景にはビッグデータに注目が集まり、それをどうやって活用してビジネスに役立てていくかといったところが一番の課題となっています。しかし、現実問題としては、そのデータ処理自体が困難になりつつあるケースが増えている状況があります。ビッグデータの増加量が想像以上に大きくなってきて、それを処理するためのマシンパワーが徐々に不足してきています。

img

もちろん分散処理など、様々なテクノロジーを使うことで対応はされていますが、大規模に活用するためにはシステムの構築にコストがかかるといった問題があります。

片やここ数年来、グラフィックスボード、すなわちGPUがAIやディープラーニングといった一般計算用途として汎用的に使われはじめてきました。ところがデータベースの処理をGPUで実行するというのは、データベースの処理自身がGPUの処理に乗りづらかったところがあり、主流ではありませんでした。

2013年当時、OmniSci CEOであるTodd MostakはもともとSNSの情報を分析して、SNS上における活動が社会に対してどういうインパクトを与えているのかという研究をしていた人物でした。これはデータ量が大きいので普通に処理させると、一回の検索で結果が表示されるまで2~3時間かかるのがあたりまえ。検索内容によっては1日、2日かかってようやく結果がわかるという状況でした。

そこで当時MITコンピュータ科学・人工知能研究所と共同で、GPUで計算するツールを開発したというのがOmniSciの始まりでした。

地理情報システムとの相性に優れるOmniSci

—— 具体的に、どのような作業させるときにOmniSciはそのメリットを発揮するのでしょうか。

鈴木 GIS(地理情報システム)など、データベース内の情報を検索した結果を地図上にマッピングするという使い方がいいですね。GPUを用いることで、簡単なパラメータを多用した検索を並列処理させて高速化しています。さらに検索結果の表示自身も1枚の固定したグラフィックを作るのではなく、ある領域にフォーカス・ズームしたりして視覚的にわかりやすく分析結果を表示したいときに効果的です。バックグラウンドでグラフィックスの処理を実行させることになり、GPUとのマッチングに優れています。

img

—— 広範囲な領域のデータの一部だけを検索する、といったときもレスポンスに優れているのでしょうか。

鈴木 そうですね。億単位のレコード数のものに対してどんどん絞り込んでいく、絞り込み過ぎてしまったらもう一回拡大する、そういった動きに対応して画面に表示させるのですが、そこでもほとんどリアルタイムでレスポンスが返ってきます。

計算することが目的ではなくて、分析した結果を見ながら問題や「ひらめき」を見つけるためには、このレスポンスの早さが重要なのです。例えば1回の画面のリフレッシュに10分かかってしまっては、発見・発想するための思考が中断されてしまいますから。

—— 膨大な情報から、ほぼリアルタイムで求める情報を表示させることができるからこそ、発想力も伸びていくだろうということなのですね。

鈴木 そうですね。データサイエンスの本質的な成果である発想力のためには、億単位のデータを瞬時に操れるというスペックは非常に重要だと考えています。

広範囲のデータのなかに潜む特異点を見つけ出せるパフォーマンス

—— その他のBIツールと比較したときの優位性を教えてください。

鈴木 やはり地図情報と組み合わせたときの検索性ですね。OmniSciはある意味尖ったソフトウェア製品です。テレマティクスやテレコム業界など、尖った製品ゆえに尖った分野での導入が進んでいます。しかしビックデータ活用がすべての業界に広がっていますし、今後は特定の業界向けということではなく、幅広い分野で使われていくと思っています。

img

—— 例えば県単位、国単位とか、広い範囲のデータを見るときにもメリットはあるのでしょうか。

鈴木 はい。例えばワールドワイドのデータを見たときに、ある国のデータを表現するのに大きな円を使っているとします。どんどんエリアを絞って、地方や都道府県、区市町村と表示エリアをズームしていったときに、本来であればその円は相対的に小さくなり、細かいメッシュで各部の詳細データがわかるようになってほしい。このようにデータを表示するためには、リアルタイムに再計算しないといけません。従来のシステムではその負荷に答えられず、メッシュが細かくならず、円が大きなまま拡大されます。GPUを活用するOmniSciはこの再計算が非常に得意なため、本来求められる相対的な表示が可能になります。

—— 例えば農業の分野で衛星を使って圃場のデータ取り、いつ作物が採れるのかとかそういった地域を限定するデータを扱うにはいかがでしょうか。

鈴木 OmniSciの優れた点は、高速なデータベース処理、その結果の高速なビジュアル化、そして複数の視点からの互いに依存する複数の分析結果を全て同時に更新して再表示できることにあります。単なる結果表示から、その分析から知見を得るための相互依存するデータビューが多いほどOmniSciのメリットが生きてきます。

クラウドでもオンプレミスでも活用できる柔軟性

—— OmniSciを使う上でのハードウェアとしてクラウド、サーバー、ワークステーションの利用が考えられると思うのですが、それぞれの環境のメリットを教えてください。

鈴木 例えば一部の企業の中には、あまり外にデータを出したくない、あまりクラウドにデータをアップロードしたくないという感覚がまだある状況です。このようなケースではサーバーやワークステーションでの導入が優先されます。

—— 扱うデータの種類や実行内容だけではなく、ユーザーの社風によっても変わるということなのですね。

鈴木 システム的な問題というよりも、社内のセキュリティに対する考えに大きく依存します。あと業界の流れで、取り組みをされている事例が増えて、ベストプラクティスの共有が進めば一つの大きな流れにはなるでしょう。また、ハードウェアの提供する側も導入、運用が容易なこのようなAI・データサイエンス分野に特化したターンキーシステムが増えれば、オンプレミスでも効率的な運用が可能になると思います。

img

現在、これからはクラウドでいってもいいと判断をされるユーザー出てきています。そういう企業って社内でクラウドに対する知見をきちんと持たれています。

—— まずはユーザーによってお勧めするもの、ユーザーとのお話を聞いて実行環境を判断してやっていくってことですか。

鈴木 セキュリティが担保されるような状況や、技術的よりも契約面だとかもあります。費用の問題もありますね。そこの兼ね合いですね。例えばクラウドは安いというイメージがありますが、トータルして考えると、実はオンプレミスのほうが安くなるケースもあります。

自社でサーバーを持ってそれを保守しなきゃいけない、要員も雇わなきゃいけないと考えると高そうですけど、コストの捉え方をどの範囲にするのかということがあります。またAI・データサイエンス向けに特化して、保守を容易にしたシステムも提供されて選択肢は増えてゆくと思います。

HPのワークステーションを用いることで安定性を担保

—— 自社でOmniSci用のワークステーションを運用することのメリットはありますか。

鈴木 そうですね。手元にマシンがあることの安心感がありますし、社内から外部へのアクセスが増加して通信速度が下がっているときでも、快適に分析できるというメリットがあります。またOmniSciは新しい技術ですので稼働するハードウェアに対しては検証済みの組み合わせをベースにご提案します。今年に入ってからOmniSciはHPとグローバルなパートナーシップを結び、HPのワークステーションベースのシステムをレファレンスとして稼働確認を行っています。

ソフトウェアメーカーが公開するCPUは○○以上、メモリは○○以上という推奨構成って、負荷のかかる作業をさせると快適なレスポンスには不適な構成だったりすることもあります。特にOmniSciはデータも大きくて、グラフィカルにすぐにレスポンスよく表示でなければならないので、HPとOmniSciが協調して推奨環境をベースに、技術サポートも行っています。

国内でもわれわれアスクとHPで、データサイエンスワークステーションという形で標準的な構成を作り、ユーザーにご提供する体制を敷いています。

—— OmniSciを活用する上での推奨環境を教えてください。

鈴木 取り扱い対象のデータ量に対して最適な推奨構成が異なるので一概にはいえないのですが、基準になるのは、データのサイズに対するGPUのメモリサイズです。基本的には48GBのメモリを搭載したNVIDIA® Quadro RTX™ 8000を推奨しています。GPUを支えるプラットフォームとしてHPのワークステーションの安定性を高く評価しています。

—— ユーザーのオーダーに応じてカスタマイズできるといったメリットもあったりするのでしょうか。

鈴木 最初はNVIDIA Quadro RTX8000 1枚ですが、パフォーマンス要件に不足すればNVIDIA® Quadro RTX™ 8000をもう1枚追加するといったように、まずは従来の実績で標準的な構成でお勧めして、必要であればメモリやGPUを追加していくといった拡張していく形でのサポートとなります。

IoT企業の新しいビジネス創出の土台となるOmniSci

—— OmniSciの導入事例がありましたら教えてください。

鈴木 日本でのマーケット開拓はこれからとなるのですが、米国本社のほうではある程度、業界ごとに事例が出ています。例えばテレコム業界でネットワークの信頼性を判断するために、どのアンテナがどれだけのスピードで通信しているか、そういった情報を全米各地から全部集めて問題の起きている場所を見つけ出すとか、ロジスティックス業界で、タクシーやバスの運行状況と物流の流れをリアルタイムに捉えて渋滞の起きる時間・ポイントを見つけるなどのシーンで活用されています。

img

—— リアルタイムの情報も取得できる環境にあるユーザーでしたら、それをタイムラグなく有効活用できるのですね。

鈴木 そうですね。例えば10分や1時間に1回データを取り込むなど、ある程度のリアルタイム性をサポートするためのストリーミングデータ取り込みの仕組み作りはできますので、アメリカの事例も参考にしつつ、日本で展開していきたいと思いますね。

—— 今後のOmniSciのプロモーションプランについてお聞かせください。

鈴木 まずは米国で実績のあるテレコム業界から始めたいと思います。同時に例えば電気やガス業界はスマートメーターで様々な情報を集めていますが、そういったIoT機器でデータを吸い上げて、それを処理する循環が出てきつつあるのが現在です。いろんなケースで様々なデータを収集し、分析して、自分のビジネスに役立てたいという視点が様々な業態で生まれてきています。データの集め方、集めた後の処理の仕方もわれわれとHPとで手を組んでサポートしていくことを考えています。

今までは、高速で処理ができる仕組みがなかったといったことで諦めていたことに対しても、OmniSciのようなシステムがあるのであれば可能になるかもしれません。

まず、問題を捉えることからスタートする必要があるとは考えています。将来的には、各業界のことをよく理解されているコンサルタントとパートナーシップを結ぶといったことも考えられると思います。

img

OmniSci実行画面。アメリカ全土のモバイル通信基地局の通信スピードを集め、トラフィックが集まっている地域、物理的な問題が起きている地域をスムースに確認できる。

img

OmniSciのデモンストレーションを担当していただいた株式会社アスク エンタープライズ営業部 FAEグループ グループ長 児島雅之氏

img

ニューヨークにおけるタクシーのチップ金額比率データをヒートマップ表示。赤くなっている部分はチップを支払うお客が多いということが見えてくる。このデータに現地の小売店・飲食店情報を重ねると、より現象が具体化されて見える。

img

デモで使用されていたHPのワークステーション。GPUにはNVIDIA® Quadro RTX™ 8000を使用し、OmniSciを稼働させている。

HPの主なOmniSci対応モデル

HP Z8 G4 Workstation

最高の拡張性と究極のパフォーマンスを持ったウルトラハイエンドモデル

img

Windows 10 Pro For Workstations
(※Core™ i プロセッサーモデルはWindows 10 Proとなります)

最新のインテル® Xeon® プロセッサー選択可能
NVIDIA Quadro RTX8000を搭載可能

詳細はこちら