こんにちは。インターンの山口です。

今回は「alteryx」という解析ツールを紹介しようと思います。

1.「alteryx」とは

「alteryx」はプログラミングや特別なツール無しで、データブレンド、データ分析ができるツールです。

特徴として以下の2点があります。

・ひとつのソフトでデータの結合・分析・アウトプットができる

alteryx solution

・そのワークフローをGUIで直感的に表すことができる

alteryx 直感的なワークフロー

「alteryx」はデータの結合・分析・アウトプットをひとつのソフトで行えること。そして、そのワークフローを視覚化できるという、非常に便利なツールです。

2.「alteryx」では具体的に何ができるのか

「alteryx」では大きく分けて3つのことが成し遂げられます。

  1. データの結合
  2. 分析
  3. 分析結果の可視化

これらについて解説をしていきます。

2.1データの結合

「alteryx」は非常に多くのファイル形式やデータベースをサポートしており、それらのデータセットを結合することができます。

alteryx 8

上の画像においてはxmlファイルとcsvファイルを結合しています。

また、サポートしているデータソースは以下の通りです。

ファイル:csv, access, html/xml, QVX, TDE

データベース:Hive, Redshift, S3, Cloudera Impala, SQL Server, Teradate, MYSQL

2.2分析

「alteryx」ではGUIの操作で多岐にわたる分析を行うことができます。

alteryx 6

合計・平均・中央値などの単純集計から、線形回帰分析やロジスティック回帰、クラスター分析といったモデルによる分析もGUIの操作で行えます。

2.3分析結果の可視化

「alteryx」は「tableau」と連携することで、データの可視化を強化することができます。

alteryx 7

「alteryx」によるETL能力・分析能力とtableauのデータ可視化を連携させることで複雑な分析結果を分かりやすく視覚化することができます。

 3.まとめ

今回は「alterxy」というツールを紹介しました。私が使った所感としては分析のワークフローを視覚化できるということが非常に便利に思いました。私自身分析を組み立ててく中で、「加工した元データはどれだったのか」「このデータを結合する前にどういった処理をしていたのか」「この平均値はどの段階での数値なのか」といったことを忘れがちなので、「alteryx」を使えばこういった問題はすべて解決できるなぁと感じました。

また、分析のエンジンとして「R」が使われているので、かなり込み入った分析にも対応できるため、データ分析の広い範囲をカバーした良いツールだと思います。