データ・プレパレーション・プラットフォーム Paxata(パクサタ)
データ・プレパレーション・プラットフォーム「Paxata(パクサタ)」とは
社内外に存在する多数のデータを活用し、見える化や分析、予測を行い、経営の意思決定などに繋げることが求められています。データ活用のためには、インプットデータの収集~準備(データ・プレパレーション)~アウトプット(見える化・予測)までの一連の流れを円滑に推進することが必要です。しかし、インプットのデータからアウトプットに繋げるステップ「データ・プレパレーション」がネックとなり、データ活用が進まないことが多くあります。
Paxataは「データ・プレパレーション」の課題解決を支援するプラットフォームです。Paxataを使用することで分析担当者が主体となってデータ・プレパレーションを行うことができるため、データ活用の流れが円滑に進みます。
データ活用の流れ

データ・プレパレーションでの主な課題
データの課題
- データ量が多すぎて、処理しきれない
- データ全体を見渡すことができない
- 異常値や想定していないケースが含まれていることに気づけず、正しいアウトプットが得られない
スキルの課題
- 属人的になっている
- プログラミングスキルを習得する時間がとれない
プロセスの課題
- IT部門への作業依頼が多く、業務部門はオンデマンドでデータを取得できない
- データ要件を確定しづらいため、システム化に至らず、手作業が多い
- インプットやアウトプットの追加・変更には、処理やストレージの再設計が必要となり、莫大なコストと時間がかかる
- 分析のPDCAサイクルが回らず、精度が向上しない
期待される効果
- データプレパレーションにかかるコストや時間の削減
- 業務の効率化、高度化
- 分析のPDCAサイクルの確立、分析精度の向上
4つの特長
Point1 オンメモリの分散処理による大容量データの高速処理
- 大容量データであっても、処理の結果を即座に確認しながら、インタラクティブな操作が可能
- データセット全件を処理の対象にすることが可能で、レスポンス対策のためのサンプリングは不要
Point2 馴染みやすいインターフェース
- ノンプラミング、IT専門知識は不要
- 一般的な表計算ソフトを扱う程度のスキルで利用可能

- ①処理ステップやバージョンを自動記録。処理順序の入れ替えや削除、バージョンの切り替えが可能
- ②ヒストグラムや分布図でデータの全体像の把握が可能
- ③データをプレビューしながらインタラクティブな操作が可能
Point3 機械学習技術を用いた、ユーザー操作のサポート
- クラスタリングによる自動クレンジング

- ①統合後の値を自動で提案
- ②入力ミスや表現の差異を考慮し、統合できる可能性のある値を自動でリスト化
- 複数データ結合時、結合候補となる列項目を自動で提示

- ①複数列を組み合わせた結合にも対応
- ②結合候補の列項目の組み合わせを自動でリスト化
Point4 ガバナンスを支援するプラットフォーム
- セキュリティ管理、リソース管理
- 変更履歴の保持
ISIDのサービス
企業のデータ活用を支援する各種ソリューションを展開しております。

Paxata 紹介動画
お問い合わせ
株式会社電通国際情報サービス エンタープライズIT事業部 データマネジメントコンサルティング部
TEL : 03-6713-6132
E-mail : g-paxata@group.isid.co.jp