インフォメーションセンター

Data Vault とは? 拡張性に富んだ究極のデータソリューション。

データは「新しい通貨」ではありますが、多くの企業は、その価値から利益を引き出すことだけでなく、ますます厳しくなるセキュリティおよびプライバシー標準への対応にも苦労しています。今の高速の世の中でダイヤルアップ接続を使用しようとするのと同じように、古い、非効率的なデータ管理システムでは、生産性向上と成長のためにデジタル資産を最大限に活用することはできません。

柔軟で拡張性のあるデータソリューションである Data Vault を使用すれば、最高レベルのセキュリティとプライバシーを維持しながら、既存のデータ資産から真の価値を引き出すことができます。そのクラウドベースの機能は、侵入不可能な要塞として機能し、機密情報を保護するだけでなく、重要な業務の中断を最小限に抑えます。サイバーレジリエンスを強化し、運用の継続性を確保できるため、企業は十分な自信を持って現在のデジタル環境に対応できます。

この記事では、以下の内容について説明します。

Data Vault の概要

あらゆる企業が非構造化データから実用的なインサイトを生成したいと考えています。しかし、プライバシーとセキュリティに関する懸念に加え、データのボリュームと複雑さに従来のデータ管理システムでは対処しきれず、意味のある情報を効率的に引き出すことが困難になっています。

Data Vault は、最新のデータ環境に関連するこれらの障壁に対処する堅牢で拡張性に富んだソリューションであり、企業は追跡機能と監査機能を維持しながら異種のソースからのデータを統合、保存、管理することができます。その主な 3 つのコンポーネントは、ハブ、リンク、サテライトです。これについては後で詳しく説明します。データをこれらの異なる部分へ分離することで、データの読み込み効率が向上し、メンテナンスが簡素化し、データのバージョニングと履歴追跡をきめ細かく管理できるようになります。

Data Vault アーキテクチャの主な強みは、中断を伴う再設計を行わずにデータ構造および要件の変化に適応できる点です。その柔軟性により、企業のニーズの変化に合わせ、新しいデータソースをシームレスに組み込み、データモデルを拡張することができます。また、すべてのデータ変更の包括的な履歴レコードを維持することで、データ整合性と監査可能性を確保します。これによって完全なトレーサビリティが実現し、企業は厳格な規制とコンプライアンスの要件に対応できるようになります。

Data Vault が重要である理由

サイバー攻撃とデータ侵害の脅威は日々増大しています。調査では、ランサムウェアがすべてのサイバー攻撃のほぼ 70% を占め、その 40% 以上が成功しています。2023 年だけで、攻撃者は被害者から約 10 億ドルを奪っています。セキュリティ、回復力、事業継続性を優先する堅牢なデータ管理ソリューションの導入が極めて重要であることを裏付ける、驚異的な数字です。

Data Vault は、データリスクの軽減を支援し、安全かつ回復力の高いデータストレージおよび管理ソリューションを提供し、その設計原則 (関心の分離、改ざん不可能なデータストレージなど) により、データ破損や改ざんに対する高い耐性を実現します。すべてのデータ変更を記録する機能により、さまざまな業種の企業が、データを既知の正常な状態に復元し、ダウンタイムを最小限に抑え、事業継続性を確保して、データ侵害やランサムウェア攻撃から迅速に復旧することができます。

Data Vault モデリング

Data Vault の主な原則と概念は次のとおりです。

  • ハブは、顧客や製品など、固有のビジネスエンティティを表し、ID を保存および管理するための中心として機能します。エンティティに関するコンテキストデータや詳細は含まれません。
  • リンクは、これらのエンティティの関係を把握して、包括的なデータモデリングおよび分析を実現します。
  • サテライトは、説明的なエンティティおよび関係属性を保存します。
  • 改ざん不可能なデータストレージでは履歴データが決して上書きされず、完全な監査証跡を確保し、ポイントインタイム分析を実現します。
  • 拡張性と柔軟性により、中断を伴う再設計を行わずにデータ構造および要件の変化に適応できます。

Data Vault モデリングの実装に関する以下のベストプラクティスに従えば、進化するビジネスニーズをサポートするとともに、データ主導型の意思決定を実現し、適切なデータガバナンスを促進する、拡張性に富み、柔軟で、監査可能なデータインフラを構築することができます。

  • 企業のビジネスプロセス、データソース、レポート要件を包括的に把握して、正確で意味のあるデータモデリングを実現します。
  • エンティティと関係のコアセットから始め、新しい要件の出現に合わせて徐々に拡張する、反復的なアプローチを導入します。
  • 自動化ツールとコード生成手法を活用して Data Vault モデルの開発とメンテナンスを合理化し、手作業を減らし、エラーを最小限に抑えます。
  • データ品質チェック、メタデータ管理、アクセス制御など、堅牢なデータガバナンス手法を確立して、データ整合性とコンプライアンスを確保します。
  • インデックス処理、パーティション分割、クエリーチューニングなどのパフォーマンス最適化手法を導入して、効率的なデータ取得と分析を実現します。
  • Data Vault モデルに関する包括的なドキュメントを維持し、関係者にトレーニングを提供して、データに対する理解を深め、効果的な利用を促進します。

Data Vault アーキテクチャ

Data Vault アーキテクチャは、データウェアハウスや分析データストアの設計および実装に対する堅牢で拡張性に富んだアプローチです。複数のソースからのデータを統合および管理するための構造化フレームワークを提供し、データ整合性、履歴追跡、監査可能性を確保します。また、ますます複雑化する最新のデータ環境に対応して、企業がデータ構造および要件の変化に簡単に適応できるようにします。

Data Vault アーキテクチャには、ハブ、リンク、サテライトに加え、以下のような他のレイヤーやコンポーネントを含めることができます。

  • 未加工のボルト。さまざまなソースからの未処理のデータを保存して、データのリネージと監査可能性を確保します。
  • 統合レイヤー。未加工のボルトからのデータを変換し、Data Vault 構造へ統合します。
  • プレゼンテーションレイヤー。特定のビジネス要件や分析ニーズに合わせてカスタマイズされた、ユーザーフレンドリなデータビューを提供します。その表示はほとんどがデータ「マート」または「キューブ」形式です。

Data Vault アーキテクチャは、エンタープライズクラスのデータウェアハウスと分析データストアを構築するための堅牢かつ将来のニーズにも対応できる基盤であり、企業はデータ品質、ガバナンス、拡張性を維持しながら、データ主導型のインサイトによって最大限の効果を得ることができます。

Data Vault の方法論

Data Vault の導入の成功と長期的な持続可能性を実現するには、データガバナンスと品質基準を維持しながら、さまざまなソースからのデータを統合および変換する、構造化され、体系化された段階的なアプローチが必要です。

ステップ 1: ビジネス要件の収集では、関係者と連携して主なエンティティ、関係、レポートニーズを特定します。既存のデータソースの対応付けやデータ品質の評価も行います。

ステップ 2: 概念モデリングでは、Data Vault の原則を使用して、ビジネスエンティティ (ハブ)、関係 (リンク)、説明的な属性 (サテライト) を特定します。

ステップ 3: データの統合と変換では、さまざまなソースからデータを抽出し、必要な変換を適用し、それを未加工のボルトへ読み込みます。未加工のボルトは、未加工、つまり未処理のデータのステージング領域として機能します。その後、統合レイヤーが、ハブ、リンク、サテライトの設計に従い、未加工のボルトのデータを Data Vault 構造に対応付けて変換します。

ステップ 4: データガバナンスおよび品質保証では、ポリシーを確立し、データ品質ルールを定義し、データ品質基準の監視と適用を実装します。定期的なデータプロファイリング、クレンジング、検証により、Data Vault のデータの整合性と正確性が確保されます。

ステップ 5: ソリューションの配備と監視では、データの自動読み込みを設定し、パフォーマンス監視ツールを実装し、インシデント対応とエスカレーションの手順を定義します。

Data Vault の方法論は反復的なプロセスであるため、進化するビジネス要件、技術の進歩、過去のインシデントや課題からの教訓に基づき、Data Vault 実装を定期的にレビューし、改良する必要があります。Data Vault の方法論を使用することによって、企業は、簡単に拡張して変化に適応でき、データに基づく意思決定を向上させ、全社的にデータの正確さと適切な管理を保証するデータシステムを設定することができます。

Data Vault ツール

現在のデータ主導型の環境では、データ資産の効果的な管理と分析をより簡単かつ安全なものにできるソリューションが求められています。Data Vault ソリューションの導入、実装、メンテナンスをサポートするために、さまざまな専用ツールやプラットフォームが登場し、Data Vault の個別の要件 (モデリング、統合、ガバナンス) に合わせてカスタマイズされたさまざまな機能を提供しています。これらの Data Vault ツールには、データモデリングツール、データ統合プラットフォーム、データ品質およびガバナンスツール、監視および管理ツールなど、さまざまなソリューションが含まれます。それぞれが、概念モデリングやデータ統合から継続的なメンテナンスと監視まで、Data Vault ライフサイクル全体を合理化するように設計されています。

標準の機能は次のとおりです。

  • データモデリング。Data Vault ツールは、ハブ、リンク、サテライトの設計原則に沿った専用のモデリング機能を提供します。これには通常、効率的な Data Vault モデリングを促進するテンプレート、コード生成、バージョン管理機能が含まれています。
  • データ統合。堅牢なデータ統合機能は、さまざまなソースからデータを抽出してそれを変換し、Data Vault 構造へ読み込みます。Data Vault ツールでは、データ整合性と監査可能性を確保する高度なデータ対応付け、変換、読み込みが可能です。
  • データ品質およびガバナンス。データ品質およびガバナンス機能は、Data Vault データの正確性と信頼性を維持します。利用可能なツールには、データプロファイリング、クレンジング、検証機能があり、データリネージやメタデータ管理もサポートされます。
  • 監視と管理。監視と管理のツールは、効果的なパフォーマンス、可用性、拡張性を確保し、システムの健全性に関するインサイトを提供し、潜在的な問題を特定して、容量計画とリソースの最適化を支援します。

Data Vault ツールを選択する際の考慮事項:

  • Data Vault の原則との整合。関心の分離、改ざん不可能なデータストレージ、履歴追跡など、Data Vault アーキテクチャのコア原則を完全にサポートするツールが求められます。
  • 統合機能。ツールは企業の既存のデータソース、プラットフォーム、テクノロジと統合できなければなりません。
  • 拡張性とパフォーマンス。Data Vault ソリューションの拡張をサポートできるツールかどうか、大量のデータを効率的に処理できるかどうかを判断します。
  • 使いやすさと学習曲線。ツールの使いやすさ、トレーニングリソースおよびドキュメント、実装とメンテナンスをサポートするためのスキルを備えたリソースの可用性を評価します。
  • ベンダーサポートとコミュニティ。ベンダーの評判を調べ、サポートサービスを評価し、知識共有とベストプラクティスのための活発なユーザーコミュニティがあることを確認します。

企業のニーズに適した Data Vault ツールの慎重な評価と選択は、選択したソリューションの実装と管理を合理化し、データ資産を最大限に活用しながらデータ整合性、ガバナンス、拡張性を実現するために非常に役立ちます。

Data Vault と次元モデリング

Data Vault と次元モデリングは、データウェアハウジングと分析データ管理に対する 2 つの異なるアプローチです。どちらもデータの統合と分析のために構造化されたフレームワークを提供することを目的としていますが、その設計原則と特定のユースケースへの適合性は異なります。

  • Data Vault アーキテクチャは、データ構造が複雑で、スキーマ変更が頻繁にあり、データリネージと監査可能性に関する厳格な要件がある環境に最適です。ハブ、リンク、サテライト構成により、新しいデータソースや進化するデータモデルをシームレスに組み込むことができるため、金融、医療、テクノロジのような動的で急速に変化するビジネス環境で事業を展開する企業にとって最適な選択肢になるでしょう。
  • 次元モデリングは、「スター」または「スノーフレーク」スキーマに重点を置いており、データ要件が適切に定義され、比較的安定しているシナリオで効果を発揮します。レポートと分析のための構造がより直感的で使いやすいため、ビジネスインテリジェンスやデータ視覚化などのアプリケーションに適しています。

実際のシナリオではたいてい、各アプローチの強みを組み合わせると効果が高まります。たとえば、ハイブリッドアーキテクチャでは、Data Vault を中央のデータリポジトリとして使用してデータ整合性、履歴追跡、拡張性を実現し、特定の分析やレポートのニーズに対しては次元モデルをプレゼンテーションレイヤーとして活用することができます。このアプローチでは、安全で拡張性に富んだ包括的なデータ管理のニーズと、迅速かつユーザーフレンドリなデータアクセスと分析の要件をバランスよく実現できます。

従来の次元モデルを導入している企業は、Data Vault アーキテクチャを補完レイヤーとして実装することを選択して、新しいデータソースをシームレスに統合し、既存の分析プロセスを中断せずに包括的で監査可能なデータインフラを維持する場合があります。

Data Vault を使用した最新のデータプラットフォームの構築

Data Vault に関連するリスクはあるでしょうか。Data Vault アーキテクチャを使用した最新のデータプラットフォームの構築にはそれなりの課題が伴いますが、だからといって高度なデータ管理ソリューションの導入を除外すべきではありません。ただし、実装を慎重に行わない場合、既存の運用が中断し、機密データが漏えいする可能性があることを理解しておく必要があります。

幸いなことに、クラウドベースの Data Vault ソリューションを導入すれば、このようなリスクの多くを軽減できます。クラウドベースのソリューションは、リソースをオンデマンドで拡張できる柔軟性を備えており、インフラのプロビジョニング過不足のリスクを軽減します。また、堅牢なセキュリティ対策とコンプライアンスフレームワークを実装して、企業がデータプライバシーを維持し、GDPR、HIPAA、PCI-DSS などの業界標準に準拠できるようにします。

最後に、Data Vault アーキテクチャを使用した最新のデータプラットフォームの構築では、データガバナンスへ慎重な取り組みが必要です。データ資産の整合性と信頼性の維持を期待するのであれば、企業はデータの所有権、アクセス制御、データ品質管理に関する明確なポリシー、プロセス、役割を確立しなければなりません。

デジタル資産を保護するためのベリタスの包括的なアプローチは、セキュリティ体制管理を合理化し、運用効率を高めます。これにより、企業は安心を得て、安全なデジタル環境で成功を収めることができます。

Veritas Alta™ Recovery Vault は、クラウドベースの Data Vault を提供して、企業のサイバーレジリエンスと重要な業務の継続性を確保します。企業のサイバーセキュリティ体制を強化し、データの中断を発生させずに停止やランサムウェア攻撃への耐性を高めます。さらに、最高レベルのデータ整合性と品質を確保して、正確でタイムリーな意思決定と規制コンプライアンスのための強力な基盤を確立します。企業の未加工のデータを成長促進や競争力維持のために使用できる情報へと変換するにあたっては、これ以上の方法はありません。

データセキュリティの詳細とベリタスができることについて、オンラインでお問い合わせください