本調査により、企業データ全体の 41% が陳腐化していることが判明。Data Genomics Project により、継続的に世界の企業データの傾向を探る
2016 年 3 月 23 日 - 情報管理ソリューションを提供するベリタステクノロジーズ合同会社(本社:東京都港区、代表執行役員社長:西村隆行、以下ベリタス)は本日、企業が有する非構造化データの構成を業界で初めて正確に捉えた結果をまとめた新たなレポート”Data Genomics Index”(データ ゲノミクス インデックス)の日本語版を発表しました。この結果、今日の企業データの実態として、ファイルの 40% 以上が 3 年間にわたり誰もアクセスもせず放置されていることが判明しました。つまり、ここを改善すれば企業の総コストを削減できる可能性があるということになります。企業では、このData Genomics Index を比較指標として利用できるとともに、自社のデータ環境評価実現の第一歩が踏み出せます。ますます深刻になるこの課題に対する関心を高め、行動するきっかけとなるでしょう。
Data Genomics Index は、現代の企業データ環境を正確に把握できる業界初のレポートであり、比較の基準となるものです。企業がこの知見を活用することで、投資効果の最大化につながる領域に対して、効率化や改善の取り組みを即座に始めることができます。本レポートの主なポイントは次のとおりです。
開発中ファイルが大半を占め、プレゼンテーションファイルは過去のもの
画像ファイル、開発中ファイル、圧縮ファイルがストレージ容量全体のほぼ 3 分の 1 を占めています。ファイル数では、開発中ファイルが全体の 20% を占めています。過去 10 年間の傾向に目を向けると、プレゼンテーションは他のファイル形式に比べて容量は 500% 少なくなりました。企業データがPowerPoint に圧迫されるという状況は、解消されつつありますが、他のファイルタイプに移行している可能性もあります。
ファイルが増えるのは「秋」
ファイルが作成された時期については、秋が最も多くなりました。テキストファイルは 91% 増、表計算ファイルは 48% 増、地理情報システムのファイルは 89% 増となっており、特に大幅な伸びを示しています。動画ファイルのほとんどは夏と秋に撮影されて、企業のストレージに保存されているようです。動画ファイルは秋に 68% 増加しています。
データの 41% は放置されたまま
一般的に、データは 3 年程度で誰も更新しなくなり陳腐化します。ただし、法規制やコンプライアンスで必要な場合は別です。平均的な環境ではデータの 41% が陳腐化しています。つまり、過去 3 年間にわたり、一切変更もされず放置されていた、ということです。
所有者不明データ(Orphaned Data/オーファンド データ)が大きな負担に
従業員が異動したり退職したりすると、所有者不明データ発生の原因となります。多くの場合このようなデータは放置されたままになりますが、それでも維持管理コストは発生します。Data Genomics Index が明らかにした知見によると、所有者不明データの多くは、ビデオ、画像、プレゼンテーションなどのリッチコンテンツです。そのため、放置しておくとコスト上昇などのリスクが高まります。これらのデータはファイル数としては少ないもののディスク容量を必要以上に占めており、他の一般的なファイルに比べ200% 以上を占めています。
わずかな変更でもストレージコストを大きく削減可能
企業が自社のデータをこのように把握できれば、優先対応する分野を決めて大幅な効率化を達成できます。プレゼンテーション、表計算ファイル、文書など従来の Office 形式のファイルが陳腐化して必要以上の容量を占有すると、不要なコストが発生します。ビデオやイメージなどの動画ファイル、画像ファイルも大きな負担になります。このようなファイルへの対応としては、アーカイブ、削除を行うのが最適です。平均的な 10 ペタバイトの環境を考えてみましょう。見捨てられたプレゼンテーション、文書、スプレッドシート、テキストファイルのみを対象にアーカイブプロジェクトを実施するだけで、ストレージコストを年間 200 万ドル削減できます。 1
ベリタスの常務執行役員 テクノロジーセールス&サービス統括本部の高井隆太は次のように述べています。「弊社のお客様からはいつも、相反する状況に苦慮しているというお話を伺っています。つまり、データが急増している一方で、新しいサーバーやアプリケーションで対応するためのリソースや予算は限られているということです。ファイルの特性に対するベリタス独自の知見を集約すれば、データ環境の実態を正確に把握できます。このような知見を活かせば、企業が直面している深刻なデータ増加の問題を改善できるはずです」。
Data Genomics Index は、企業のデータ環境の実態を詳しく正確に評価した初の調査指標です。対象には、ファイルの種類別の分類から、経過日数による分布、サイズ別の割合までが含まれます。ベリタスではさらに、Data Genomics Project も立ち上げました。このプロジェクトは、本調査について議論するためのコミュニティとフォーラムを提供する場となります。企業が日々の業務で作成、保存、管理する非構造化データの真の性質を把握するための調査・取り組みは初となります。そして今回の Data Genomics Index は、この取り組みの最初の成果物となります。
このプロジェクトは、データサイエンティストや業界専門家、オピニオンリーダーが集結して、データゲノムの研究を進めて情報管理に活用していく場になることでしょう。また、深刻なデータ増大に取り組む世界中の企業に向けて、本調査および関連する調査を共有する役割も果たします。ベリタスは本プロジェクトの創立メンバーであり貢献者となります。ただし、本プロジェクトは完全に独立した事業として運営されることになります。
Data Genomics Index について
ベリタス製品は、世界の Fortune 500 企業の 86% をはじめとする世界中の 50,000 社を超える企業のお客様にご利用いただいています。新プロジェクトの Veritas Data Genomics Index は、ベリタスの広範な顧客基盤から収集された数百億のファイルとその属性に関する分析結果を活用しています。ベリタスは、企業が保持するデータの特性に関する知見を提供できるという独自の強みを備えた企業です。 詳細なレポートは PDF でご覧いただけます。
1Cappuccio, David J. Use a TCO Model to Estimate the Costs of Your Data Center (TCO モデルに基づくデータセンターのコスト算定)、Gartner、2012 年 6 月 26 日、インターネットにて提供。
<本件に関する報道関係の方のお問い合わせ先>
ベリタステクノロジーズ合同会社 広報部 長井 明日香
TEL:03-4531-1753 / 携帯電話: 080-2124-9576
E-mail: asuka.nagai@veritas.com
Veritas Technologies LLC について
Veritas Technologies(ベリタス テクノロジーズ)は、世界最大規模で最も複雑な環境にも対応できる情報管理ソリューション群を通じて、お客様が情報の力を最大限に活用することを可能にします。ベリタス製品は、 Fortune 500のグローバル企業 86% を含む、あらゆる規模の組織にご利用いただいており、データ可用性の向上とインサイト(洞察)の提供によってお客様の競合優位性を高めています。ベリタステクノロジーズ合同会社は、ベリタスグループの日本法人です。
*Veritas、Veritasロゴ は、Veritas Technologies LLC または関連会社の米国およびその他の国における商標または登録商標です。
*その他製品名等はそれぞれ各社の登録商標または商標です。
将来に関する記述: 製品の今後の予定についての将来に関する記述は予備的なものであり、未来のリリース予定日はすべて暫定的で、変更の可能性があります。今後の製品のリリースや予定されている機能修正についてはベリタスが継続的な評価を行なっており、実装されるかどうかは確定していません。ベリタスが確言したと考えるべきではなく、購入決定の理由とすべきではありません。