ビジネスにおいては、「ビッグデータ」と呼ばれる「構造化データ」と「非構造化データ」をいかに有効活用できるかが「デジタルトランスフォーメーションの促進」につながる時代となってきました。
そのような中、非構造化データの管理に苦心している企業は少なくありません。業務効率化の面でもセキュリティ面でも、非構造化データとの向き合い方は企業のビジネスを左右する大きな要因となるでしょう。
本記事では、効率的な非構造化データの管理ソリューションの選定ポイントについて解説します。
目次
非構造化データはなぜ慎重に管理しなければいけないのか?
ビッグデータ分析の重要性が謳われるようになってから、「構造化データ」と「非構造化データ」という概念が注目されています。
構造化データとは、ERPなどの業務ソフトウェアのデータベースで扱われる、ExcelやCSVのような「列」と「行」の形式で格納されるデータを指し、一方で「非構造化データ」とは、提案書や見積書、契約書、デザインデータなど、プレゼンテーションやエクセル、ワード、画像、動画形式のデータ(ファイル)を指します。
そして、ほとんどの企業が構造化データよりもはるかに多い量の非構造化データを保有しているといわれています。
※詳細については、「構造化データと非構造化データとは?データ活用に必要なビッグデータ管理の課題」を参照ください。
図)企業内ビッグデータ?構造化データと非構造化データの8割2割の法則
こうした状況下で、非構造化データをいかに管理するかは企業側の大きな課題となってきました。それは、構造化データよりも非構造化データのほうがデータベースでの管理が難しく、無造作に年々増えていくため、日々の業務と連動した管理や有効活用が難しいからです。これは、業務で有効活用される「構造化データとの乖離や分断」がますます進んでいるともいえるでしょう。
また、莫大な量の非構造化データを無造作に蓄積させていくだけでは、セキュリティ・コンプライアンスの面でも健全とはいえません。
日々の業務で非構造化データは発生し続けていくため、有効なソリューションがないと管理はどんどんずさんさを増していきます。社内の業務効率化はもちろん、対外的にデータの安全性を示すためにも非構造化データは慎重に取り扱うべきなのです。
非構造化データを構造化データと同じように扱える基盤の整備
ビッグデータの管理やデジタルトランスフォーメーションの実践では、「構造化データ」が重用されます。管理がしやすいうえ、データの有効活用など、扱いやすい情報源となる構造化データは時代のニーズに則しているといえるでしょう。
企業が非構造化データを効率的に管理するために最も重要なことは、非構造化データをこれまでの構造化データと同じように扱えるソリューション基盤の整備が必要であるということです。
つまり、「非構造化データに構造化データと同等の価値を与えることが、デジタルトランスフォーメーションをより促進する重要なポイント」となるでしょう。
それでは、構造化データと同等の扱いができるとはどのようなことでしょうか?ここでは、構造化データの特徴について簡単にまとめてみました。
- 構造化データは対象のデータが「列」と「行」で格納されているため、データが必要な場合「列」や「行」を指定することで瞬時にアクセスができる「優れた検索性」をもっている。また、データの集計や比較、更新作業なども容易に可能である。
- 構造化データは、データの生成・編集・上書き・保存に対して、異なるバージョンを許諾しないため、「データの信憑性」が高い(唯一のバージョンでのみ管理される)
- 構造化データは、日々の業務で用いる業務ソフトウェアと紐づくデータベースに格納されているため、データを業務で利用する「手順」や「プロセス」が明確であり、「業務の効率化」に大きく貢献する。
- 構造化データは、業務ソフトウェアのユーザー権限管理やアクセスログの管理がしっかりしているため、データへのアクセス制限や閲覧制限、監視など、データ改ざんや情報漏えいリスクに対する「セキュリティ対策」が担保されている。
いかがでしょうか?非構造化データに対しても同等に扱うことができないでしょうか?
非構造化データの管理に有効な文書・コンテンツ管理ソリューション
デジタルトランスフォーメーションを実践し、構造化データと同様に非構造化データの管理精度を高めていくには、「文書・コンテンツ管理ソリューション」が有効です。
前述のとおり、構造化データは、「優れた検索性」を持ち、「データの信憑性」があり、「業務の効率化」に大きく貢献し、「セキュリティ対策」が担保されています。
すなわち、非構造化データであるファイルを構造化データと同様に扱うための文書・コンテンツ管理ソリューションには、以下の機能が備えられていることに着目する必要があるでしょう。
ポイント ①:優れたファイルの検索性
検索者に対して、簡易的な検索や詳細な検索によって瞬時にファイルにアクセスできる。
ファイル単位で、ドキュメント名・管理番号・作成者・作成日などの基本的な情報からカスタムの情報まで様々な「メタデータ」を付与・管理でき、自然言語による検索や類似検索、絞り込み検索など、検索者が求める情報を瞬時に提供できる機能が求められます。
ポイント ②:高度なバージョン管理
複数のファイル作成者が互いの作業を上書きしないようするなど高度なバージョン管理ができる。
ファイルのチェックアウトやチェックイン機能、全てのバージョンの管理による過去のバージョンへの容易なアクセスが求められます。
ポイント ③:業務システムや既存業務との連携
文書・コンテンツ管理ソリューションの導入がかえって業務の負荷になってしまうようなことがあってはなりません。
既存のERPなどの業務ソフトウェア(オンプレミス型/クラウド型)とのスムーズな連携、変更要求・レビュー依頼・承認など、業務単位での細かなワークフローの組み込み、そして、従業員に広く利用してもらうためのソフトウェアの優れた操作性(UI/UX)が求められます。
ポイント ④:高度なセキュリティ設定と監査ログ
ファイルやフォルダ単位で、細かなアクセス制限や閲覧権限、監査ログを管理できる。
アクセス制御のみならず、ダウンロードや印刷、文書内の特定部分のマスキング表示など、従業員の所属部門や役職に応じた高度なセキュリティ設定ができる機能が求められます。また、データ改ざん防止のため、すべてのファイル操作に関わる実行イベントを監査するログ採取の自動化も有効です。
いかがでしょうか?文書・コンテンツ管理ソリューションを正しく選定し導入することで、これまで以上に業務の効率化をもたらすと共に、コンプライアンスなどのセキュリティ面の更なる強化も可能となるでしょう。
デジタルトランスフォーメーションの更なる促進に向けて
ビジネスを続けていく以上、非構造化データは常に増え続けていきます。無策のままこれらのデータを放置していると、いずれ日々の業務に支障をきたしたり、セキュリティ事故が起きてしまうなど、企業経営にリスクをもたらしかねません。むしろビジネス上起こりかねない訴訟問題が発生した際に、重要なドキュメント類の準備を効率的に行えることが可能となります。
デジタルトランスフォーメーションを実現しつつガバナンスを保つ最適な情報管理はこれからの企業には必要不可欠となるのです。
非構造化データとしっかり向き合い、構造化データと同じように日々の業務の一部として有効活用することができれば、デジタルトランスフォーメーションをより促進することができるでしょう。