[講演当時]
ミドルウェア事業本部
データマネジメント・ミドルウェア事業部
事業部長
従来、情報統合の実現には多くのケースで綿密な事前設計を必要とし、多大な時間とコストを要しました。こうした課題を解決する新しい情報統合のコンセプト、それが富士通のご提案する『まず集める、まずためる、使う時に自在に統合して活用する』です。最大の特長は事前設計を必要とせず、さまざまな業務システムの情報を横断的に活用できるという点にあります。「富士通フォーラム2009」において、ミドルウェア事業本部 今村浩一は、新コンセプトに基づく情報統合プラットフォームについてご紹介いたしました。
[2009年7月31日掲載]
情報統合の重要性が高まっている背景
『まず集める、まずためる、使う時に自在に統合して活用する』という新発想
現場のノウハウと新技術を駆使した情報統合プラットフォーム
これまでの情報統合の概念を変える
データ収集・統合ソフトウェア
「Interstage Information Integrator」
事前設計なしで蓄積、安定した性能で抽出
データ蓄積ソフトウェア
「Interstage Information Storage」
情報統合プラットフォームをベースに、
さまざまな経営課題を解決する活用ソリューション
経営とITが一体化する時代にあって、あらゆる局面で情報の活用が不可欠です。コスト低減、品質改善、事業拡大、社会的貢献など、ITの重要性と、その活用領域はますます拡がっています。それに伴い、蓄積、保存するデータの種類も量も増大するばかりです。
こうした中、さまざまな業務システムの情報をより広く横断的に活用するための情報統合が注目を集めています。情報統合は、企業の価値向上にむけて全体の最適化を支援し、経営の現場、営業の現場など、さまざまな現場からデータを集めて、統合、分析し、活用する仕組みを提供します。
たとえば、「今、何が売れているのか」を知るためには販売システムの情報を分析すればわかります。しかし、なぜ製品の売上が伸びないのか、何をすれば利益が拡大するのかといった仮説を立てて検証、分析を繰り返す作業では、販売システムだけでなく顧客管理システムなど複数のシステムに分散している情報を収集し統合することが必要です。
企業環境の変化に対応するために、経営層から現場までそれぞれの判断や意思決定のスピードと精度がより求められる中、情報統合の重要性はいちだんと高まっています。
企業におけるデータは大量に存在し、それぞれ形式が異なっているため、これまで情報統合の実現には非常に複雑なシステムの構築を必要としていました。さらに、情報源も活用も多様化が進み、情報統合へのニーズはますます高度化しています。
従来のように活用方法を決め、綿密に設計してデータをDBに集めるといった方式では多くの時間とコストが必要です。また、活用目的ごとに収集の仕組みを構築することで活用と収集が密結合の状態となり、その結果、変更のたびに設計の見直しの範囲も拡がります。
「従来の情報統合が抱える課題を解決するためには、データの収集方法と活用方法の独立という発想の転換が必要です。いま、いつためても、どう取り出しても良い仕組みが求められています。富士通では、情報統合の新しいコンセプト『まず集める、まずためる、使う時に自在に統合して活用する』をご提案しています。事前設計を不要とし、そのままの形で蓄積できるフラットなデータ格納庫と、複雑な条件でも安定した性能を発揮できるデータ抽出エンジンの2つの機能を中心に、新しいコンセプトに基づくダイナミックな情報統合を実現いたします。」(今村)

【図1 : 富士通の情報統合への取り組み】
富士通では、『まず集める、まずためる、使う時に自在に統合して活用する』という新しい情報統合のコンセプトをかたちにするべく、独自の最新データ処理技術と数多くのプロジェクトで培ったシステム構築ノウハウのもと、商品開発に取り組んでいます。また、他社製品との連携強化も一層はかっています。
今回、情報統合プラットフォームとして、2009年4月に販売開始したデータ収集・統合ソフトウェア「Interstage Information Integrator」、データ蓄積ソフトウェア「Interstage Information Storage」を中心に、合わせて活用ソリューションもご紹介いたします。

【図2 : 新技術によるダイナミックな情報統合の実現】
情報統合プラットフォームの中核を担う「Interstage Information Integrator」は、さまざまな業務システムからデータを収集・統合し、そのデータを分析、戦略立案、帳票作成などを目的とする活用システムへ配付する仕組みを実現します。
これまでのETLツール(注1)や、データHub(ハブ)における情報統合の概念を変える「Interstage Information Integrator」の特長は、1.デザインシートによる高い作業効率、2.収集と活用の独立を損なわない運用性、3.高度なデータ変換処理と、大きく3点です。
(注1)ETLツール : データの抽出(Extract)・加工(Transform)・書き出し(Load)の一連の処理を支援するソフトウェア

【図3 : 「Interstage Information Integrator」の概念】
デザインシート(注2)を定義するだけで設計・レビューから開発、資料作成、変更・保守まで共通に利用できます。デザインシートをそのままインポートすることで運用環境に登録、反映できるため、仕様書作成と定義作業の重複を省くとともに不整合を防止し、システムの設計から運用・保守までの工数を大幅に削減できます。
追加や変更・保守の場合も、デザインシートを参照し影響箇所を検索してデザインシートを変更するだけで対応可能です。また、使い慣れたMicrosoft Office Excelで利用できるので新たに操作を覚える必要もありません。また、設計情報と動作中システム内定義の一元管理も実現できます。
(注2)デザインシート : Interstage Information Integratorの動作定義を記述するMicrosoft Office Excelベースの仕様書

【図4 : すべての作業の起点となるデザインシート】
デザインシートの活用による作業効率のベンチマーク(当社比)では、ファイル転送ソフト+データ加工プログラム開発に比べ、75%削減(49人月→13人月)、またETLツールの利用に比べ、45%削減(24人月→13人月)という結果がでています。
【前提】
【図5 : デザインシート活用時の開発・テスト工数比較】
一般に、データを送り出す側の業務システムと、データを使う側の活用システムでは、それぞれ運用が違います。たとえば、データをPULLで受け取るかPUSHで受け取るかの受け渡し方法の違い。一括で受け取るか逐次受け取るかによって異なってくる、受け取るデータの単位の違い。また、夜間に処理をおこない、翌朝そのデータを利用するなど、受け渡しの時間帯の違い。こうした運用の違いを吸収し、柔軟なデータ収集、配付を実現します。また、活用システムの運用が変わっても業務システムの運用は変更不要です。
従来、たとえば販売データに対し、店舗ごとの仕分けデータを振り分けるといった作業をおこなう場合、店舗マスタや商品マスタをマッチング(突き合わせ)するなど、非常に多くの手順を踏む必要がありました。「Interstage Information Integrator」では、独自のオートマトン技術(注3)を活用し、高度かつ高速なデータ変換処理を実現します。複数マスタの同時マッチングや複数条件の一括仕分けにより、仕分け作業手順の大幅な簡素化もはかれます。
さまざまな業務システムからデータを収集し統合する場合に課題となる、顧客マスタなどの氏名・住所表記のバラツキを統一するような商品も今後提供予定です。
(注3)オートマトン技術 : 計算機科学における文字列照合技術の1つ。入力された文字列情報に対し、内部で保持する文字列情報の状態に応じた処理をおこなうことで高速な文字列照合を実現
情報統合プラットフォームにおいて、データ蓄積の領域を担うのが「Interstage Information Storage」です。
「Interstage Information Integrator」により収集、統合されたデータをファイルのまま格納し、項目単位で抽出することを可能にします。事前設計なしで蓄積でき、安定した性能で抽出できる「Interstage Information Storage」には、1.多種・大量のデータの蓄積、2.並列・多重処理アーキテクチャで安定した性能、3. スケールアウト型で経済的、4.安心・安全に蓄積と、大きく4つの特長があります。

【図6 : 「Interstage Information Storage」の概念】
項目名付の非構造データ形式(CSV、XML)で蓄積できるため、データの柔軟な追加や取り出しが可能です。またデータ圧縮とインデックスレスにより、RDBに比べてディスク容量を1/5(当社比)、インデックス設計などの手間の大幅な削減により導入工数も1/3(当社比)に削減することができます。
他に便利な機能として、一定期間の保存期間が終了すると自動的にデータを消去する期限管理機能などもあります。
複数の抽出要求を一括して実行する独自のハイトラフィック技術(注4)により、ハードウェアにかかる負荷を大幅に軽減します。またファイルに含まれる主な項目などを管理するカテゴリ・パーティション・マップ (CPM)を参照し、抽出条件に基づいて目的のファイルを絞り込んでアクセスすることにより、大量のデータであっても高い抽出性能を発揮します。絞りこんだファイルに対し、複数CPUで並列に動作している抽出サーバが一斉に検索処理を実行します。さらにデータのストリーミング解凍(注5)、I ⁄ O帯域幅の有効活用により、複雑な条件や多重要求でも安定した高い抽出性能を可能にしています。
(注4)ハイトラフィック技術 : 複数のアプリケーションから同時に検索要求がきた場合、各アプリケーションの検索要求を一体化することにより一括検索する技術(特許出願済)
(注5)ストリーミング解凍 : 圧縮データを解凍しながら同時に抽出をおこなう事

【図7 : 複数の抽出要求を一括検索する仕組み】
オープンなハードウェアを組み合わせ、サーバとストレージを独立して増設できます。機能別サーバ構成による負荷に応じた柔軟な構成や、データ量に合わせてディスクのみの増設も容易です。必要なとき必要なだけハードウェアのリソースを追加でき、非常に経済的です。
蓄積されているデータ全体は管理者のアクセスキーで保全(開発中)されているため、仮にファイルを持ち出されても内部を見ることはできません。また、ユーザIDによるアクセス制限やデータ項目単位のアクセス制限(開発中)により、利用者階層別のデータ管理と保全を実現できます。また、データへのアクセス証跡の蓄積も可能です。
情報統合プラットフォームをベースに、さまざまな経営課題を解決する活用ソリューションの展開も進めています。
企業の拠点・部門間に点在する情報の連携・統合をおこない、現場視点の見える化を可能にするデータ統合ソリューション「BaseOn G³」、内部統制のための第三者チェックをモニタリング統制として実現する「証拠書類ソリューション」、リアルタイム経営や企業活動の透明性の担保、乱立するデータウェアハウスの情報の一元化を実現する「経営の見える化ソリューション」など、多彩なソリューションをご用意しています。
今後も自社はもとより他社も含めて優れた活用ソリューションとの連携を強化し、お客様企業の多様なニーズにお応えしてまいります。
「見える化、情報の戦略的活用、内部統制の強化など、現在から将来に渡るさまざまな経営課題の解決に情報統合は欠かせません。情報活用の目的に合わせて事前に詳細設計が必要であった従来のシステムとは異なり、『まず集める、まずためる、使う時に自在に統合して活用する』という新発想の情報統合は、企業の価値向上にむけて全体最適を強力にサポートいたします。またIT投資コストの抑制、変化への迅速かつ柔軟な対応も可能にします。富士通は、これからもお客様企業のビジネス発展に貢献するべく、情報統合プラットフォームと活用ソリューションの拡充に努めてまいります。」(今村)

【図8 : 富士通のミドルウェア体系】
(注) 本ページに記載された内容は、掲載日現在のものです。その後予告なしに変更されることがあります。あらかじめご了承ください。
日時: 2009年12月1日(火曜日) 14時~16時20分
場所: Platform Solution Center (東京)
(注)開催日以降または満員等により上記セミナーは予告なく締め切らせていただくことがございます。あらかじめご了承下さい。
データ収集・統合ソフトウェア:
データ蓄積ソフトウェア: