Ajaxフレームワーク ユーザーズガイド
目次 索引 前ページ次ページ

付録G スクレイピングツール

G.2 スクレイピングツールの操作手順

以下に、スクレイピングツールの操作手順を説明します。

[図: スクレイピングツールの操作手順]

  1. スクレイピングツールの起動
    マッシュアップフレームワークを利用するプロジェクトを選択し、コンテキストメニューの[スクレイピングツール]を選択して、スクレイピングツールを起動します。

  2. スクレイピング対象コンテンツの表示
    スクレイピングツールのエディタページでWebコンテンツのURLを入力し、[開く]ボタンをクリックします。
    スクレイピングの対象コンテンツがHTML表示エリアに表示されます。

  3. コンテンツのスクレイピング
    表示されているコンテンツから、スクレイピングしたいタグを選択します。
    任意の箇所をマウスカーソルでポイントすると、その位置のHTMLタグが[スクレイピング対象登録]メニューに表示されるので、スクレイピングする場合は、[スクレイピング対象登録]メニューをクリックします。解除する場合は、[スクレイピング対象登録]メニューを再クリックします。
    スクレイピングされたコンテンツは、背景色が変更されて表示されます。
    詳細は、“エディタページ”を参照してください。

  4. XSLの作成
    必要なタグがスクレイピングできたら、[XSL]タブをクリックして、XSLページを表示します。このとき、XSLが作成されます。
    作成されたXSLが、XSLページに表示されます。
    詳細は、“XSLページ”を参照してください。
    なお、XSLページに表示されたXSLデータは、編集できません。

  5. スクレイピングしたコンテンツの確認
    [プレビュー]タブをクリックして、プレビューページを表示します。
    スクレイピングしたWebコンテンツが表示されるので、スクレイピングしたコンテンツが正しいかを確認します。
    詳細は、“プレビューページ”を参照してください。
    スクレイピングをやり直す場合は、[エディタ]タブをクリックして、3.の操作に戻ります。HTML表示エリアには、コンテンツがスクレイピングされた状態で表示されます。

  6. XSLファイルの保存
    コンテンツが確認できたら、プレビューページの[保存]ボタンをクリックします。
    [保存]ダイアログボックスが表示されるので、保存先のプロジェクトとファイル名を指定して、保存します。
    詳細は、“プレビューページ”を参照してください。
    なお、ファイルの拡張子(.xsl)と保存場所(xslフォルダ)は、変更できません。

  7. スクレイピングツールの終了
    ツールの閉じるボタンをクリックして、スクレイピングツールを終了します。
    ツールの終了時に編集内容が保存されていない場合は、確認のメッセージボックスが表示されるので、そのままツールを終了するか、終了をキャンセルするかを選択します。


Webコンテンツが表示されない場合の対処
インターネット上のWebコンテンツをスクレイピングする場合、インターネットへの接続の設定が必要です。
スクレイピングツールのエディタページおよびプレビューページでWebコンテンツが表示されない場合は、以下の方法でインターネットへの接続を設定します。

  1. [Window]メニューから[Preferences]を選択します。
  2. [Preferences]ダイアログボックスの設定項目で、[General] > [Network Connections]を選択します。
  3. [Manual proxy configuration]を選択し、環境に応じたプロキシサーバの設定を行います。


目次 索引 前ページ次ページ

Copyright 2009 FUJITSU LIMITED