Ajaxフレームワーク ユーザーズガイド
|
目次
索引
|
G.2 スクレイピングツールの操作手順
以下に、スクレイピングツールの操作手順を説明します。
[図: スクレイピングツールの操作手順]
- スクレイピングツールの起動
マッシュアップフレームワークを利用するプロジェクトを選択し、コンテキストメニューの[スクレイピングツール]を選択して、スクレイピングツールを起動します。
- スクレイピング対象コンテンツの表示
スクレイピングツールのエディタページでWebコンテンツのURLを入力し、[開く]ボタンをクリックします。
スクレイピングの対象コンテンツがHTML表示エリアに表示されます。
- コンテンツのスクレイピング
表示されているコンテンツから、スクレイピングしたいタグを選択します。
任意の箇所をマウスカーソルでポイントすると、その位置のHTMLタグが[スクレイピング対象登録]メニューに表示されるので、スクレイピングする場合は、[スクレイピング対象登録]メニューをクリックします。解除する場合は、[スクレイピング対象登録]メニューを再クリックします。
スクレイピングされたコンテンツは、背景色が変更されて表示されます。
詳細は、“エディタページ”を参照してください。
- XSLの作成
必要なタグがスクレイピングできたら、[XSL]タブをクリックして、XSLページを表示します。このとき、XSLが作成されます。
作成されたXSLが、XSLページに表示されます。
詳細は、“XSLページ”を参照してください。
なお、XSLページに表示されたXSLデータは、編集できません。
- スクレイピングしたコンテンツの確認
[プレビュー]タブをクリックして、プレビューページを表示します。
スクレイピングしたWebコンテンツが表示されるので、スクレイピングしたコンテンツが正しいかを確認します。
詳細は、“プレビューページ”を参照してください。
スクレイピングをやり直す場合は、[エディタ]タブをクリックして、3.の操作に戻ります。HTML表示エリアには、コンテンツがスクレイピングされた状態で表示されます。
- XSLファイルの保存
コンテンツが確認できたら、プレビューページの[保存]ボタンをクリックします。
[保存]ダイアログボックスが表示されるので、保存先のプロジェクトとファイル名を指定して、保存します。
詳細は、“プレビューページ”を参照してください。
なお、ファイルの拡張子(.xsl)と保存場所(xslフォルダ)は、変更できません。
- スクレイピングツールの終了
ツールの閉じるボタンをクリックして、スクレイピングツールを終了します。
ツールの終了時に編集内容が保存されていない場合は、確認のメッセージボックスが表示されるので、そのままツールを終了するか、終了をキャンセルするかを選択します。
Webコンテンツが表示されない場合の対処
インターネット上のWebコンテンツをスクレイピングする場合、インターネットへの接続の設定が必要です。
スクレイピングツールのエディタページおよびプレビューページでWebコンテンツが表示されない場合は、以下の方法でインターネットへの接続を設定します。
- [Window]メニューから[Preferences]を選択します。
- [Preferences]ダイアログボックスの設定項目で、[General] > [Network Connections]を選択します。
- [Manual proxy configuration]を選択し、環境に応じたプロキシサーバの設定を行います。
Copyright 2009 FUJITSU LIMITED