Webサービスが返却するコンテンツについての注意事項
以下のようなHTMLコンテンツはXHTMLへの正規化ができないため、マッシュアップ、またはスクレイピングツールでは利用できません。
JavaScriptなどで動的に生成しているコンテンツ
script記述中にタグの記述があるコンテンツ
例) document.write("\<input name=");
htmlタグとbodyタグが正しく存在しないコンテンツ
補助文字(JIS2004で規格された4バイトで表現される文字)を含んだコンテンツ
listingタグ、plaintextタグ、xmpタグが含まれるコンテンツ
また、Webサービスから返却されたコンテンツは、マッシュアップフレームワーク内でUTF-8に変換されます。そのため、フォントの変更により見た目が変わる場合があります。
スクレイピングツールを利用する場合の注意事項
以下のようなHTMLコンテンツはスタイルの読み込みができないため、レイアウトが崩れる場合があります。
外部参照のスタイルシートのURLを動的に生成しているコンテンツ
scriptタグなどでスタイルを動的に定義しているコンテンツ
@importでスタイルシートを相対パスで定義しているコンテンツ