カラー帳票認識時の留意事項について説明します。
色についての留意事項は以下のとおりです。
認識できる色数
認識できる色数は、オーバレイ出力時は16色(基本色16色)、帳票出力時は32色(基本色16色+カスタム色(任意のRGBの色)16色)です。
認識できる色数以上の帳票を認識した場合、似た色を平均色にしてまとめます。そのため、正しい色で認識されない場合があります。
認識できる表の背景色
認識できる表の背景色は、オーバレイ出力時は16色(基本色16色)、帳票出力時は32色(基本色16色+カスタム色(任意のRGBの色)16色)です。
認識できる文字色
認識できる文字色は、オーバレイ出力時は16色(基本色16色)、帳票出力時は32色(基本色16色+カスタム色(任意のRGBの色)16色)です。
下記の例のように1つのセルの中に文字色が2色以上ある帳票を認識した場合、色の境界で分割されて認識されます。
下記の例のように、1行中に文字色が2色以上ある帳票を認識した場合、色の境界で分割されて認識されます。
OCR認識画面で文字の認識枠を指定して再度認識を行った場合、以下のことに注意してください。
最初の認識で作成された色が有効となるため、正しい色で復元できない場合があります。
同一の文字列が途中で分割されて認識される場合があります。この場合、認識枠を少し大きくしてから再度認識を行うと、改善される場合があります。
認識できる罫線色は、オーバレイ出力時は16色(基本色16色)、帳票出力時は32色(基本色16色+カスタム色(任意のRGBの色)16色)です。
罫線色がセル内の1辺の途中(始点・終点以外)で変わり、1辺に2色以上ある帳票を認識した場合、そのセル内の平均した色となります。
また、下記の例のように、セルの外枠が同一色で囲まれていない場合、すべてが矩形として認識される場合と、矩形+罫線として認識される場合があります。
下記例のような、点線および二重線は、正しく認識されない場合があります。
下記の例のように、罫線がなく、色によって境界を表している表の場合、境界が罫線として認識されない場合があります。
下記の例のような、短い罫線は、認識されない場合があります。
カラー網がけがある枠の認識
下記の例のような、カラーの網がけがある枠は、網がけ部分が面塗りで認識されます。
なお、網がけ枠内の文字列は、網がけの影響により正しく認識されない場合があります。
裏写りのある帳票の認識
裏写りが強い帳票の場合、裏写りしている罫線が誤って抽出される場合があります。