色々やったゎ(´・ω・`)
Tikaのバージョンを 1.4へ変更もしたけどダメだった。
ソース読むのめんどくさいよ(´;ω;`)
とりあえず調べていったら面白いことがわかった(・∀・)
リリースされてるソースIcu4jEncodingDetector.javaを読むと・・・
for (CharsetMatch match : detector.detectAll()) {
try {
return CharsetUtils.forName(match.getName());
} catch (Exception e) {
}
}
ん?
ここ何してんの?(;´Д`)
どうやっても戻り値が IBM500 ってなんだ???
これが原因かなと思いつつソースを修正
// 戻り値を JISAutoDetect に修正
return CharsetUtils.forName("JISAutoDetect");
できたで工藤(●・ω・●)
とりあえず不明だなぁ(;´Д`)
いい方法があれば別で修正しよう(´・ω・`)
0 件のコメント:
コメントを投稿