お知らせ

  • 利用規約を守って投稿してください。また、よくある質問および投稿の手引きも参照してください。
  • メッセージの投稿にはアカウントが必要です。未登録の方は、ユーザ登録ページからアカウントを作成することができます。

#1 2015-05-09 20:05:23

wyamamo
新しいメンバ
登録日: 2015-05-09

日本語PDF ファイルの文字化け

お世話になります。

日本語PDF の文字化けに関して、ご助言いただきたく、初めて投稿いたします。


利用環境は以下のとおりです。
 ubuntu 14.04 LTS
 evince 3.10.3


poppler-data は正しくインストールされているようです。

$ apt list poppler-data
一覧表示... 完了
poppler-data/trusty,now 0.4.6-4 all [インストール済み]


日本語PDFが全てNGというわけではなく、とある銀行から受領しているレポートのPDFが文字化けします。

問題のPDFから個人情報を含まないページを抜き出したファイルを作成しました。
(ファイル名: mojibake_test_150509.pdf )

もし、よろしければ下記よりダウンロードして文字化けするかどうかをご確認いただけないでしょうか?
http://yahoo.jp/box/I6Xr79

このPDFのスクリーンショット画像も作成しました。
http://yahoo.jp/box/GO1xYO


evince でプロパティを確認すると、フォントのうちの1つは下記のようになっています。
----------
GothicBBB-Medium-90ms-RKSJ-H
TrueType(CID) (標準の14フォントのひとつではない)
エンコーディング: 90ms-RKSJ-H
埋め込みではない
代替フォントは TakaoPGothic
(/usr/share/fonts/truetype/fonts-japanese-gothic.ttf)
----------

私の理解では、poppler-data はエンコーディング(90ms-RKSJ-H)を正しく認識し、代替フォントも正しく設定しているように見えます。


なお、このPDF のテキストをコピーして、テキストエディタにペーストすると正しく日本語として表示されます。
evince 以外のアプリでは、Okular、ViewPDF、PDF Mod でも同様な文字化けとなります。
しかし、Chromium ウェブブラウザでは、PDFのプラグインにより正しく表示してくれます。


ご助言、よろしくお願いいたします。

オフライン

 

#2 2015-05-09 21:41:00

yaneno-suzume
メンバ
From: 名古屋
登録日: 2013-06-30

Re: 日本語PDF ファイルの文字化け

興味本位で調べてみました。
当方環境は ubuntu 12.04 LTS 32bit です。

evince 3.4.0 (ドキュメントビューアー) では、やはり文字化けします。
プロパティ/フォントは
 GothicBBB-Medium-90ms-RKSJ-H
 TrueType(CID)
 埋め込みではない

 Ryumin-Light-90ms-RKSJ-H
 TrueType(CID)
 埋め込みではない

テキストをコピーして、テキストエディタ gedit 3.4.1 にペースト
 日本語で表示され、文字化けしていません。

PDFedit 0.4.5-20101103134158 では開けませんでした。
 Unknown exception in script occured

バイナリエディター GHex 3.4.0 で開いてみました。
 オブジェクト 21 0 を参照していますが
 当該オブジェクトが含まれていないようです。

ファイルが壊れていませんか?

# 最近 PDF ファイルのフォーマットを少し調べていたもので。

オフライン

 

#3 2015-05-09 21:41:15

のんき
メンバ
登録日: 2007-03-04

Re: 日本語PDF ファイルの文字化け

Adobe Reader 9では正しく表示されるが、evinceでは文字化けする。
mojibake_test_150509.pdfのフォント設定を覗いてみると
KozMinPr6N-Regularフォントが指定されています。
このフォントはAdobe Reader専用のフォントでPDFファイルには取り込まれていません。
evinceではこのフォントがPDFファイルに取り込まれていたら正常に表示されたと推察されます。
だがフォントが取り込まれていませんので代替フォントとなるはずなのですがevinceの不都合に
より正しく代替されず文字化けを起こしていると推察されます。
またPDFファイル作成時このフォントを取り込ませて再配布した場合ライセンス違反となります。

[いわにぃのブログ]に同じような問題の解説が紹介されています。参考にしてください。
http://blog.livedoor.jp/ti5942/archives/2010-06.html

オフライン

 

#4 2015-05-10 19:05:49

wyamamo
新しいメンバ
登録日: 2015-05-09

Re: 日本語PDF ファイルの文字化け

yaneno-suzume さん、早速のリプライありがとうございます。
問題のファイルは Chromium (ブラウザ)、あるいは、Adobe Reader(Windows)では正しく表示されるので、壊れてはいないはずです。
とりあえず、私個人の環境の問題ではなさそうですね。

のんきさん、フォントの埋め込みにライセンスが必要なことは知りませんでした。
Windows の Adobe Reader では "KozGoPr6N-Medium"、"KozMinPr6N-Regular" となっていることを確認できました。
これらが代替フォントで表示されないのは evince (poppler? ∵Okular、ViewPDF でも同件なので) の問題である可能性があるわけですね。
これらが PDFに埋め込まれていれば、evince (poppler?) でも表示できそうではあるものの、ライセンスの問題があると。
そうなると、これらを表示できる Chromium (ブラウザ) の PDF Viewer プラグインの素晴らしさが実感できてきました。
evince (poppler?) は気長に待つことにして、Chromium を使うことにします。
ありがとうございました。

オフライン

 

#5 2015-05-10 20:35:01

passenger
メンバ
登録日: 2015-03-06

Re: 日本語PDF ファイルの文字化け

PDF ファイルの操作に Evince の機能が絶対必要を前提としてのQ&Aでしたらこの投稿は無視してください。
LibreOffice Draw で閲覧・編集・印刷ができるので私は困っていません。
mojibake_test_150509.pdf ファイルも文字化けしません。
参考までに LibreOffice Writer で文書ファイルを PDFファイル にエクスポートすることもできます。

オフライン

 

#6 2015-05-10 21:10:26

yaneno-suzume
メンバ
From: 名古屋
登録日: 2013-06-30

Re: 日本語PDF ファイルの文字化け

どうも失礼しました。
その後の調査結果。

Windows7 + Adobe Reader XI 11.0.10 (別PC) …
 日本語で表示され、文字化けしません。
# 近日中に Adobe Reader のセキュリティ・アップデートがある模様
# http://internet.watch.impress.co.jp/docs/news/20150508_700903.html より

Inkscape 0.48 …
 日本語で表示され、文字化けしません。

Ubuntu Japanese Team Wiki に記事があり、既知の問題のようです。
  https://wiki.ubuntulinux.jp/Develop/Natty/Evince

オフライン

 

#7 2015-05-10 22:09:05

yaneno-suzume
メンバ
From: 名古屋
登録日: 2013-06-30

Re: 日本語PDF ファイルの文字化け

yaneno-suzume による投稿:

Ubuntu Japanese Team Wiki に記事があり、既知の問題のようです。
  https://wiki.ubuntulinux.jp/Develop/Natty/Evince

すみません、これとは別のバグのようですね。

オフライン

 

#8 2015-05-10 22:27:36

のんき
メンバ
登録日: 2007-03-04

Re: 日本語PDF ファイルの文字化け

wyamamoさん、こんにちは。
Ubuntu 14.04と言う事でevinceをターゲットしておられるようですが
Linux版Adobe Reader 9.5.5-1が使用できることをご存知でしょうか。
Adobeの正式なコメントではLinux版はサポート対象外となっておりますが
Adobe Reader 9.5.5-1は動作します。大概のPDFファイルは参照できます。
Forefix、OperaなどのNPAI版pluginでPDFファイルを表示することもできます。
導入されてはいかがでしょうか。
インストール方法は下記URLを参考にしてください。

Ubuntu 14.04 LTSをインストールした直後に行う設定 & インストールするソフト
http://sicklylife.at-ninja.jp/memo/ubun … dobereader

オフライン

 

#9 2015-05-10 22:40:28

のんき
メンバ
登録日: 2007-03-04

Re: 日本語PDF ファイルの文字化け

yaneno-suzumeさん、こんにちは。

>>すみません、これとは別のバグのようですね。
これはバグ(不具合)ではありません。
evinceが正式に日本語対応していないために発生する不都合です。

オフライン

 

#10 2015-05-11 23:24:37

wyamamo
新しいメンバ
登録日: 2015-05-09

Re: 日本語PDF ファイルの文字化け

passenger さん、LibreOffice Draw で問題のPDFを正しく表示できることを確認できました。
さらに、これを PDF エクスポートすると、Evince でオープンしても OK な PDF になりました。
その PDFについて、Evince で確認したフォントのプロパティは TakaoPGothic (エンコーディング WinAnsi) となっていました。

yaneno-suzume さん、追加情報ありがとうございます。
Inkscape 0.48 をインストールして、日本語が表示されることを確認できました。
このアプリは初耳だったのですが、グラフィックエディタですね。
いつも使っているエディタ Gimp 2.8.10 でも試してみたところ、evince (poppler?) と同じ症状の文字化けでした。

のんきさん、行間まで読んでいただいて、ありがとうございます。
Linux では Adobe はサポート切れなので使えないと思っていたので、触れませんでした。
ご教授いただいたサイトにあったとおりの手順にて AdobeReader 9.5.5 +日本語用のフォントをインストールできました。
問題の日本語表示も正しくできることも確認できました。

みなさま、ありがとうございました。

オフライン

 

Board footer

Powered by FluxBB