情報科学屋さんを目指す人のメモ

方法・手順・解説を書き残すブログ。私と同じことを繰り返さずに済むように。

【ChatGPT】PDFの日本語が文字化けする場合の対策

ChatGPT (175) ChatGPT-日本語 (5)

ChatGPT(GPT-5/GPT-4o等)で、PDFの作成を行った際に、PDFの内容が文字化けし、白い四角形や黒い四角形で表示されてしまう場合があります。

この文字化けの特徴と簡単にできる対策について紹介します。

ChatGPTが文字化けする

ChatGPTを使ってPDFの作成を依頼した際に、作成されたPDFをダウンロードして開くと文字化けしてしまい、正常に内容が表示されない場合があります。

一部の文字が白い四角形や、黒く塗りつぶされた四角形で表示されてしまうことが特徴です。

日本語が文字化け

このとき、数字やアルファベットは正常に表示され、日本語の部分だけが文字化けしている、ということも重要な特徴です。

よくある原因と対策

このよくある原因となっているのが、PDFに日本語を載せた際に、日本語用のフォントが指定されていない(日本語に対応したフォントが指定されていない)ことです。

この問題が発生した場合、(別の原因等例外の可能性はあるものの)日本語が利用できるフォントを指定してもらうことで、簡単にChatGPT側で対応してもらうことができます(フォントファイルの用意なども不要です)。

その方法は、文字化けしたPDFが出力された後に、単に「文字化けするので直してください」のように、文字化けしてしまったことを、ChatGPTに対して伝えるだけ、です。

すると、再度PDFの作成が行われますが、その処理内容を確認すると、「日本語フォントを登録」(pdfmetrics.registerFont(UnicodeCIDFont('HeiseiMin-We'))」の処理等が含まれたPDF生成処理に変更されていることが確認できます。

そうして再度生成されたPDFを再ダウンロードし、文字化けが解消しているかを確認してみてください。

コメント(0)

新しいコメントを投稿