今さら何でPHP5.6なのかと悲しくなりますが、サーバー変更するときにPEARを使っていたりmysql_connect等のPHP7で廃止された関数を大量に使用しているサイトだったので、修正予算が無い関係でどうしてもPHP5系を選ばないといけませんでした。
しかもMySQLデータもPHPソースもHTMLも、全てEUC-JPで書かれているというサイトです。
せめてものあがきで最新である5.6を選択するわけですが、PHP5.6はデフォルトの言語がUTF-8になっているため、UTF-8で構築する分には何も考えなくて良いのですが、EUC-JPやShift_JISで書かれたサイトを設置すると文字化けにハマります。
今回、試行錯誤で時間が掛かったので、その解決策をメモしておきます。
通常はPHPソースもHTMLもUTF-8で掛かれている前提でphp.iniは、こう設定されていると思います。
; mbstring.language = Japanese ; mbstring.detect_order = ; mbstring.encoding_translation = Off ; mbstring.func_overload = 0 ; mbstring.http_input = ; mbstring.http_output = ; mbstring.internal_encoding = ; mbstring.strict_detection = Off ; mbstring.substitute_character = default_language = UTF-8
今回、他のバーチャルドメインも乗せているレンタルサーバーでphp.iniは変更できない状況だったので、php.iniはUTF-8の設定のままでプログラム側で対処します。
共通設定処理など、サイト全体の最初に処理されるPHPソースに以下の文を書き足します。
ini_set('input_encording', 'EUC-JP'); ini_set('internal_encoding', 'EUC-JP'); header('Content-Type: text/html; charset=EUC-JP');
mb_~関数では無いのが重要。
mb_http_inputやmb_internal_encodingでEUC-JPを指定した場合、表示はうまく出来てもフォームのPOST値がコード変換がされず文字化けしたり$_POSTで受け取れなかったり、htmlspecialchars が文字コードを誤認したりしました。
PHP5.6ではmb_internal_encoding等が非推奨になっているのはこの辺りの問題もあるからなのかも?
そこでPHP5.6で新設された input_encoding や internal_encoding で指定します。
→ mbstring.http_input mbstring.http_output mbstring.internal_encoding も一緒に設定した方が良さそう。
また default_language = UTF-8 がデフォルトになっていて Content-type: text/html; charset=UTF-8 というヘッダーが吐かれてしまうので、header関数でEUC-JPに上書きします。
Smarty3をもし使っているなら、define(“SMARTY_RESOURCE_CHAR_SET”, “EUC-JP”); も定義しましょう。この定数が定義されていないとSmartyが勝手に mb_internal_encoding を UTF-8 か ASCII に上書き設定してしまいます。
MySQLデータベースは5系以降は内部コードがUTF-8で処理されますので、EUC-JPでdumpしてきたデータはエディタ等でUTF-8にコード変換して、UTF-8でデータベースに流し込み通信段階でクライアント側の文字コードに変換させるのが吉。
PHPプログラムからは、connectしたあとにeucでデータを読み書きできるように文字コード設定しておけばOK
$con = mysql_connect($host, $user, $pass); mysql_set_charset('eucjpms', $con);
PotgreSQLデータベースだった場合も内部コードがUTF-8で処理されますので、EUC-JPでdumpしてきたデータもそのまま createdb したデータベースに psql で流し込めばUTF-8で格納されるので、あとは通信段階でクライアント側の文字コードに変換させるのが吉。/var/lib/pgsql/data/postgresql.conf に client_encoding = “EUC-JP” を書いちゃうのが楽
もう試行錯誤しないで済みますように。