PHP5.6でEUC-JPやShift_JISのサイトを動かす

By | 2019/02/08

今さら何でPHP5.6なのかと悲しくなりますが、サーバー変更するときにPEARを使っていたりmysql_connect等のPHP7で廃止された関数を大量に使用しているサイトだったので、修正予算が無い関係でどうしてもPHP5系を選ばないといけませんでした。

しかもMySQLデータもPHPソースもHTMLも、全てEUC-JPで書かれているというサイトです。

せめてものあがきで最新である5.6を選択するわけですが、PHP5.6はデフォルトの言語がUTF-8になっているため、UTF-8で構築する分には何も考えなくて良いのですが、EUC-JPやShift_JISで書かれたサイトを設置すると文字化けにハマります。
今回、試行錯誤で時間が掛かったので、その解決策をメモしておきます。

通常はPHPソースもHTMLもUTF-8で掛かれている前提でphp.iniは、こう設定されていると思います。

; mbstring.language = Japanese
; mbstring.detect_order = 
; mbstring.encoding_translation = Off
; mbstring.func_overload = 0
; mbstring.http_input = 
; mbstring.http_output = 
; mbstring.internal_encoding = 
; mbstring.strict_detection = Off
; mbstring.substitute_character = 
default_language = UTF-8

今回、他のバーチャルドメインも乗せているレンタルサーバーでphp.iniは変更できない状況だったので、php.iniはUTF-8の設定のままでプログラム側で対処します。

共通設定処理など、サイト全体の最初に処理されるPHPソースに以下の文を書き足します。

ini_set('input_encording', 'EUC-JP');
ini_set('internal_encoding', 'EUC-JP');
header('Content-Type: text/html; charset=EUC-JP');

mb_~関数では無いのが重要。
mb_http_inputやmb_internal_encodingでEUC-JPを指定した場合、表示はうまく出来てもフォームのPOST値がコード変換がされず文字化けしたり$_POSTで受け取れなかったり、htmlspecialchars が文字コードを誤認したりしました。
PHP5.6ではmb_internal_encoding等が非推奨になっているのはこの辺りの問題もあるからなのかも?

そこでPHP5.6で新設された input_encoding や internal_encoding で指定します。
→ mbstring.http_input mbstring.http_output mbstring.internal_encoding も一緒に設定した方が良さそう。

また default_language = UTF-8 がデフォルトになっていて Content-type: text/html; charset=UTF-8 というヘッダーが吐かれてしまうので、header関数でEUC-JPに上書きします。

Smarty3をもし使っているなら、define(“SMARTY_RESOURCE_CHAR_SET”, “EUC-JP”); も定義しましょう。この定数が定義されていないとSmartyが勝手に mb_internal_encoding を UTF-8 か ASCII に上書き設定してしまいます。

MySQLデータベースは5系以降は内部コードがUTF-8で処理されますので、EUC-JPでdumpしてきたデータはエディタ等でUTF-8にコード変換して、UTF-8でデータベースに流し込み通信段階でクライアント側の文字コードに変換させるのが吉。

PHPプログラムからは、connectしたあとにeucでデータを読み書きできるように文字コード設定しておけばOK

$con = mysql_connect($host, $user, $pass); 
mysql_set_charset('eucjpms', $con);

PotgreSQLデータベースだった場合も内部コードがUTF-8で処理されますので、EUC-JPでdumpしてきたデータもそのまま createdb したデータベースに psql で流し込めばUTF-8で格納されるので、あとは通信段階でクライアント側の文字コードに変換させるのが吉。/var/lib/pgsql/data/postgresql.conf に client_encoding = “EUC-JP” を書いちゃうのが楽

もう試行錯誤しないで済みますように。