PHPで便利なマルチバイト文字操作関数をまとめて紹介
作成日:2009.03.09
PHPのマルチバイト文字を扱うために用意されたmb_系関数を活用して、文字コードの判別や変換、文字列操作を効率よく行う方法を紹介します。文字化けの防止やデータ処理を円滑に進めるために役立つ関数群を解説します。
error この記事は最終更新日から16年以上が経過しています。
目次
プログラミングをする上で、マルチバイト文字(全角文字etc)の扱いというのはなかなか面倒な問題ですよね。
言語側で用意されている文字列操作系関数が、1バイト文字にしか対応していなくて困ったりとか。
PHP のマルチバイト文字操作系関数(mb_ が頭につく関数群)は、そういう意味で非常に便利な存在だといえます。
というわけで、個人的によくお世話になっている(or 今後なる予定の)関数群を、備忘録的にまとめておきます。
mb_check_encoding
文字列が、指定した文字コードかどうか判別する関数。
文字列 $string が utf-8 かどうか判別する場合、
if(mb_check_encoding($string,'UTF-8')){
print ("\$string は UTF-8 です。\n");
}else{
print ("\$string は UTF-8 ではないです。\n");
}
みたいな感じで使う。
mb_detect_encoding
文字列の文字コードを取得する。
$encode = mb_detect_encoding($string);
mb_convert_encoding
文字列を、指定した文字コードに変換する。
euc の文字列を utf-8 に変換する場合、
$utf8_string = mb_convert_encoding($euc_string,'UTF-8','EUC-JP');
みたいな感じで使う。
最後の「'EUC-JP'」の部分は、配列や、カンマ区切りの文字列で指定可能。
また「auto」を指定すると、自動判別してくれる(あまりあてにならない)。
mb_convert_kana
全角文字と半角文字の相互変換。
$string = mb_convert_kana($string,option,'UTF-8');
「option」の部分で、変換前・変換後の文字種を指定する。
- a
- 全角英数字を半角英数字に変換。
- A
- 半角英数字を全角英数字に変換。
- s
- 全角スペースを半角スペースに変換。
- S
- 半角スペースを全角スペースに変換。
- k
- 全角カナを半角カナに変換。
- K
- 半角カナを全角カナに変換。
- h
- 全角かなを半角カナに変換。
- H
- 半角カナを全角かなに変換。
- c
- 全角カナを全角かなに変換。
- C
- 全角かなを全角カナに変換。
- V
- 濁点つき半角カナを一文字の全角文字に変換。K や H と併用。
mb_strlen
文字列の長さを、マルチバイト文字も各一文字扱いで取得する。
$length = mb_strlen($string,'UTF-8');
mb_substr
文字列を、マルチバイト文字も各一文字扱いで、指定した長さにして返す。
文字列の頭から20文字目までを取得したい場合、
$substring = mb_substr($string,0,20,'UTF-8');
みたいな感じにする。
mb_send_mail
自動で文字コードを変換した上で、メール送信する。
mb_send_mail($to_address,$subject,$mailbody);
ただし、自動文字コード変換はあまりあてにならないので、件名や本文の文字コードをあらかじめ変換しておくか、PHP 内部のデフォルト文字コードを設定しておく方が良いかも。
詳しくは、PHPのmb_send_mail()関数で送信したメールが文字化けする際の対処法を参照のこと。

奈良市を拠点に、26年以上の経験を持つフリーランスWebエンジニア、阿部辰也です。
これまで、ECサイトのバックエンド開発や業務効率化システム、公共施設の予約システムなど、多彩なプロジェクトを手がけ、企業様や制作会社様のパートナーとして信頼を築いてまいりました。
【制作会社・企業様向けサポート】
Webシステムの開発やサイト改善でお困りの際は、どうぞお気軽にご相談ください。小さな疑問から大規模プロジェクトまで、最適なご提案を心を込めてさせていただきます。
ぜひ、プロフィールやWeb制作会社様向け業務案内、一般企業様向け業務案内もご覧くださいね。
OpenAI API 実践例:Chat Completions API で JSON形式レスポンスを取得する方法
2025.06.04
OpenAI API の Chat Completions API を用いて、レスポンス形式を JSON に固定する実装手法を紹介します。PHP を使った具体的なコード例を通じ、response_format パラメータの設定方法や利用シーン、最新モデルでのオプション利用まで解説しています。
CodeIgniter 4 クエリビルダ入門 ― 実践的なデータ操作とSQL組み立てのテクニック
2025.05.30
CodeIgniter 4 のクエリビルダの基本から実践的な利用方法までを、具体的なコード例とともに解説します。単純な条件指定から複雑なAND/ORや部分一致検索、IN句など、さまざまな使い方を段階的に学ぶことができます。これにより、SQL文を直接記述せずに柔軟なデータ操作が可能になる手法をご紹介します。
CodeIgniter 4 フォーム入力バリデーション入門 ― 基本操作とカスタマイズ手法
2025.04.06
CodeIgniter 4でのフォーム入力値取得とバリデーション処理を、シンプルな実装例を通して解説します。基本的なルール設定から、エラーメッセージの出力、フォームラベルの日本語化やローカライズ方法まで、実践的なテクニックをコンパクトにまとめています。
PHPによる OpenAI TTS API 実装ガイド ― GPT-4o mini TTSでテキストを音声に変換
2025.04.05
本記事では、最新の OpenAI TTS モデル「GPT-4o mini TTS」を利用し、PHPでテキストを自然な音声に変換する実装手法を詳しく解説します。curl を用いたリクエスト送信、JSON形式のパラメータ設定、ファイル出力処理まで、実際のサンプルコードを交えながら、各工程のポイントとパラメータの意味について解説。