UTF-32

/ˌjuː tiː ɛf ˈθɜːrdi tuː/ ユーティーエフ サーティーツー

1. 各Unicode文字を常に32ビット(4バイト)で表現する固定長の文字エンコーディング方式。Unicodeの全てのコードポイントを直接表現できる。

UTF-32は、Unicodeの各文字を常に32ビット(4バイト)の固定長で表現する文字エンコーディングです。これにより、文字の位置計算が容易になり、Unicodeで定義されている全ての文字(コードポイント)を直接表現できます。しかし、他の可変長エンコーディング(UTF-8など)と比較して、特に欧米圏でよく使われる文字の保存においてはデータサイズが大きくなりがちです。これは、ほとんどの文字が実際には32ビットを必要としないため、多くの「無駄な」バイトが発生するためです。
UTF-32 is a fixed-width encoding that uses 4 bytes per character. (UTF-32は、文字ごとに4バイトを使用する固定幅エンコーディングです。)