トップ > サポート情報 > 用語解説 > ファイル関係 > Unicode(ユニコード)
Unicode(ユニコード)は、世界中のさまざまな言語で使われる文字を、 統一された固定長のコード(数値データ)で扱えるようにした文字コードセットです。 文字に対して21bitの文字コードを割り当て、全ての文字を同じように扱うことができます。
Unicode(ユニコード)で定義されている文字には、全て番号(コードポイント。単に文字コードとも)が付けられています。 また文字コードは「U+nnnn」という方法で表記します。nは4~6桁の16進数で表現した文字コード番号です。 現在のUnicodeでは「U+0000~U+10FFFF」までの範囲を使用することにしています。
Unicode文字を符号化してストレージに格納したり、通信路を使って送受信したりするには、何らかの方法で、 バイトストリーム(1byteごとのデータの並び)に変換する必要があります。 Unicodeではこのための方法も規定していて、UTF-8やUTF-16、UTF-32などがあります。
Copyright(C) KnowledgeCore Inc. All rights reserved.