トップ > サポート情報 > 用語解説 > ファイル関係 > UTF-8
UTF-8は、Unicode(ユニコード)の符号化(エンコード)方法の1つで、1~4バイトの可変長の文字コードです。 正式名称は、「Unicode Encoding Forms 8」あるいは「UCS Transformation Format 8」などです。
UTF-8は、ASCII文字コードとの親和性と多言語への対応という点でメリットがあり、 日本語を表現する文字コードとしては、デファクトスタンダードといえます。
UTF-8は、最も頻繁に使われる半角英数字(ASCII文字コード)を1バイトに収まるようにして、コード効率を高くしています。 また、任意の位置から、その文字、前の文字、あるいは次の文字の先頭バイトを容易に判定することができるようになっています。
Copyright(C) KnowledgeCore Inc. All rights reserved.