class Encoding
クラスの継承リスト: Encoding < Object < Kernel < BasicObject
要約
文字エンコーディング(文字符号化方式)のクラスです。Rubyの多言語対応(M17N)機能において利用されます。
例えば文字列オブジェクトは、文字列のバイト表現の他にそのバイト表現がどのエンコーディングによるものであるかも併せて保持しています。この情報は String#encoding により取得できます。 Encoding オブジェクトを返すメソッドにはこの他に IO#internal_encoding, IO#external_encoding などがあります。
@see 多言語化
目次
- 特異メソッド
- aliases compatible? default_external default_external= default_internal default_internal= find list locale_charmap name_list
- インスタンスメソッド
- ascii_compatible? dummy? inspect name to_s names replicate
- 定数
- ANSI_X3_4_1968 ASCII US_ASCII ASCII_8BIT BINARY BIG5 Big5 BIG5_HKSCS BIG5_HKSCS_2008 Big5_HKSCS Big5_HKSCS_2008 BIG5_UAO Big5_UAO CP1250 WINDOWS_1250 Windows_1250 CP1251 WINDOWS_1251 Windows_1251 CP1252 WINDOWS_1252 Windows_1252 CP1253 WINDOWS_1253 Windows_1253 CP1254 WINDOWS_1254 Windows_1254 CP1255 WINDOWS_1255 Windows_1255 CP1256 WINDOWS_1256 Windows_1256 CP1257 WINDOWS_1257 Windows_1257 CP1258 WINDOWS_1258 Windows_1258 CP437 IBM437 CP50220 CP50221 CP51932 CP65000 UTF_7 CP65001 UTF_8 CP737 IBM737 CP775 IBM775 CP850 IBM850 CP852 IBM852 CP855 IBM855 CP857 IBM857 CP860 IBM860 CP861 IBM861 CP862 IBM862 CP863 IBM863 CP864 IBM864 CP865 IBM865 CP866 IBM866 CP869 IBM869 CP874 WINDOWS_874 Windows_874 CP878 KOI8_R CP932 CSWINDOWS31J CsWindows31J PCK SJIS WINDOWS_31J Windows_31J CP936 GBK CP949 CP950 CP951 EMACS_MULE Emacs_Mule EUCCN EUC_CN EucCN EUCJP EUC_JP EucJP EUCJP_MS EUC_JP_MS EucJP_ms EUCKR EUC_KR EucKR EUCTW EUC_TW EucTW GB12345 GB18030 GB1988 ISO2022_JP ISO_2022_JP ISO2022_JP2 ISO_2022_JP_2 ISO8859_1 ISO_8859_1 ISO8859_10 ISO_8859_10 ISO8859_11 ISO_8859_11 ISO8859_13 ISO_8859_13 ISO8859_14 ISO_8859_14 ISO8859_15 ISO_8859_15 ISO8859_16 ISO_8859_16 ISO8859_2 ISO_8859_2 ISO8859_3 ISO_8859_3 ISO8859_4 ISO_8859_4 ISO8859_5 ISO_8859_5 ISO8859_6 ISO_8859_6 ISO8859_7 ISO_8859_7 ISO8859_8 ISO_8859_8 ISO8859_9 ISO_8859_9 ISO_2022_JP_KDDI KOI8_U MACCENTEURO MacCentEuro MACCROATIAN MacCroatian MACCYRILLIC MacCyrillic MACGREEK MacGreek MACICELAND MacIceland MACJAPAN MACJAPANESE MacJapan MacJapanese MACROMAN MacRoman MACROMANIA MacRomania MACTHAI MacThai MACTURKISH MacTurkish MACUKRAINE MacUkraine SHIFT_JIS Shift_JIS SJIS_DOCOMO SJIS_DoCoMo SJIS_KDDI SJIS_SOFTBANK SJIS_SoftBank STATELESS_ISO_2022_JP Stateless_ISO_2022_JP STATELESS_ISO_2022_JP_KDDI Stateless_ISO_2022_JP_KDDI TIS_620 UCS_2BE UTF_16BE UCS_4BE UTF_32BE UCS_4LE UTF_32LE UTF8_DOCOMO UTF8_DoCoMo UTF8_KDDI UTF8_MAC UTF_8_HFS UTF_8_MAC UTF8_SOFTBANK UTF8_SoftBank UTF_16 UTF_16LE UTF_32
特異メソッド
aliases -> Hash-
エンコーディングの別名に対して元の名前を対応づけるハッシュを返します。
例:
p Encoding.aliases #=> {"BINARY"=>"ASCII-8BIT", "ASCII"=>"US-ASCII", "ANSI_X3.4-1986"=>"US-ASCII", "SJIS"=>"Shift_JIS", "eucJP"=>"EUC-JP", "CP932"=>"Windows-31J"} compatible?(obj1, obj2) -> Encoding | nil-
2つのオブジェクトのエンコーディングに関する互換性をチェックします。 互換性がある場合はそのエンコーディングを、 ない場合は nil を返します。
引数が両方とも文字列である場合、互換性があるならば その文字列を結合できます。この場合返り値のエンコーディングは 結合した文字列が取るであろう Encoding オブジェクトを返します。
Encoding.compatible?("\xa1".force_encoding("iso-8859-1"), "b") #=> #<Encoding:ISO-8859-1> Encoding.compatible?( "\xa1".force_encoding("iso-8859-1"), "\xa1\xa1".force_encoding("euc-jp")) #=> nil
引数が文字列でない場合でも、両方のオブジェクトが encoding を持つ場合には 互換性を判定することができます。
Encoding.compatible?(Encoding::UTF_8, Encoding::CP932) # => nil Encoding.compatible?(Encoding::UTF_8, Encoding::US_ASCII) # => #<Encoding:UTF-8>
- [PARAM] obj1:
- チェック対象のオブジェクト
- [PARAM] obj2:
- チェック対象のオブジェクト
default_external -> Encoding-
規定の外部エンコーディングを返します。
入出力において、外部エンコーディングが指定されていない場合の規定値として利用されます。Rubyはロケールまたは -E オプションに従って default_external を決定します。ロケールの確認・設定方法については各システムのマニュアルを参照してください。
default_external は必ず設定されます。Encoding.locale_charmap が nil を返す場合には US-ASCII が、 ロケールにRubyが扱えないエンコーディングが指定されている場合には ASCII-8BIT が、default_external に設定されます。
[SEE_ALSO] locale(1), Encoding.locale_charmap
default_external=(encoding)-
規定の外部エンコーディングを設定します。
default_internal -> Encoding | nil-
規定の内部エンコーディングを返します。
default_internal=(encoding)-
規定の内部エンコーディングを設定します。
find(name) -> Encoding-
指定された name という名前を持つ Encoding オブジェクトを返します。
- [PARAM] name:
- エンコーディング名を表す String を指定します。
- [RETURN]
- 発見された Encoding オブジェクトを返します。
- [EXCEPTION] ArgumentError:
- 指定した名前のエンコーディングが発見できないと発生します。
特殊なエンコーディング名として、ロケールエンコーディングを表す locale、default_external を表す external、default_internal を表す internal、ファイルシステムエンコーディングを表す filesystem があります。
例:
p Encoding.find("utf-8") #=> #<Encoding:UTF-8>
list -> [Encoding]-
現在ロードされているエンコーディングのリストを返します。
例:
Encoding.list => [#<Encoding:ASCII-8BIT>, #<Encoding:EUC-JP>, #<Encoding:Shift_JIS>, #<Encoding:UTF-8>, #<Encoding:ISO-2022-JP (dummy)>] Encoding.find("US-ASCII") => #<Encoding:US-ASCII> Encoding.list => [#<Encoding:ASCII-8BIT>, #<Encoding:EUC-JP>, #<Encoding:Shift_JIS>, #<Encoding:UTF-8>, #<Encoding:US-ASCII>, #<Encoding:ISO-2022-JP (dummy)>] locale_charmap -> String | nil-
ロケールエンコーディングを決定するために用いる、locale charmap 名を返します。nl_langinfo 等がない環境では nil を、miniruby では ASCII_8BIT を返します。
Debian GNU/Linux LANG=C Encoding.locale_charmap => "ANSI_X3.4-1968" LANG=ja_JP.EUC-JP Encoding.locale_charmap => "EUC-JP" SunOS 5 LANG=C Encoding.locale_charmap => "646" LANG=ja Encoding.locale_charmap => "eucJP"[SEE_ALSO] charmap(5)
name_list -> [String]-
利用可能なエンコーディングの名前を文字列の配列で返します。
例:
p Encoding.name_list #=> ["US-ASCII", "ASCII-8BIT", "UTF-8", "ISO-8859-1", "Shift_JIS", "EUC-JP", "Windows-31J", "BINARY", "CP932", "eucJP", ...]
インスタンスメソッド
ascii_compatible? -> bool-
自身が ASCII 互換のエンコーディングである場合真返します。 そうでない場合は偽を返します。
例:
Encoding::UTF_8.ascii_compatible? #=> true Encoding::UTF_16BE.ascii_compatible? #=> false
dummy? -> bool-
自身がダミーエンコーディングである場合に true を返します。 そうでない場合に false を返します。
ダミーエンコーディングとは Ruby が名前を知っているものの実質的には対応していないエンコーディングのことです。例えば、ダミーエンコーディングで符号化された文字列の場合、 String#length はマルチバイト文字を考慮せずにバイト列の長さを返します。
ダミーエンコーディングも IO の外部エンコーディングに指定できます。また Ruby はサポートしていないが拡張ライブラリがサポートしているエンコーディングを扱う場合にも 用います。
例:
Encoding::ISO_2022_JP.dummy? #=> true Encoding::UTF_8.dummy? #=> false
inspect -> String-
プログラマにわかりやすい表現の文字列を返します。
例:
Encoding::UTF_8.inspect #=> "#<Encoding:UTF-8>" Encoding::ISO_2022_JP.inspect #=> "#<Encoding:ISO-2022-JP (dummy)>"
name -> Stringto_s -> String-
エンコーディングの名前を返します。
Encoding::UTF_8.name => "UTF-8"
names -> String-
エンコーディングの名前とエイリアス名の配列を返します。
Encoding::UTF_8.names => ["UTF-8", "CP65001"]
replicate(name) -> Encoding-
レシーバのエンコーディングを複製(replicate)します。 複製されたエンコーディングは元のエンコーディングと同じバイト構造を持たなければなりません。 name という名前のエンコーディングが既に存在する場合は ArgumentError を発生します。
定数
US_ASCII -> EncodingASCII -> EncodingANSI_X3_4_1968 -> Encoding-
US-ASCII、いわゆる ASCII のことで、ISO 646 IRV と一致します。
7bit の範囲のみを含み、8bit 目の立っている文字 (たとえば \x80 など) が含まれる場合は正しいエンコーディングであるとみなしません。
ASCII_8BIT -> EncodingBINARY -> Encoding-
ASCII-8BIT、ASCII互換オクテット列用のエンコーディングです。
もっぱら文字エンコーディングを持たないデータ、文字を符号化したのではない単なるバイトの列を表現するために用いますが、このエンコーディングは ASCII 互換であることがポイントです。
Big5 -> EncodingBIG5 -> Encoding-
Big5 エンコーディングです。
台湾で使われている繁体字中国語のエンコーディングです。
[SEE_ALSO] http://en.wikipedia.org/wiki/Big5
Big5_HKSCS -> EncodingBIG5_HKSCS -> EncodingBIG5_HKSCS_2008 -> EncodingBig5_HKSCS_2008 -> Encoding-
Big5-HKSCS エンコーディングです。
香港で使われている Big5 の亜種です。
[SEE_ALSO] http://www.iana.org/assignments/charset-reg/Big5-HKSCS, http://www.ogcio.gov.hk/ccli/eng/hkscs/mapping_table_2008.html
BIG5_UAO -> EncodingBig5_UAO -> Encoding-
Big5_UAO エンコーディングです。
Big5 の亜種(非公式的拡張)です。
Unicodeとの対応表が http://moztw.org/docs/big5/table/big5_2003-b2u.txt にあります。
Windows_1250 -> EncodingCP1250 -> EncodingWINDOWS_1250 -> Encoding-
Windows-1250 エンコーディング。
ISO8859-2 の亜種です。
[SEE_ALSO] http://www.microsoft.com/globaldev/reference/sbcs/1250.mspx, http://en.wikipedia.org/wiki/Windows-1250
Windows_1251 -> EncodingCP1251 -> EncodingWINDOWS_1251 -> Encoding-
Windows-1251 エンコーディング。
キリル文字を用いる言語を取り扱う8bit single-byteエンコーディングです。
[SEE_ALSO] http://www.iana.org/assignments/character-sets, http://www.microsoft.com/globaldev/reference/sbcs/1251.mspx, http://en.wikipedia.org/wiki/Windows-1251
Windows_1252 -> EncodingCP1252 -> EncodingWINDOWS_1252 -> Encoding-
Windows-1252 エンコーディングです。
ISO8859-1 の亜種です。
[SEE_ALSO] Encoding::ISO_8859_1 http://www.iana.org/assignments/character-sets, http://www.microsoft.com/globaldev/reference/sbcs/1252.mspx, http://en.wikipedia.org/wiki/Windows-1252
Windows_1253 -> EncodingCP1253 -> EncodingWINDOWS_1253 -> Encoding-
Windows-1253 エンコーディング。
ISO8859-7 の亜種です。
[SEE_ALSO] Encoding::ISO_8859_7, http://www.iana.org/assignments/character-sets, http://www.microsoft.com/globaldev/reference/sbcs/1253.mspx, http://en.wikipedia.org/wiki/Windows-1253
Windows_1254 -> EncodingCP1254 -> EncodingWINDOWS_1254 -> Encoding-
Windows-1254 エンコーディング。
ISO8859-9 の亜種です。
[SEE_ALSO] Encoding::ISO_8859_9, http://www.iana.org/assignments/character-sets, http://www.microsoft.com/globaldev/reference/sbcs/1254.mspx, http://en.wikipedia.org/wiki/Windows-1254
Windows_1255 -> EncodingCP1255 -> EncodingWINDOWS_1255 -> Encoding-
Windows-1255 エンコーディング。
ISO8859-8 の亜種です。
[SEE_ALSO] Encoding::ISO_8859_8, http://www.iana.org/assignments/character-sets, http://www.microsoft.com/globaldev/reference/sbcs/1255.mspx, http://en.wikipedia.org/wiki/Windows-1255,
Windows_1256 -> EncodingCP1256 -> EncodingWINDOWS_1256 -> Encoding-
Windows-1256 エンコーディング。
Windowsで用いられる、アラビア文字を扱う 8bit single-byte エンコーディングです。
[SEE_ALSO] Encoding::ISO_8859_6, http://www.iana.org/assignments/character-sets, http://www.microsoft.com/globaldev/reference/sbcs/1256.mspx, http://en.wikipedia.org/wiki/Windows-1256
Windows_1257 -> EncodingCP1257 -> EncodingWINDOWS_1257 -> Encoding-
Windows-1257 エンコーディング。
ISO8859-13 の亜種です。
[SEE_ALSO] Encoding::ISO8859_13, http://www.iana.org/assignments/character-sets, http://www.microsoft.com/globaldev/reference/sbcs/1257.mspx, http://en.wikipedia.org/wiki/Windows-1257,
Windows_1258 -> EncodingCP1258 -> EncodingWINDOWS_1258 -> Encoding-
WINDOWS-1258 エンコーディング。
ベトナム語を扱う 8bit single-byteエンコーディングです。
[SEE_ALSO] http://en.wikipedia.org/wiki/Windows-1258
IBM437 -> EncodingCP437 -> Encoding-
CP437 エンコーディング。
[SEE_ALSO] http://en.wikipedia.org/wiki/Code_page_437, Encoding::CP869
CP50220 -> Encoding-
CP50220 エンコーディング、 Windows で用いられる ISO-2022-JP 亜種です。
CP50221 とほぼ同様のエンコーディングですが、 他のエンコーディングへの変換テーブルが少し異なります。
[SEE_ALSO] http://legacy-encoding.sourceforge.jp/wiki/index.php?cp50220
CP50221 -> Encoding-
Windows で用いられる、ISO-2022-JP 亜種です。
ISO-2022-JP に加え、ESC ( I でいわゆる半角カナを許し、Windows の機種依存文字を扱うことができます。
[SEE_ALSO] http://legacy-encoding.sourceforge.jp/wiki/index.php?cp50221
CP51932 -> Encoding-
Windows で用いられる、日本語 EUC 亜種です。
G0 が US-ASCII、G1 が JIS X 0201 片仮名図形文字集合、G2 が JIS X 0208 + Windows の機種依存文字となっており、G3 は未割り当てになっています。
[SEE_ALSO] http://legacy-encoding.sourceforge.jp/wiki/index.php?cp51932
UTF_7 -> EncodingCP65000 -> Encoding-
UTF-7 です。
7ビットの範囲内で表現される、Unicode のエンコーディングの一種です。 ダミーエンコーディングです。
UTF_8 -> EncodingCP65001 -> Encoding-
UTF-8、Unicode や ISO 10646 を ASCII 互換な形で符号化するための方式です。
BOM を含みません。
[SEE_ALSO] http://tools.ietf.org/html/rfc3629
IBM737 -> EncodingCP737 -> Encoding-
CP437 エンコーディング。
ギリシャ語を取り扱う 8bit single-byteエンコーディングです。
[SEE_ALSO] http://en.wikipedia.org/wiki/Code_page_737
IBM775 -> EncodingCP775 -> Encoding-
CP775 エンコーディング。
バルト語派の言語を扱うための 8bit single-byteエンコーディングです。
[SEE_ALSO] http://en.wikipedia.org/wiki/Code_page_775
CP850 -> EncodingIBM850 -> Encoding-
CP850 エンコーディング。
[SEE_ALSO] http://en.wikipedia.org/wiki/Code_page_850
IBM852 -> EncodingCP852 -> Encoding-
CP852 エンコーディング。
ラテンアルファベットを用いる中欧の言語のための 8bit single-byte エンコーディングです。
[SEE_ALSO] http://en.wikipedia.org/wiki/Code_page_852
IBM855 -> EncodingCP855 -> Encoding-
CP855 エンコーディング。
キリル文字を用いる言語のための 8bit single-byte エンコーディングです。
[SEE_ALSO] http://en.wikipedia.org/wiki/Code_page_855
IBM857 -> EncodingCP857 -> Encoding-
CP857 エンコーディング。
トルコ語に用いられる、 8bit single-byte エンコーディングです。
[SEE_ALSO] http://en.wikipedia.org/wiki/Code_page_857
IBM860 -> EncodingCP860 -> Encoding-
CP860 エンコーディング。
ポルトガル語に用いられる、 8bit single-byte エンコーディングです。
[SEE_ALSO] http://en.wikipedia.org/wiki/Code_page_860
IBM861 -> EncodingCP861 -> Encoding-
CP861 エンコーディング。
アイスランド語に用いられる、 8bit single-byte エンコーディングです。
[SEE_ALSO] http://en.wikipedia.org/wiki/Code_page_861
IBM862 -> EncodingCP862 -> Encoding-
CP862 エンコーディング。
ヘブライ語に用いられる、 8bit single-byte エンコーディングです。
[SEE_ALSO] http://en.wikipedia.org/wiki/Code_page_861
IBM863 -> EncodingCP863 -> Encoding-
CP863 エンコーディング。
フランス語に用いられる、 8bit single-byte エンコーディングです。
[SEE_ALSO] http://en.wikipedia.org/wiki/Code_page_863
IBM864 -> EncodingCP864 -> Encoding-
CP864 エンコーディング。
アラビア語に用いられる、 8bit single-byte エンコーディングです。
[SEE_ALSO] http://en.wikipedia.org/wiki/Code_page_864
IBM865 -> EncodingCP865 -> Encoding-
CP865 エンコーディング。
北欧の諸言語に用いられる、 8bit single-byte エンコーディングです。
[SEE_ALSO] http://en.wikipedia.org/wiki/Code_page_865
IBM866 -> EncodingCP866 -> Encoding-
CP866 エンコーディング。
キリル文字を使う諸言語に用いられる、 8bit single-byte エンコーディングです。
[SEE_ALSO] http://en.wikipedia.org/wiki/Code_page_866
IBM869 -> EncodingCP869 -> Encoding-
CP869 エンコーディング。
ギリシャ語を取り扱う 8bit single-byteエンコーディングです。
[SEE_ALSO] http://en.wikipedia.org/wiki/Code_page_869, Encoding::CP737
Windows_874 -> EncodingCP874 -> EncodingWINDOWS_874 -> Encoding-
Windows-874 エンコーディング。
タイ語を扱うエンコーディングで、ISO8859-11の亜種です。
[SEE_ALSO] Encoding::TIS_620, Encoding::ISO_8859_11, http://www.microsoft.com/globaldev/reference/sbcs/874.mspx
KOI8_R -> EncodingCP878 -> Encoding-
KOI8-R エンコーディング。
ロシア語のキリル文字で使われる8bit single-byteエンコーディングです。
[SEE_ALSO] http://en.wikipedia.org/wiki/KOI8-R
Windows_31J -> EncodingCP932 -> EncodingCSWINDOWS31J -> EncodingCsWindows31J -> EncodingWINDOWS_31J -> EncodingPCK -> EncodingSJIS -> Encoding-
Windows-31J、Windows で用いられる、シフトJIS亜種で、CP932とも言います。
7bit 部分が論理的には US-ASCIIであり、また Windows の機種依存文字を扱うことができます。
[SEE_ALSO] http://www2d.biglobe.ne.jp/~msyk/charcode/cp932/index.html, http://legacy-encoding.sourceforge.jp/wiki/index.php?cp932
GBK -> EncodingCP936 -> Encoding-
GBK エンコーディング
中国で用いられる簡体字中国語のエンコーディングです。
[SEE_ALSO] http://www.iana.org/assignments/character-sets, http://www.iana.org/assignments/charset-reg/GBK, http://www.microsoft.com/globaldev/reference/dbcs/936.mspx
CP949 -> Encoding-
CP949 エンコーディング。
EUC-KR に近い、韓国語を取り扱う multi-byte エンコーディングです。
[SEE_ALSO] Encoding::EUC_KR, http://www.microsoft.com/globaldev/reference/dbcs/949.mspx, http://en.wikipedia.org/wiki/EUC-KR#EUC-KR,
CP950 -> Encoding-
CP950 エンコーディングです。
Windows で使われる Big5 の亜種です。
[SEE_ALSO] http://msdn.microsoft.com/en-us/goglobal/cc305155.aspx
CP951 -> Encoding-
CP951 エンコーディングです。
Windows で使われる Big5-HKSCS の亜種です。
[SEE_ALSO] http://www.microsoft.com/hk/hkscs/default.aspx, http://www.microsoft.com/downloads/en/details.aspx?FamilyID=0e6f5ac8-7baa-4571-b8e8-78b3b776afd7&DisplayLang=en, http://blogs.msdn.com/b/shawnste/archive/2007/03/12/cp-951-hkscs.aspx
EMACS_MULE -> EncodingEmacs_Mule -> Encoding-
Emacs-Mule エンコーディングです。
Emacsの多言語化(Mule)で使われているステートレスのエンコーディングです。
EUC_CN -> EncodingEUCCN -> EncodingEucCN -> Encoding-
ENC-CN エンコーディングです。
中国で用いられる簡体字中国語 EUCのエンコーディングです。 GB2312 と呼ばれることも多いです。
EUC_JP -> EncodingEucJP -> EncodingEUCJP -> Encoding-
IANA Character Sets にある EUC-JP のことです。
日本語 EUC 亜種で、G0 が US-ASCII、G1 が JIS X 0201 片仮名図形文字集合、G2 が JIS X 0208、G3 が JIS X 0212 となっています。 EUC-JP を指定する場合は、それが実際には CP51932 のことである可能性を考えなければなりません。
EUCJP_MS -> EncodingEucJP_ms -> EncodingEUC_JP_MS -> Encoding-
eucJP-ms、Unix 系で用いられる、日本語 EUC 亜種です。
EUC-JPに加え、Windowsの機種依存文字とユーザ定義文字を扱うことができます。
[SEE_ALSO] http://www2d.biglobe.ne.jp/~msyk/charcode/cp932/eucJP-ms.html, http://legacy-encoding.sourceforge.jp/wiki/index.php?eucJP-ms, http://blog.livedoor.jp/numa2666/archives/50980727.html
EUC_KR -> EncodingEUCKR -> EncodingEucKR -> Encoding-
EUC-KR エンコーディングです。
韓国語 EUC のエンコーディングです。
EUC_TW -> EncodingEUCTW -> EncodingEucTW -> Encoding-
EUC-TW エンコーディングです。
台湾で用いられる繁体字中国語 EUCのエンコーディングです。
GB12345 -> Encoding-
GB 12345 エンコーディング。
GB 2312 から派生したもので、繁体字中国語を取り扱うエンコーディングです。
GB18030 -> Encoding-
GBK エンコーディング
中国で用いられる中国語のエンコーディングです。
[SEE_ALSO] http://www.iana.org/assignments/charset-reg/GB18030
GB1988 -> Encoding-
GB1988 エンコーディング。
ISO/IEC 646 の中国版です。
ISO_2022_JP -> EncodingISO2022_JP -> Encoding-
ISO 2022-JP エンコーディングです。
[SEE_ALSO] http://tools.ietf.org/html/rfc1468
ISO_2022_JP_2 -> EncodingISO2022_JP2 -> Encoding-
ISO-2022-JP-2 エンコーディングです。
ISO-2022-JP の拡張版です。
[SEE_ALSO] Encoding::ISO_2022_JP
ISO_8859_1 -> EncodingISO8859_1 -> Encoding-
ISO-8859-1 エンコーディングです。
多くの西欧言語を含むさまざまなラテン文字言語を表現するための 8bitエンコーディングです。
Latin-1 とも呼ばれます。
ISO_8859_10 -> EncodingISO8859_10 -> Encoding-
ISO 8859-10 エンコーディング。
北欧の言語を扱う 8bit single-byte エンコーディングです。
ISO_8859_11 -> EncodingISO8859_11 -> Encoding-
ISO8859-11 エンコーディング。
タイ語を扱う 8bit single-byte エンコーディングです。
[SEE_ALSO] Encoding::TIS_620
ISO_8859_13 -> EncodingISO8859_13 -> Encoding-
ISO8859-13 エンコーディング。
バルト語派の言語を扱う8bit single-byteエンコーディングです。
[SEE_ALSO] Encoding::Windows_1257
ISO_8859_14 -> EncodingISO8859_14 -> Encoding-
ISO8859-14 エンコーディング。
ケルト語派の言語を扱う8bit single-byteエンコーディングです。
[SEE_ALSO] Encoding::Windows_1257
ISO_8859_15 -> EncodingISO8859_15 -> Encoding-
ISO 8859-15 エンコーディング。
ISO 8859-1 の改訂版です。
ISO_8859_16 -> EncodingISO8859_16 -> Encoding-
ISO 8859-16 エンコーディング。
東欧を中心とした地域の諸語を扱う 8bit single-byte エンコーディングです。
ISO_8859_2 -> EncodingISO8859_2 -> Encoding-
ISO8859-2 エンコーディング。
中東欧の言語を扱う 8bit single-byte エンコーディングです。
ISO_8859_3 -> EncodingISO8859_3 -> Encoding-
ISO8859-3 エンコーディング。
トルコ語、マルタ語、エスペラントを扱う 8bit single-byte エンコーディングです。
ISO_8859_4 -> EncodingISO8859_4 -> Encoding-
ISO 8859-4 エンコーディング。
北欧の言語を扱う 8bit single-byte エンコーディングです。
ISO_8859_5 -> EncodingISO8859_5 -> Encoding-
ISO 8859-5 エンコーディング。
キリル文字を用いる言語を扱う 8bit single-byte エンコーディングです。
ISO_8859_6 -> EncodingISO8859_6 -> Encoding-
ISO8859-6 エンコーディング。
アラビア文字を扱う 8bit single-byte エンコーディングです。
[SEE_ALSO] Encoding::Windows_1256
ISO_8859_7 -> EncodingISO8859_7 -> Encoding-
ISO8859-7 エンコーディング。
ギリシャ語を扱う 8bit single-byte エンコーディングです。
[SEE_ALSO] Encoding::Windows_1253
ISO_8859_8 -> EncodingISO8859_8 -> Encoding-
ISO8859-8 エンコーディング。
ヘブライ語を扱う 8bit single-byte エンコーディングです。
[SEE_ALSO] Encoding::Windows_1255
ISO_8859_9 -> EncodingISO8859_9 -> Encoding-
ISO8859-9 エンコーディング。
ISO8859-1 に近い、 トルコ語を扱うことができる8bit single-byteエンコーディングです。
[SEE_ALSO] Encoding::Windows_1254
ISO_2022_JP_KDDI -> Encoding-
ISO-2022-JP-KDDI エンコーディングです。
ISO-2022-JP の亜種です。 KDDI の携帯電話で使われる絵文字が含まれています。
[SEE_ALSO] http://www.au.kddi.com/ezfactory/tec/spec/img/typeD.pdf
KOI8_U -> Encoding-
KOI8-U エンコーディング。
ウクライナ語のキリル文字で使われる8bit single-byteエンコーディングです。
[SEE_ALSO] http://en.wikipedia.org/wiki/KOI8-U
MacCentEuro -> EncodingMACCENTEURO -> Encoding-
MacCentEuro エンコーディング。
Mac OSで使われる 8bit single-byteエンコーディングで、 中欧および南東欧の言語を取り扱うものです。
[SEE_ALSO] http://en.wikipedia.org/wiki/Macintosh_Central_European_encoding
MacCroatian -> EncodingMACCROATIAN -> Encoding-
MacCroatian エンコーディング。
Mac OS で使われる 8bit single-byteエンコーディングで、 クロアチア語、スベロニア語を取り扱うものです。
[SEE_ALSO] http://www.unicode.org/Public/MAPPINGS/VENDORS/APPLE/CROATIAN.TXT
MacCyrillic -> EncodingMACCYRILLIC -> Encoding-
MacCyrillic エンコーディング。
Mac OS で使われる 8bit single-byte エンコーディングで、 キリル文字を取り扱うものです。
[SEE_ALSO] http://en.wikipedia.org/wiki/Macintosh_Cyrillic_encoding
MacGreek -> EncodingMACGREEK -> Encoding-
MacGreek エンコーディング。
Mac OSで使われる 8bit single-byte エンコーディングで、 ギリシャ語のために使われます。
[SEE_ALSO] http://www.unicode.org/Public/MAPPINGS/VENDORS/APPLE/GREEK.TXT
MacIceland -> EncodingMACICELAND -> Encoding-
MacIceland エンコーディング。
Mac OSで使われる 8bit single-byte エンコーディングで、 アイスランド語のために使われます
[SEE_ALSO] http://en.wikipedia.org/wiki/Mac_Icelandic_encoding
MacJapanese -> EncodingMACJAPAN -> EncodingMACJAPANESE -> EncodingMacJapan -> Encoding-
MacJapanese エンコーディング。
Mac OS の 9.x までで用いられていた Shift_JIS 亜種です。
[SEE_ALSO] http://unicode.org/Public/MAPPINGS/VENDORS/APPLE/JAPANESE.TXT, http://ja.wikipedia.org/wiki/MacJapanese
MacRoman -> EncodingMACROMAN -> Encoding-
MacRoman エンコーディング。
Mac OSで使われる 8bit single-byte エンコーディングで、 西欧を中心としたラテン文字を用いる諸語を取り扱うためのものです。
IANA character-sets で "macintosh" で表現されるものです。
[SEE_ALSO] http://en.wikipedia.org/wiki/Mac_OS_Roman
MacRomania -> EncodingMACROMANIA -> Encoding-
MacRoman エンコーディング。
Mac OSで使われる 8bit single-byte エンコーディングで、 ルーマニア語のために使われます。
[SEE_ALSO] http://www.unicode.org/Public/MAPPINGS/VENDORS/APPLE/ROMANIAN.TXT
MacThai -> EncodingMACTHAI -> Encoding-
MacThai エンコーディング。
タイ語を扱うエンコーディングで、ISO8859-11の亜種です。
[SEE_ALSO] Encoding::TIS_620, Encoding::ISO_8859_11
MacTurkish -> EncodingMACTURKISH -> Encoding-
MacTurkish エンコーディング。
Mac OSで使われる 8bit single-byte エンコーディングで、 トルコ語のために使われます。
[SEE_ALSO] http://www.unicode.org/Public/MAPPINGS/VENDORS/APPLE/TURKISH.TXT
MacUkraine -> EncodingMACUKRAINE -> Encoding-
MacUkraine エンコーディング。
Mac OS で使われる、ウクライナ語キリル文字を取り扱うエンコーディング。 MacCyrillic の亜種です。
[SEE_ALSO] http://en.wikipedia.org/wiki/Macintosh_Ukrainian_encoding
Shift_JIS -> EncodingSHIFT_JIS -> Encoding-
IANA Character Sets にある Shift_JIS のことです。
基本的にはJIS X 0208:1997の付属書1にある「シフト符号化表現」のことですが、 Ruby M17N では 7bit 部分が US-ASCII になっています。
SJIS_DOCOMO -> EncodingSJIS_DoCoMo -> Encoding-
SJIS-DoCoMo エンコーディングです。
Shift_JIS, CP932 の亜種です。 DoCoMo の携帯電話で使われる絵文字が含まれています。
[SEE_ALSO] http://www.nttdocomo.co.jp/english/service/imode/make/content/pictograph/basic/index.html, http://www.nttdocomo.co.jp/english/service/imode/make/content/pictograph/extention/index.html,
SJIS_KDDI -> Encoding-
SJIS-KDDI エンコーディングです。
Shift_JIS, CP932 の亜種です。 KDDI の携帯電話で使われる絵文字が含まれています。
[SEE_ALSO] http://www.au.kddi.com/ezfactory/tec/spec/img/typeD.pdf
SJIS_SOFTBANK -> EncodingSJIS_SoftBank -> Encoding-
SJIS-SoftBank エンコーディングです。
Shift_JIS, CP932 の亜種です。 SoftBank の携帯電話で使われる絵文字が含まれています。
[SEE_ALSO] http://creation.mb.softbank.jp/web/web_pic_about.html, http://www2.developers.softbankmobile.co.jp/dp/tool_dl/download.php?docid=120&companyid=
STATELESS_ISO_2022_JP -> EncodingStateless_ISO_2022_JP -> Encoding-
stateless-ISO-2022-JP エンコーディングです。
ISO-2022-JPをステートレスに扱うための方式です。 Emacs-Mule エンコーディングを元にしています。
STATELESS_ISO_2022_JP_KDDI -> EncodingStateless_ISO_2022_JP_KDDI -> Encoding-
stateless-ISO-2022-JP-KDDI エンコーディングです。
stateless-ISO-2022-JP の亜種です。 KDDI の携帯電話で使われる絵文字が含まれています。
[SEE_ALSO] http://www.au.kddi.com/ezfactory/tec/spec/img/typeD.pdf
TIS_620 -> Encoding-
TIS-620 エンコーディング。
タイ語を扱うためのエンコーディングで、 ISO8859-11 とほぼ 同一のエンコーディングです。
[SEE_ALSO] http://en.wikipedia.org/wiki/Thai_Industrial_Standard_620-2533
UTF_16BE -> EncodingUCS_2BE -> Encoding-
UTF-16BE (ビッグエンディアン) です。
BOM を含みません。
UTF_32BE -> EncodingUCS_4BE -> Encoding-
UTF-32BE (ビッグエンディアン) です。
BOM を含みません。
UTF_32LE -> EncodingUCS_4LE -> Encoding-
UTF-32LE (リトルエンディアン) です。
BOM を含みません。
UTF8_DOCOMO -> EncodingUTF8_DoCoMo -> Encoding-
UTF8-DoCoMo エンコーディングです。
UTF-8 の亜種です。 DoCoMo の携帯電話で使われる絵文字が含まれています。
[SEE_ALSO] http://www.nttdocomo.co.jp/english/service/imode/make/content/pictograph/basic/index.html, http://www.nttdocomo.co.jp/english/service/imode/make/content/pictograph/extention/index.html,
UTF8_KDDI -> Encoding-
UTF8-KDDI エンコーディングです。
UTF8 の亜種です。 KDDI の携帯電話で使われる絵文字が含まれています。
[SEE_ALSO] http://www.au.kddi.com/ezfactory/tec/spec/img/typeD.pdf
UTF8_MAC -> EncodingUTF_8_MAC -> EncodingUTF_8_HFS -> Encoding-
UTF8-MAC、アップルによって修正された Normalization Form D(分解済み)という形式のUTF-8です。
[SEE_ALSO] http://developer.apple.com/jp/technotes/tn1150.html, http://developer.apple.com/jp/technotes/tn2078.html
UTF8_SOFTBANK -> EncodingUTF8_SoftBank -> Encoding-
UTF8-SoftBank エンコーディングです。
UTF-8 の亜種です。 SoftBank の携帯電話で使われる絵文字が含まれています。
[SEE_ALSO] http://creation.mb.softbank.jp/web/web_pic_about.html, http://www2.developers.softbankmobile.co.jp/dp/tool_dl/download.php?docid=120&companyid=
UTF_16 -> Encoding-
UTF-16 (BOMを含む) です。
ダミーエンコーディングです。
UTF_16LE -> Encoding-
UTF-16LE (リトルエンディアン) です。
BOM を含みません。
UTF_32 -> Encoding-
UTF-32 (BOMを含む) です。
ダミーエンコーディングです。