Chcp
Displays the number of the active console code page, or changes the console's active console code page. Used without parameters, chcp displays the number of the active console code page.
Syntax
chcp [nnn]
Parameters
nnn : Specifies the code page. The following table lists each code page supported and its country/region or language:
Code page        Country/region or language
437        United States
850        Multilingual (Latin I)
852        Slavic (Latin II)
855        Cyrillic (Russian)
857        Turkish
860        Portuguese
861        Icelandic
863        Canadian-French
865        Nordic
866        Russian
869        Modern Greek
什么是code page, 怎么修改windows cmd中的codepage


如果你的cmd无法正常显示中文, 或者其他字符, 通过chcp 来修改, 参数是nnn代表3个数字. 简体中文的codepage是: 936 西文是:1252


Code page 的历史:



1. Codepage的定义和历史
字符内码(charcter code)指的是用来代表字符的内码.读者在输入和存储文档时都要使用内码,内码分为

单字节内码 -- Single-Byte character sets (SBCS),可以支持256个字符编码.
双字节内码 -- Double-Byte character sets)(DBCS),可以支持65000个字符编码.主要用来对大字符集的东方文字进行编码.
codepage 指的是一个经过挑选的以特定顺序排列的字符内码列表,对于早期的单字节内码的语种,codepage中的内码顺序使得系统可以按照此列表来根据键盘的输入值给出一个对应的内码.对于双字节内码,则给出的是MultiByte到Unicode的对应表,这样就可以把以Unicode形式存放的字符转化为相应的字符内码,或者反之,在Linux核心中对应的函数就是utf8_mbtowc和utf8_wctomb.
在1980年前,仍然没有任何国际标准如ISO-8859或Unicode来定义如何扩展US-ASCII编码以便非英语国家的用户使用.很多IT厂商发明了他们自己的编码,并且使用了难以记忆的数目来标识:



例如936代表简体中文. 950代表繁体中文.



1.1 CJK Codepage
同 Extended Unix Coding ( EUC )编码大不一样的是,下面所有的远东 codepage 都利用了C1控制码 { =80..=9F } 做为首字节, 使用ASCII值 { =40..=7E { 做为第二字节,这样才能包含多达数万个双字节字符,这表明在这种编码之中小于3F的ASCII值不一定代表ASCII字符.

CP932

Shift-JIS包含日本语 charset JIS X 0201 (每个字符一个字节) 和 JIS X 0208 (每个字符两个字节),所以 JIS X 0201平假名包含一个字节半宽的字符,其剩馀的60个字节被用做7076个汉字以及648个其他全宽字符的首字节.同EUC-JP编码区别的是, Shift-JIS没有包含JIS X 202中定义的5802个汉字.

CP936

GBK 扩展了 EUC-CN 编码( GB 2312-80编码,包含 6763 个汉字)到Unicode (GB13000.1-93)中定义的20902个汉字,中国大陆使用的是简体中文zh_CN.

CP949

UnifiedHangul (UHC) 是韩文 EUC-KR 编码(KS C 5601-1992 编码,包括2350 韩文音节和 4888 个汉字a)的超集,包含 8822个附加的韩文音节( 在C1中 )

CP950

是代替EUC-TW (CNS 11643-1992)的 Big5 编码(13072 繁体 zh_TW 中文字) 繁体中文,这些定义都在Ken Lunde的 CJK.INF中或者 Unicode 编码表中找到.

注意: Microsoft采用以上四种Codepage,因此要访问Microsoft的文件系统时必需采用上面的Codepage .


1.2 IBM的远东语言Codepage
IBM的Codepage分为SBCS和DBCS两种:

IBM SBCS Codepage


37 (英文) *
290 (日文) *
833 (韩文) *
836 (简体中文) *
891 (韩文)
897 (日文)
903 (简体中文)
904 (繁体中文)
IBM DBCS Codepage

300 (日文) *
301 (日文)
834 (韩文) *
835 (繁体中文) *
837 (简体中文) *
926 (韩文)
927 (繁体中文)
928 (简体中文)
将SBCS的Codepage和DBCS的Codepage混合起来就成为: IBM MBCS Codepage

930 (日文) (Codepage 300 加 290) *
932 (日文) (Codepage 301 加 897)
933 (韩文) (Codepage 834 加 833) *
934 (韩文) (Codepage 926 加 891)
938 (繁体中文) (Codepage 927 加 904)
936 (简体中文) (Codepage 928 加 903)
5031 (简体中文) (Codepage 837 加 836) *
5033 (繁体中文) (Codepage 835 加 37) *
*代表采用EBCDIC编码格式

由此可见,Mircosoft的CJK Codepage来源于IBM的Codepage



CodePage 代码页编码和语言名称对应表

编码大全 CodePage CharSet 中英文显示名称

代码页(CodePage) 名称(CharSet) 显示名称(中文) 显示名称(英文)
Info.CodePage Info.Name(CharSet) Info.DisplayName(cn) Info.DisplayName(en)
37 IBM037 IBM EBCDIC(美国 - 加拿大) IBM EBCDIC (US-Canada)
437 IBM437 OEM 美国 OEM United States
500 IBM500 IBM EBCDIC(国际) IBM EBCDIC (International)
708 ASMO-708 阿拉伯字符 (ASMO 708) Arabic (ASMO 708)
720 DOS-720 阿拉伯字符 (DOS) Arabic (DOS)
737 ibm737 希腊字符 (DOS) Greek (DOS)
775 ibm775 波罗的海字符 (DOS) Baltic (DOS)
850 ibm850 西欧字符 (DOS) Western European (DOS)
852 ibm852 中欧字符 (DOS) Central European (DOS)
855 IBM855 OEM 西里尔语 OEM Cyrillic
857 ibm857 土耳其字符 (DOS) Turkish (DOS)
858 IBM00858 OEM 多语言拉丁语 I OEM Multilingual Latin I
860 IBM860 葡萄牙语 (DOS) Portuguese (DOS)
861 ibm861 冰岛语 (DOS) Icelandic (DOS)
862 DOS-862 希伯来字符 (DOS) Hebrew (DOS)
863 IBM863 加拿大法语 (DOS) French Canadian (DOS)
864 IBM864 阿拉伯字符 (864) Arabic (864)
865 IBM865 北欧字符 (DOS) Nordic (DOS)
866 cp866 西里尔字符 (DOS) Cyrillic (DOS)
869 ibm869 现代希腊字符 (DOS) Greek, Modern (DOS)
870 IBM870 IBM EBCDIC(多语言拉丁语 2) IBM EBCDIC (Multilingual Latin-2)
874 windows-874 泰语 (Windows) Thai (Windows)
875 cp875 IBM EBCDIC(现代希腊语) IBM EBCDIC (Greek Modern)
932 shift_jis 日语 (Shift-JIS) Japanese (Shift-JIS)
936 gb2312 简体中文 (GB2312) Chinese Simplified (GB2312)
949 ks_c_5601-1987 朝鲜语 Korean
950 big5 繁体中文 (Big5) Chinese Traditional (Big5)
1026 IBM1026 IBM EBCDIC(土耳其拉丁语 5) IBM EBCDIC (Turkish Latin-5)
1047 IBM01047 IBM 拉丁语 1 IBM Latin-1
1140 IBM01140 IBM EBCDIC(美国 - 加拿大 - 欧洲) IBM EBCDIC (US-Canada-Euro)
1141 IBM01141 IBM EBCDIC(德国 - 欧洲) IBM EBCDIC (Germany-Euro)
1142 IBM01142 IBM EBCDIC(丹麦 - 挪威 - 欧洲) IBM EBCDIC (Denmark-Norway-Euro)
1143 IBM01143 IBM EBCDIC(芬兰 - 瑞典 - 欧洲) IBM EBCDIC (Finland-Sweden-Euro)
1144 IBM01144 IBM EBCDIC(意大利 - 欧洲) IBM EBCDIC (Italy-Euro)
1145 IBM01145 IBM EBCDIC(西班牙 - 欧洲) IBM EBCDIC (Spain-Euro)
1146 IBM01146 IBM EBCDIC(英国 - 欧洲) IBM EBCDIC (UK-Euro)
1147 IBM01147 IBM EBCDIC(法国 - 欧洲) IBM EBCDIC (France-Euro)
1148 IBM01148 IBM EBCDIC(国际 - 欧洲) IBM EBCDIC (International-Euro)
1149 IBM01149 IBM EBCDIC(冰岛语 - 欧洲) IBM EBCDIC (Icelandic-Euro)
1200 utf-16 Unicode Unicode
1201 UnicodeFFFE Unicode (Big-Endian) Unicode (Big-Endian)
1250 windows-1250 中欧字符 (Windows) Central European (Windows)
1251 windows-1251 西里尔字符 (Windows) Cyrillic (Windows)
1252 Windows-1252 西欧字符 (Windows) Western European (Windows)
1253 windows-1253 希腊字符 (Windows) Greek (Windows)
1254 windows-1254 土耳其字符 (Windows) Turkish (Windows)
1255 windows-1255 希伯来字符 (Windows) Hebrew (Windows)
1256 windows-1256 阿拉伯字符 (Windows) Arabic (Windows)
1257 windows-1257 波罗的海字符 (Windows) Baltic (Windows)
1258 windows-1258 越南字符 (Windows) Vietnamese (Windows)
1361 Johab 朝鲜语 (Johab) Korean (Johab)
10000 macintosh 西欧字符 (Mac) Western European (Mac)
10001 x-mac-japanese 日语 (Mac) Japanese (Mac)
10002 x-mac-chinesetrad 繁体中文 (Mac) Chinese Traditional (Mac)
10003 x-mac-korean 朝鲜语 (Mac) Korean (Mac)
10004 x-mac-arabic 阿拉伯字符 (Mac) Arabic (Mac)
10005 x-mac-hebrew 希伯来字符 (Mac) Hebrew (Mac)
10006 x-mac-greek 希腊字符 (Mac) Greek (Mac)
10007 x-mac-cyrillic 西里尔字符 (Mac) Cyrillic (Mac)
10008 x-mac-chinesesimp 简体中文 (Mac) Chinese Simplified (Mac)
10010 x-mac-romanian 罗马尼亚语 (Mac) Romanian (Mac)
10017 x-mac-ukrainian 乌克兰语 (Mac) Ukrainian (Mac)
10021 x-mac-thai 泰语 (Mac) Thai (Mac)
10029 x-mac-ce 中欧字符 (Mac) Central European (Mac)
10079 x-mac-icelandic 冰岛语 (Mac) Icelandic (Mac)
10081 x-mac-turkish 土耳其字符 (Mac) Turkish (Mac)
10082 x-mac-croatian 克罗地亚语 (Mac) Croatian (Mac)
20000 x-Chinese-CNS 繁体中文 (CNS) Chinese Traditional (CNS)
20001 x-cp20001 TCA 台湾 TCA Taiwan
20002 x-Chinese-Eten 繁体中文 (Eten) Chinese Traditional (Eten)
20003 x-cp20003 IBM5550 台湾 IBM5550 Taiwan
20004 x-cp20004 TeleText 台湾 TeleText Taiwan
20005 x-cp20005 Wang 台湾 Wang Taiwan
20105 x-IA5 西欧字符 (IA5) Western European (IA5)
20106 x-IA5-German 德语 (IA5) German (IA5)
20107 x-IA5-Swedish 瑞典语 (IA5) Swedish (IA5)
20108 x-IA5-Norwegian 挪威语 (IA5) Norwegian (IA5)
20127 us-ascii US-ASCII US-ASCII
20261 x-cp20261 T.61 T.61
20269 x-cp20269 ISO-6937 ISO-6937
20273 IBM273 IBM EBCDIC(德国) IBM EBCDIC (Germany)
20277 IBM277 IBM EBCDIC(丹麦 - 挪威) IBM EBCDIC (Denmark-Norway)
20278 IBM278 IBM EBCDIC(芬兰 - 瑞典) IBM EBCDIC (Finland-Sweden)
20280 IBM280 IBM EBCDIC(意大利) IBM EBCDIC (Italy)
20284 IBM284 IBM EBCDIC(西班牙) IBM EBCDIC (Spain)
20285 IBM285 IBM EBCDIC(英国) IBM EBCDIC (UK)
20290 IBM290 IBM EBCDIC(日语片假名) IBM EBCDIC (Japanese katakana)
20297 IBM297 IBM EBCDIC(法国) IBM EBCDIC (France)
20420 IBM420 IBM EBCDIC(阿拉伯语) IBM EBCDIC (Arabic)
20423 IBM423 IBM EBCDIC(希腊语) IBM EBCDIC (Greek)
20424 IBM424 IBM EBCDIC(希伯来语) IBM EBCDIC (Hebrew)
20833 x-EBCDIC-KoreanExtended IBM EBCDIC(朝鲜语扩展) IBM EBCDIC (Korean Extended)
20838 IBM-Thai IBM EBCDIC(泰语) IBM EBCDIC (Thai)
20866 koi8-r 西里尔字符 (KOI8-R) Cyrillic (KOI8-R)
20871 IBM871 IBM EBCDIC(冰岛语) IBM EBCDIC (Icelandic)
20880 IBM880 IBM EBCDIC(西里尔俄语) IBM EBCDIC (Cyrillic Russian)
20905 IBM905 IBM EBCDIC(土耳其语) IBM EBCDIC (Turkish)
20924 IBM00924 IBM 拉丁语 1 IBM Latin-1
20932 EUC-JP 日语(JIS 0208-1990 和 0212-1990) Japanese (JIS 0208-1990 and 0212-1990)
20936 x-cp20936 简体中文 (GB2312-80) Chinese Simplified (GB2312-80)
20949 x-cp20949 朝鲜语 Wansung Korean Wansung
21025 cp1025 IBM EBCDIC(西里尔塞尔维亚 - 保加利亚语) IBM EBCDIC (Cyrillic Serbian-Bulgarian)
21866 koi8-u 西里尔字符 (KOI8-U) Cyrillic (KOI8-U)
28591 iso-8859-1 西欧字符 (ISO) Western European (ISO)
28592 iso-8859-2 中欧字符 (ISO) Central European (ISO)
28593 iso-8859-3 拉丁语 3 (ISO) Latin 3 (ISO)
28594 iso-8859-4 波罗的海字符 (ISO) Baltic (ISO)
28595 iso-8859-5 西里尔字符 (ISO) Cyrillic (ISO)
28596 iso-8859-6 阿拉伯字符 (ISO) Arabic (ISO)
28597 iso-8859-7 希腊字符 (ISO) Greek (ISO)
28598 iso-8859-8 希伯来字符 (ISO-Visual) Hebrew (ISO-Visual)
28599 iso-8859-9 土耳其字符 (ISO) Turkish (ISO)
28603 iso-8859-13 爱沙尼亚语 (ISO) Estonian (ISO)
28605 iso-8859-15 拉丁语 9 (ISO) Latin 9 (ISO)
29001 x-Europa 欧罗巴 Europa
38598 iso-8859-8-i 希伯来字符 (ISO-Logical) Hebrew (ISO-Logical)
50220 iso-2022-jp 日语 (JIS) Japanese (JIS)
50221 csISO2022JP 日语(JIS- 允许 1 字节假名) Japanese (JIS-Allow 1 byte Kana)
50222 iso-2022-jp 日语(JIS- 允许 1 字节假名 - SO/SI) Japanese (JIS-Allow 1 byte Kana - SO/SI)
50225 iso-2022-kr 朝鲜语 (ISO) Korean (ISO)
50227 x-cp50227 简体中文 (ISO-2022) Chinese Simplified (ISO-2022)
51932 euc-jp 日语 (EUC) Japanese (EUC)
51936 EUC-CN 简体中文 (EUC) Chinese Simplified (EUC)
51949 euc-kr 朝鲜语 (EUC) Korean (EUC)
52936 hz-gb-2312 简体中文 (HZ) Chinese Simplified (HZ)
54936 GB18030 简体中文 (GB18030) Chinese Simplified (GB18030)
57002 x-iscii-de ISCII 梵文 ISCII Devanagari
57003 x-iscii-be ISCII 孟加拉语 ISCII Bengali
57004 x-iscii-ta ISCII 泰米尔语 ISCII Tamil
57005 x-iscii-te ISCII 泰卢固语 ISCII Telugu
57006 x-iscii-as ISCII 阿萨姆语 ISCII Assamese
57007 x-iscii-or ISCII 奥里雅语 ISCII oriya
57008 x-iscii-ka ISCII 卡纳达语 ISCII Kannada
57009 x-iscii-ma ISCII 马拉雅拉姆语 ISCII Malayalam
57010 x-iscii-gu ISCII 古吉拉特语 ISCII Gujarati
57011 x-iscii-pa ISCII 旁遮普语 ISCII Punjabi
65000 utf-7 Unicode (UTF-7) Unicode (UTF-7)
65001 utf-8 Unicode (UTF-8) Unicode (UTF-8)
65005 utf-32 Unicode (UTF-32) Unicode (UTF-32)
65006 utf-32BE Unicode (UTF-32 Big-Endian) Unicode (UTF-32 Big-Endian)