字符集和编码方式的区别?
一、字符集和编码方式的区别
字符集:多个字符的集合。例如GB2312是中国国家标准的简体中文字符集,GB2312收录简化汉字(6763个)及一般符号、序号、数字、拉丁字母、日文假名、希腊字母、俄文字母、汉语拼音符号、汉语注音字母,共 7445 个图形字符。
字符编码:把字符集中的字符编码为(映射)指定集合中的某一对象(例如:比特模式、自然数序列、电脉冲),以便文本在计算机中存储和通过通信网络的传递。
字符集和字符编码的关系 :
字符集是书写系统字母与符号的集合,而字符编码则是将字符映射为一特定的字节或字节序列,是一种规则。通常特定的字符集采用特定的编码方式(即一种字符集对应一种字符编码(例如:ASCII、IOS-8859-1、GB2312、GBK,都是即表示了字符集又表示了对应的字符编码,但Unicode不是,它采用现代的模型)),因此基本上可以将两者视为同义词。
单字节
ASCII(American Standard Code for Information Interchange),128个字符,用7位二进制表示(00000000-01111111即0x00-0x7F);
EASCII(Extended ASCII),256个字符,用8位二进制表示(00000000-11111111即0x00-0xFF)。
当计算机传到了欧洲,国际标准化组织在ASCII的基础上进行了扩展,形成了ISO-8859标准,跟EASCII类似,兼容ASCII,在高128个码位上有所区别。但是由于欧洲的语言环境十分复杂,所以根据各地区的语言又形成了很多子标准,ISO-8859-1、ISO-8859-2、ISO-8859-3、……、ISO-8859-16。
双字节
当计算机传到了亚洲,256个码位就不够用了。于是乎继续扩大二维表,单字节改双字节,16位二进制数,65536个码位。在不同国家和地区又出现了很多编码,大陆的GB2312、港台的BIG5、日本的Shift JIS等等。
注意65536个码位这种说法只是理想情况,由于双字节编码可以是变长的,也就是说同一个编码里面有些字符是单字节表示,有些字符是双字节表示。这样做的好处是,一方面可以兼容ASCII,另一方面可以节省存储容量,代价就是会损失一部分码位。
延伸阅读:
二、GBK
GBK(Chinese Internal Code Specification)是GB2312的扩展(gbk编码能够用来同时表示繁体字和简体字),按理说都属于双字节编码,码位是一样的,根本谈不上扩展,但实际上是预留空间在起作用。比如下图为GBK的编码空间,GBK/1、GBK/2是GB2312的区域,GBK/3、GBK/4、GBK/5是GBK的区域,红色是用户自定义区域,白色可能就是由于变长编码损失的区域了。
以上就是关于字符集和编码方式的区别的内容希望对大家有帮助。

相关推荐HOT
更多>>
编程语言的类型推断怎么解决协变和逆变的问题?
一、编程语言的类型推断解决协变和逆变问题的方法类型推断并不能直接解决协变和逆变的问题,但是一些编程语言提供了额外的语法和类型系统特性来...详情>>
2023-10-15 21:40:42
JAVA的io流和nio有什么区别?
一、JAVA的io流和nio的区别1. 面向流与面向缓冲Java NIO和IO之间名列前茅个最大的区别是,IO是面向流的,NIO是面向缓冲区的。 Java IO面向流意...详情>>
2023-10-15 12:04:02
什么是 MySQL?
一、什么是 MySQLMySQL 是应用最广泛的开源关系数据库,是许多常见网站、应用程序和商业产品使用的主要关系数据存储。MySQL 有 20 多年的社区开...详情>>
2023-10-15 06:10:40
容器化有哪些优势?
一、容器化的优势由于以下优势,开发人员使用容器化来构建和部署现代应用程序。1、便携性软件开发人员使用容器化在多个环境中部署应用程序,而...详情>>
2023-10-15 03:28:53热门推荐
Go语言的结构体中怎么设置null值?
沸Java纯粹的面向对象到底是什么意思?
热C#的方法名或者属性名首字母不大写会有什么影响?
热Java 中的双亲委派的“双”怎么理解?
新编译器怎么处理定义但未使用的函数?
编程语言的类型推断怎么解决协变和逆变的问题?
二进制代码、编程语言、软件,这三者之间的联系和区别?
C语言的structure和类有什么区别?
char*t和char t[10]的区别?
函数直接返回和传递引用的区别和取舍?
大数据与区块链有什么区别?
数据的批处理和流处理有什么区别?
公共数据和政务数据有什么区别?
ejb和spring的区别?
技术干货






