《HTTP权威指南》每章的知识点总结
Content-Type: text/html; charset=iso-8859-6
1、文档中的二进制码被转换成字符代码,它表示了特定编码字符集中某个特定编号的字符。
2、字符代码用于从编码的字符集中选取特定的元素。如在iso-8859-6中,值255对应阿拉伯字母“FEH”。
1、字符是指字母、数字、标点、表意文字、符号,或其它文本形式的书写‘原子’
2、字形描述字符的笔画图案或唯一的图形化形状
3、编码后的字符分配给字符的唯一数字编号,这样我们就可以操作它了
4、代码空间:计划用于字符代码值的整数范围
5、代码宽度:每个(固定大小的)字符代码所用的位数
6、字符库:特定的工作字符集(全体字符的一个子集)
7、编码后的字符集:组成字符库(从全球的字符中选出若干字符)的已编码字符集,并为每个字符分配代码空间中的一个代码
8、字符编码方案:把数字化的字符代码编码成一系列二进制码的算法
MIME中的charset值所命名的是把数据位映射为唯一的字符的一整套算法。它是字符编码方案和编码后的字符集这两种概念的组合。
字符是书写的最基本的构建单元。不要把字符和字形混淆,字符是唯一的、抽象的语言“原子”。字形是画出每个字符时使用的特定方式。根据艺术形式和手法的不同,每个字符可以有很多不同的字形。如果用一种字形替代另一种的时候,文本的意思变了,那这些字形就是不同的字符。否则,它们就是同一个字符的不同风格的表示形式而已。
字符编码方案:
1、固定宽度:固定宽度方式的编码用固定数量的比特表示每个编码后的字符。它们能被快速处理,但可能会浪费空间
2、可变宽度(无模态):可变宽度方式的编码对不同的字符代码数字采用不同数量的比特。对于常用字符,这样可以减少需要的位数,而且还能减少需要的位数,而且还能在允许使用多字节来表示国际性字符的同时,保持对传统8位字符集的兼容性。
3、可变宽度(有模态):有模态的编码使用特殊的“转义”模式在不同的模态之间切换。例如,可以用有模态的编码在文本中使用多个互相有重叠的字符集。有模态的编码处理起来比较复杂,但它们可以有效地支持复杂的书写系统。