当前位置:首页 >> 其它课程 >> 计算机中的字是如何处理的

计算机中的字是如何处理的


字符编码
一、西文字符编码:ASCII 码 ASCII 码全称为美国标准信息交换码(American Standard Code for Information Interchange)。它用 8 位二进 制数来编码,第 1 位全部是 0,因此 ASCII 码最多可以表示 2^7=128 个字符,包括字母、数字、标点符号、控制符号 等西文字符。ASCII 码已经被 IS

O 认定为国际标准。 1)控制字符:0~31、127,共 33 个,不可显示; 写字母、33 个标点符号和运算符。 常见 ASCII 码的大小规则,0-9<A-Z<a-z: 2)普通字符:95 个,包括 10 个阿拉伯数字、52 个英文大小

ASCII 码表 L 0000 0001 0010 0011 0100 0101 0110 0111 1000 1001 1010 1011 1100 1101 1110 1111 H 0000 NUL SOH STX ETX EOT ENQ ACK BEL BS HT LF VT FF CR SO SI 0001 DLE DC1 DC2 DC3 DC4 NAK SYN ETB CAN EM SUB ESC FS GS RS US 0010 SP ! “ # $ % & , ) ( * + ’ . / 0011 0 1 2 3 4 5 6 7 8 9 : ; < = > ? 0100 @ A B C D E F G H I J K L M N O 0101 P Q R S T U V W X Y Z [ \ ] ^ _ 0110 ‘ a b c d e f g h i j k l m n o 0111 p q r s t u v w x y z { | } ~ DEL

记住几个常见字母的 ASCII 码大小:“A”为 65;“a”为 97;“0”为 48; 在计算机系统中,用 1 字节来存储一个 ASCII 字符。上表是标准 ASCII 字符,有一个特点:最高位(第八位)为 0。还 有一种叫做扩充 ASCII 码,它是用 8 位二进制数给字符编码,这样可以表示 256 种字符。 二、汉字编码 计算机处理汉字时,也必须先将汉字代码化,然后对汉字代码进行处理。 1.汉字国标码 中国的文字不是拼音文字,汉字的个数有数万之多,远远超过区区 256 个字符,因此我们就使用两个字节来表示 一个中文。为了与 ASCII 保持兼容,与 ASCII 码相同的编码我们不使用。 1980 年我国颁布了《信息交换用汉字编码字符集(基本集)》GB2312-80,简称国标码(或 GB 码),一共收集了 7445 一级汉字 3755 个, 按汉字拼音字母顺序排列; 二级汉字 3008 个, 按部首 笔画汉字排列。 。 个字符, 其中汉字 6763 个。 两个字节编码一个国标码字符。

2.汉字的机内表示:机内码: 计算机在信息处理时表示汉字的编码,称作机内码。现在我国都用国标码(GB2312)作为机内码。 中国的台湾省也在使用中文,但是由于历史的原因,那里没有使用大陆的简体中文,还在使用着繁体的中文,并且 他们自己也制定了一套表示繁体中文的字符编码, 称为 BIG5,不幸的是, 虽然他们的也使用两个字节来表示一个汉字, 但他们没有象我们兼容 ASCII 一样兼容大陆的简体中文,他们使用了大致相同的编码范围来表示繁体的汉字。天哪! ISO8859 的悲剧又出现在同样使用汉字的中国人身上了,同样的编码在大陆和台湾的编码中实际上表示不同的字符, 大陆的玩家在玩台湾的游戏时,经常会遇到乱码的问题, 问题根源就在于,大陆的计算机默认字符的编码就是 GB2312, 当碰到台湾使用 BIG5 编码的文字时,就会作出错误的转换。 3.汉字输入码――输入码(外码) 汉字输入码是指直接从键盘输入的各种汉字输入方法的编码。编码方法主要有三种:数字编码、拼音编码和字型 编码。 数字编码:是用一串数字代表一个汉字。拼音编码:是以汉字读音为基础的输入法。字型编码:是根据汉字形 状确定的编码。 (1) 数字码(或流水码)如:电报码、区位码、纵横码 优点:无重码,不仅能对汉字编码,还能对各种字母、数字符号进行编码。 缺点:是人为规定的编码,属于无理码,只能作为专业人员使用。 (2) 字音码如:全拼、双拼、微软拼音 优点:简单易学。 缺点:汉字同音多,所以重码很多,输入汉字时要选字。 (3) 字形码如:五笔字型、表形码、大众码、四角码 优点:不考虑字的读音,见字识码,一般重码率较低,经强化训练后可实现盲打。 缺点:拆字法没有统一的国家标准,拆字难,编码规则繁,记忆量大。 (4) 音形码如:声形、自然码、钱码 优点:利用音码的易学性和形码可有效减少重码的优点。 缺点:既要考虑字音,又要考虑字形,比较麻烦。 4.汉字的输出:字形码 在屏幕上显示或在打印机上打印出来的点阵存储信息,由汉字的字模信息所组成。 (1)点阵字形: 16X16、24X24、32X32、48X48、64X64 每一个点在存储器中用一个二进制位(bit)存储,所以一个 汉字需要 32(16×16/8=32)个字节存储空间。 字形 字笔画的轮廓用一组直线和曲线勾画。记录的是这些几何形状 系。精度高。Windows 的 TrueType 字库采用此法。 5. 计算机汉字的处理过程: 键盘输入(输入码)——编码转换(机内码)——编辑与输出 (字型码) 之间的关 16×16 点阵 (2)轮廓


更多相关文档:

计算机汉字处理知识

计算机汉字处理知识_电脑基础知识_IT/计算机_专业资料。汉字的计算机处理知识计算机...字符集的文字錄入、字體顯示就已不甚了解(大陸市面 絕大多數所謂的繁體字體,...

计算机中数的表示与汉字处理

计算机中数的表示与汉字处理 2.1 填空题 1.在计算机中表示数时,小数点固定的...(A)五笔字型 (B)区位码 (C)双拼拼音 (D)智能 ABC 【答案】 C 2.汉字...

文字及其处理

文字处理技术的发展变化及其历史意义,要通 过汉字发展历程的讲述, 使学生领悟传承发展民族文化的必要性和紧迫性;第二 部分主要任务是了解文字计算机中的编码方式,...

汉字计算机中的表示

汉字计算机中的一、前言众所周知,英文是拼音文字,一个不超过 128 种字符的字符...用计算机处理汉字,首先要解决汉字在计算机里如何表示的问题,即汉字编码问题。根 ...

1.3 文字符号在计算机中的表示与处理

1.3 文字符号在计算机中的表示与处理 1.3.1 西文字符的编码 西文是由拉丁字母、 数字、 标点符号及一些特殊符号所组成的, 它们统称为字符。 所有字符的集合称...

文字及其处理技术

文字及其处理技术_其它课程_高中教育_教育专区。“文字及其处理技术”教学设计济宁...它们是怎样存储在电脑里的,又是怎样被我们找到并在 屏幕上显示出来的呢?其实...

计算机中的数据表示方法

计算机中的数据表示方法计算机中的数据表示方法 数据是指能够输入计算机并被计算机...一个字通常由 一个或若干个字节组成,由于字长是计算机一次所能处理信息的实际...

计算机汉字处理技术研究

计算机汉字处理技术研究现代科学技术发展的标志是电子计算机。它的运用日益广泛。但...根据ASC II码提供的 地址信息从字库中提取字形信息, 称为字模。ASC II码的字...

计算机基础习题答案

操作系统和语言处理程序 D、应用软件和系统软件 26、在微机系统中用于输入输出...( ) A、按字方式存储信息 B、按位方式存储信息 C、间隔一定时间必须刷新 D...

计算机统考文字处理

计算机统考文字处理_IT认证_资格考试/认证_教育专区。文字处理关于Word文档页边距...完全相同 要在Word主窗口中显示常用工具按钮,应当使用的菜单是C:"视图"菜单 在...
更多相关标签:
计算机如何处理汉字 | 计算机文字录入处理员 | 计算机汉字的处理过程 | 计算机处理矢量汉字 | 计算机文字处理软件 | 计算机文字处理试题 | 计算机文字处理 | 计算机一级字处理题 |
网站地图

文档资料共享网 nexoncn.com copyright ©right 2010-2020。
文档资料共享网内容来自网络,如有侵犯请联系客服。email:zhit325@126.com