当前位置:首页 >> 其它课程 >> 4.1

4.1


主讲教师:左斌
Email :zuobin2199@163.com

第18周 文本信息加工

本章目录
4.1 本文信息加工 4.2 表格信息加工 文本和表格信息加工是人性化信息加工的两 类重要应用,通过本章的学习,你将进一步体验 和认识文本信息加工和表格信息加工的实际价值, 特别是如何根据需要选择适当的表达方式去有

效 地表达信息。本章需要你勤于动手、善于思考, 从中总结经验、发现规律。
2

第18周 文本信息加工

4.1 文本信息加工
学习目标
? 体验文字处理技术的发展变化及其意义 ? 了解文字在计算机中的编码方式

3

第18周 文本信息加工

文本信息加工

第18周 文本信息加工

4.1.1 文字及其处理技术
一、体验文字处理技术 1.概述 文字是人类为了更加流畅地表述意义,传递 经验发明的工具,人们利用文字记载自然变化、 历史沿革、生产经验、建设成果等各种信息, 极大促进人类文明的发展进程。 思考:汉字是怎么造出来的?

第17周 信息智能化加工 2.汉字的造字法 汉字的造字法有四种:象形、指事、会意、形声。
用图画依照物体的形状或者样子描绘出来表示的文字

象形
将一些很难解释的事物当做一个字。

象形文

指事

从字体上看,就是本字倒过来 。上部为树头,下部为树梢,在树 梢上加一小横,就表示这里是树梢 。因此,末的最初的意义是树梢。 (上、下、刃等)

第17周 信息智能化加工

指把两个字拼在一起变成另一个字

会意

金文「明」为日月幷照之会意字。(信=人+言)

一般是将两字和在一起变成另一个字,一边表示声音,一边表示形态

形声

字的一部分是“形旁”表示字义,一部分 是“声旁”表示读音,如: “清”是“水”形 “青”声,“河”是“水”形“可”声。

第17周 信息智能化加工

猜一猜:以下象形字分别是什么?

(休 )

(采 )

(焚 )

(甘 )

(刃 )

第17周 信息智能化加工

东巴文字 东巴文字是唯一活着的象形文字。 东巴文是一种原始的图画象形文字,主要为东 巴教徒传授使用,书写东巴经文,故称东巴文 。纳西话叫“思究鲁究”,意为“木迹石迹” ,见木画木,见石画石 。

第17周 信息智能化加工
云南 纳西族 东巴文字











牙齿

看书



猜猜看,上面的象形文字究竟表示什么意思? ? ⑴东巴象形文字是目前世界上仅存的为数不多的古象形文字之一,并 且是世界上唯一仍在使用的古象形文字,是文字史上的活化。 ? ⑵东巴象形文字在工艺美术设计具有很高的审美价值。

第17周 信息智能化加工

思考:中国汉字的发展过程是怎么样的?

第18周 文本信息加工 3.文字之旅 文字之旅:第1站——甲骨文 龟壳 兽骨

第18周 文本信息加工

文字之旅:第2站——金文

金文

第18周 文本信息加工

文字之旅:第3、4站——大篆、小篆

大篆

小篆

第18周 文本信息加工 文字之旅:第N站——隶书、草书、行书

隶书(张迁碑)

草书(张旭)

行书(王羲之)

第18周 文本信息加工

4.书法是一种凝结了我国民族文化精髓的特殊的艺术形式

兰亭集序(局部)

晋·王羲之

第18周 文本信息加工 徐冰—方块英文

将26个字母改造成类似中国汉字的偏旁部首

Art For The People

第18周 文本信息加工 Ti yan qing jing : pin yin yu han zi 体验情境:拼音与汉字 村居
(清) 高 鼎

草长莺飞二月天,
拂堤杨柳醉春烟。

儿童散学归来早,
忙趁东风放纸鸢。

第18周 文本信息加工

计算机文字处理技术发展
过 去 只能处理拉丁字母 以及一些控制符号
ASCII码(美国标准信息交换码),可以表示128个字符 GB2312(1980年)一共收录了7445个字符 Big5(1984), 一共收录了13060个字符 GBK1.0 (1995),收录了21886个符号 GB18030 (2000),收录了27484个汉字和主要的少数民族文 字 Unicode( 1994,统一码、万国码),它为每种语言中的 每个字符设定了统一并且唯一的二进制编码,以 满足跨语言、跨平台进行文本转换、处理的要求。 现 可处理包括象形文 在 字在内的任何文字 小结: 从ASCII、GB2312到GBK1.0、GB18030 ,这些编码方法是向下兼容的 ,即同一个字符在这些方案中总是有相同的编码,后面的标准支持更多的字符。在 这些编码中,英文和中文可以统一地处理。

字符的编码ASCII码 美国信息交换标准代码( American Standard Code for Information Interchange, ASCII ) 二进制数 十进制数 十六进制数
01100011 01100100 01100101 01100110 01100111 99 100 101 102 103 63 64 65 66 67

第18周 文本信息加工

字符
c d e f g

0000 0000 +1 0000 0001 +1 0000 0010 +1 0000 0011
……

0 1 2 3

01101000
01101001 01101010 01101011 01101100

104
105 106 107 108

68
69 6A 6B 6C

h
i j k l

01111111 十六进制数的表示

127

0 1 2 3 4 5 6 7 8 9 A B C D E F 0 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 一个十六进制数需要四个二进制数表示 F=1111 E=1110 D=1101 C=1100 B=1011 A=1010 9=1001 8=1000 7=0111 6=0110 5=0101 4=0100 3=0011 2=0010 1=0001 0=0000

01101101
01101110 01101111

109
110 111

6D
6E 6F

m
n o

….. ….. ….. ….. 1个字符需要8位二进制数即8个比特 (Bit) 而 1个字节B(byte)=8比特(Bit) 即一个字符需要一个字节来存储

第18周 文本信息加工 中文信息处理技术发展简史
? ? ? ? 20世纪80年代初,CCDOS成为我国第一个汉字操作系统; 1983年,“王码五笔字型”输入法,突破了汉字数字化的瓶颈; 1984年,联想公司成立并推出联想汉卡; 1985年5月,北大方正研制的激光照排II型机,迎来了印刷业“告别铅与 火,迈入光与电”的时代; 1989年9月,金山公司发布了中文字处理系统WPS 1.0; 1992年,PTDOS 1.0;1993年10月发布UCDOS 3.0;1994年到 1997年先后开发出UCDOS 3.1~UCDOS 7.0; 1993年Windows 3.2发布,这是第一个简体中文版的Windows操作 系统,此后Windows及其中文版本不断升级; 1999年,中国新一代的国产操作系统——红旗Linux推出。

? ?
? ?

第18周 文本信息加工

二、汉字的编码
1.历史上使用的文字处理技术 手写 刻字 雕版印刷 活字印刷 机械式 打字机 计算机 文字处理

2.计算机文字处理 只能处理英文 如何在计算机中处理汉字? 可处理包括象形文 字在内的任何文字

2.汉字的编码
目前计算机上使用的汉字编码主要有三种: 输入码 用于输入汉字的编码 (外码) (数字码,音码、形码、混
合码) 区位码输入, 智能ABC,微软拼音, 郑码,五笔字型,自然码等

第18周 文本信息加工


:6625

区位码

全拼编码:chun 五笔字型:dw


用机内码 存储 用汉字字型码 输出码 输出汉字
宋体 楷体

机内码 (内码)

用于存储汉字的编码 如国标码(GB)和BIG5码

输出码 用于输出汉字的编码 (字型码) 字模16×16,24×24
宋体、楷体、隶书等

第18周 文本信息加工

? 输入码(外码): 用于输入汉字,如区位码、拼音码、王码(五笔字型),自然码等。 ? 机内码(内码): 供计算机系统内部进行存储、加工处理、传输而统一使用的代码, 用于储存汉字,如国标码(GB)、BIG5码等。 ? 输出码(字型码): 存储在计算机内的汉字在屏幕上显示或打印机打印出来时,必须以 汉字字型输出,汉字的输出码实际上是汉字的字型码,它是由汉字的 字模信息所组成的。 汉字是一种象形文字,每个汉字都是一个特定图形,这种图形可以 用点阵、向量等方式表示。

第18周 文本信息加工 字模(点阵、向量)如8*8点阵
● ● ●●●●●●● ●●●●●●● ●●●●●●● ● ● ● → 00010000 → 00010000 → 11111110 → 10010010 → 11111110 → 00010000 → 00010000 → 00010000 Bit (位) Byte (字节) B 1B=8bit 1KB=1024B 1MB=1024KB 1GB=1024MB 1TB=1024GB

用8*8点阵表示一个“中”字,这个汉字占8行,每一行8个点,其中每一个 点用一个二进制位表示,值“0”表示没有笔形,值“1”表示有笔形,储存 这个字型码需要8×8=64位二进制,即8个字节(1字节=8位二进制)。 如32*32点阵就需要:32*32位=32*32/8B=128B

第18周 文本信息加工
3、汉字的输出码(字型码) 用于输出汉字的编码——输出码(字型码)

宋体
00000000000000000000000000000000000000000000 00000000000000010101010100100101000000000000 00000000000000000000000000000000000000000000 00000000000000010101010100100101000000000000 00000000000000010101010100100101000000000000 00000000001111000001110001100001111100000000 00000000000000000000000000000000000000000000

楷体
00000000000000000000000000000000000000000000 00000000000000010101010100100101000000000000 00000000000000000000000000000000000000000000 00000000000000010101010100100101000000000000 00000000000000010101010100100101000000000000 00000000001111000001110001100001111100000000 00000000000000000000000000000000000000000000

点阵字型:将汉字分解成若干个“点”组成的点阵字型。 例: 16 × 16 点阵,表示一个汉字,则一个汉字占 16 行,每一行 16 个点,其中每一个点用一个二进制数表示,值“ 0 ”没有笔形,值“ 1 ”表示 有笔形。 1 B= 8bit 16×16bit/8bit=32B

……

……

第18周 文本信息加工

3、 输出码(字型码)
点阵类型 简易型 普及型 提高型
点阵参数(行×列)

每个汉字占的字节数 32B 72B 128B 288B

16 × 16

24 × 24 32 × 32
48 × 48

精密型

练习:
1.32 × 32点阵表示一个汉字需要( A.128个 B.64个 C.32个 )个字节。 D.36个 E. 64× 64 E. 二进制码

2.( )点阵显示的汉字效果最好。(多项选择) A.24×24 B.精密型 C.提高型 D.16×16

3.存贮在计算机中的汉字以()码形式存储。 A.区位码 B.机内码 C.字形码

D.输出码

第18周 文本信息加工

补充说明:二进制
? 一个二进制数的值: 0 1 0 0 1 0 1 0 128 64 32 16 8 4 2 1 所以 01001010=64+8+2=74 ? 单位: bit(位)、 Byte(字节):8b=1B 1KB(千字节)=210=1024B 1MB(兆字节)=1024KB 1GB(千兆字节)=1024MB

第18周 文本信息加工

计算机汉字的处理过程

键盘输入 (输入码)

编码转换 (机内码)

编辑与输出 (字型码)

第18周 文本信息加工 例:“春”字在计算机中的处理过程

1.从键盘用拼音输入法输入外码“chun”; 2.从外码表中找出与之对应的汉字机内码; 3.按照“机内码”找到存放字型码的地址; 4.取出“字型码”在屏幕上显示出来。

第18周 文本信息加工

思考
? 同一个字用不同的输入法输入,输入码一样吗?机内码一样吗? 输出码一样吗?
? 如果用64*64点阵表示一个汉字字形,需要用多少个字节来存 放? ? 在浏览网页或阅读邮件遇到乱码现象应该怎样解决? ? 在输入汉字的时候,碰到生僻字,如“喆”、“镕”等字时,可以采 取什么办法?

第18周 文本信息加工
问题情境:丁丁是高一(18)班长,开学时要安排值日表,丁丁的计算机 基础较好,于是就想通过电脑编制这个表格,以后修改更方便。可是,在 他输入学生姓名的的时候,碰到了几个姓名怎么输也输不进去,你能帮他 解决这个问题吗?

许旻张赟 刘

第18周 文本信息加工

上机实践
实践1:请新建一个word的文档,尽可能用多种输入法输入汉字“中”,并填写下表


汉字

输入方法

输入码

输入码的编码方式

参考资料

第18周 文本信息加工

上机实践
实践2:书本P58的1(2),利用TRUE 设计一个新字或个性化签名 TYPE程序

实践3:请用东巴文输入汉字“喝茶”、“唱歌”

第18周 文本信息加工





? 在最近几年,作为大学教材的《语言文字原理》 一书中有这样一段结论:“汉字永远只能作为‘ 客人’在电脑中出现,真正的‘主人’还是拼音 文字,因为人们无法直接用汉字设计电脑程序, 无法使汉字成为电脑符号”。 ? 火星文是一种什么文字?谈谈你的看法。

第18周 文本信息加工

课堂 小结
体验文字处理技术
(教学重点)

文字的发明是为了更流畅地表述意义、传递经验

汉字的创造饱含民族的智慧 书法是一门凝结了我国民族文化精髓的艺术 中文信息处理技术发展历史 输入码(外码)——汉字的输入 汉字的编码 机内码(内码)——汉字的存储
(教学难点)

文字 及其 处理 技术

输出码(字型码)—汉字的输出

第18周 文本信息加工

四、课堂过关练习 ? 判断(true/false) 1.汉字起源于象形文字,至今仍保留了象形文字的特点。

(T )
2.TB,MB,GB,KB中数量级最大的是GB。( F )

第18周 文本信息加工

3.20世纪80年代初,我国第一个汉字操作系统是CCDOS, 它的问世带动了中文软件平台的开发。( ) T

4.目前,计算机上汉字编码的形式主要有输入码、机外码 和输出码三种。(F )
5. 计算机只能识别二进制数0和1代码。( T)


更多相关文档:

4.1质量管理体系总要求

4.1质量管理体系总要求_生产/经营管理_经管营销_专业资料 暂无评价|0人阅读|0次下载|举报文档 4.1质量管理体系总要求_生产/经营管理_经管营销_专业资料。...

SoM V4.1培训大纲-1.0

SoM V4.1培训大纲-1.0_电子/电路_工程科技_专业资料。SoMachine V4.1 Training—1.0 2014 SoMachine Training 一、 SoMachine 软件安装及注册 1. 硬件要求 2. ...

2.0、2.1、4.1、5.1、7.1声道音响区别!

2.0、2.1、4.1、5.1、7.1声道音响区别!_计划/解决方案_实用文档。介绍了音响的2.0、2.1、4.1、5.1、7.1声道的区别!2.0/2.1/4.1/5.1/7.1 声道音响...

4.1多边形 教案

4.1 多边形 学教案 暂无评价 2页 1下载券 4.1多边形(1) 教案(八下... 暂无评价 3页 免费 4.1多边形(2) 教案(八下... 暂无评价 3页 免费 ...

Somachine V4.1安装完成后如何修改语言

Somachine V4.1安装完成后如何修改语言_计算机软件及应用_IT/计算机_专业资料。somachine v4.1 中文显示Somachine 软件安装好后,如何修改界面和帮助的语言?主要内容为:...

4.1.2 字处理软件 教案1

4.1.2 一、教材分析 字处理软件教案实习教师:洪华燕 字处理软件是高中《信息技术基础》教程中的第四章的内容,本节内容主要 是介绍了字处理软件的基本特征, 让...
更多相关标签:
4.1愚人节 | 愚人节 | 4月1日 | 4.1张国荣 | 4.14是什么情人节 | 4.4 | 张国荣 | 4.19 |
网站地图

文档资料共享网 nexoncn.com copyright ©right 2010-2020。
文档资料共享网内容来自网络,如有侵犯请联系客服。email:zhit325@126.com