当前位置:首页 >> 其它课程 >> 多媒体技术应用总结

多媒体技术应用总结


第 1 章
?多媒体技术概述

媒体 (media)
媒体:指交流、传播信息的工具。是承载
信息的载体。 “载体”是指承载知识或信 息的物质形体。

媒体的种类:
感觉媒体、表示媒体、表现媒体、存储媒
体及传输媒体。

感觉媒体
能直接作用于人的感官, 让人

产 生感觉的媒体。例如:通过视觉
看到的文字、图形;通过听觉听 到的音乐、语音等。

表示媒体
为传播和表达某种感觉媒体所指 定的各类信息的编码与格式。例

如,语言编码,电报码,图像编
码, ...

表现媒体
用于输入和输出感觉媒体的载体。
? 输出媒体 显示器,扬声器,打印机, ... ? 输入媒体 键盘, 鼠标,扫描仪, ...

存储媒体
用于存放表示媒
体的载体。例如: 内存、软磁盘、

硬盘、光盘、纸
张、 ...

传输媒体
用于把表示媒体从一处

传输到另一处的物理实
体。例如:各种导线、

电缆、电话线、光纤、 ...

各种媒体形式的关系

感觉 表现媒体 表示 媒体 (输入设备) 媒体

存储媒体

表示 表现媒体 感觉 媒体 (输出设备) 媒体

1.1.2、多媒体数据的特点
?数据量大
?数据类型多 ?数据类型之间的差别大

?多媒体数据的输入输出复杂

多媒体数据的多通道异步输入过程

声音

声音通道 显示 合成 图像通道 存储 表现 播放

图像

文字

文字通道

1.1.3 多媒体技术及特性
多媒体技术定义 多媒体技术是指计算机综合处理文

本、图形、图像、动画、音频及视
频等多种信息,使它们建立一种逻

辑连接,并集成为一个具有交互性
的系统的技术。

多媒体技术的特性
?

多样性:指信息媒体的多样性

?

集成性:指以计算机为中心综合处理多种信息媒 体,它包括信息媒体的集成和处理这些媒体设备 的集成
交互性:指用户可以与计算机的多种信息媒体进 行交互操作,从而为用户提供更加有效地控制和 使用信息的手段 实时性:音频信息与视频信息均与时间有关

?

?

1.2、多媒体个人计算机系统的组成结构
《多媒体计算机》 可以处理数值、文字、图像、动画、音

频、视频等信息的计算机被称为多媒体
计算机。它具有速度快、存储容量大、

能实时处理的特点。

多媒体计算机的分类
?基于IBM PC系列的多媒体
个人计算机(MPC) ?基于Apple Macintosh系列的

计算机

多媒体PC机(MPC)
MPC=multimedia personal computer
具有特定多媒体功能的PC机。1990年“多

媒体微机市场协会”指定了MPC标准。该
标准规定了将一个以Intel处理器芯片为基

础的计算机转变成为多媒体计算机的最低
软硬件规范。

多媒体计算机系统结构
多媒体应用系统 包括根据各种需求开发的多媒体应用系统。

多媒体创作系统

创作多媒体应用系统的工作环境。

多媒体核心系统

主要是计算机的操作系统。 完成各多媒体硬件设备的驱动控制,提供相 应的软件接口,以便高层软件系统的调用。 主要用于与时问有关的音频、视频等 多媒体信息的压缩和解压缩。

多媒体I/O接口

多媒体实时压缩与解压缩

计算机硬件系统

构成多媒体系统的根基,是组成多媒体计算 机的所有物理设备。

多媒体系统的三要素
?用于视频和音频信息处理的多媒体硬件
?多媒体操作系统

?支持多媒体的软件开发和编辑工具

1.4、多媒体的关键技术
数字音频和视频技术:主要解决音频和视频信息的数字化和压
缩、解压缩等问题,以便对音频、视频信息做到实时或准实 时处理。 多媒体软件平台技术:主要涉及多媒体操作系统、多媒体著作 工具等。 多媒体通信技术:是指利用通信网络综合地完成多媒体信息的 传输和交换的技术。这种技术打破了计算机、通信、广播和 出版的界限,使它们融为一体,向人类提供了诸如多媒体电

子邮件、视频会议等全新的信息服务。
多媒体数据库技术

1.5、多媒体技术的发展
84年:Apple公司引入位图概念 ? 85年:推出了世界上第一台多媒体系统 ? 86年:推出了交互式紧凑光盘系统CD-I ? 87年:推出交互式数字视频系统DVI ? 90年:指定MPC_I级标准 ? 91年:推出CD-ROM/XA标准 ? 92年:公布MPEG-I数字电视标准 ? 93年:推出了MPC_II级标准 ? 01年:推出MPEG-7标准,它提出了一种适用于现 实生活中的各种多媒体内容的标准化描述方案,
?

第2章
文本信息处理技术

2.1 文本信息的获取与表现
文本信息是计算机最初、最简单的
表现形式。所谓文本就是由字符组 成的字符序列。

2.1.1 文本信息的特点
1、表示简单:

文本是字母、数字及其他各种符号的集合,通常人们将这个集合称为字符
集。在目前的计算机系统中,广泛使用的是ASCII编码字符集。 2、处理方便:

每个字符占用固定的二进制位数(8位或16位),计算机可以直接对字节进行
操作。 3、表达问题准确: 很多事物只有用文字才能够表达清楚、准确。 4、存取速度快: 往往一页文字表达的内容要比一幅图像的内容多。由于一页纸的数据量比 一幅图像的数据量小,所以,存取数据所花费的时间也会少很多。

2.1.2 文本信息的获取方式 1、键盘输入方式
2、手写输入方式 3、语音输入方式 4、利用扫描仪输入方式

2.2 文本信息的编辑处理
在多媒体应用系统的制作中,也需要对 文本内容进行修改,因此在多媒体集成 工具中都提供了文本编辑功能,比如, 文本剪切、复制、粘贴、插入、删除等 等。实际上对文本的编辑处理还包括对 其进行格式化。

2.2.1 Windows中的字体
(1)字形: (2)字号:











(3)字体:点阵字体、TrueType字体

2.2.2 格式化文本
格式化文本包括:设置字体、字形、字号、颜

色、字间距、行间距、段落格式等。具体实现
方法有两种:

1、利用OLE功能链接相应的服务应用程序;
2、在专门的文本编辑软件中格式化后,利用

屏幕拷贝功能将其转换成图像,然后再导入多
媒体应用系统的画面中。

利用 OLE 技术嵌入 Microsoft Word 或书写器对象
OLE(Object Link and Embedding)是一种对
象链接与嵌入技术。它可以将Windows环境下不

同应用程序创建的数据作为对象链接或嵌入到其
他的应用程序中。其中提供数据对象的应用程序 被称为服务应用程序,链接或嵌入数据对象的应 用程序被称为客户应用程序。若在一个文档中含 有多个数据对象,就将其称为复合文档。

利用 OLE 技术嵌入 Microsoft Word 或书写器对象
?在客户应用程序中直接嵌入服务 应用程序 ?直接嵌入Word文档

?将文本图形化,并以图像文本的
形式插入到多媒体应用系统中

第3章 音频信息处理技术

3.1 音频信息的处理
人们在接收外界信息以及与他 人进行交流的过程中,大约有 20% 是通过听觉实现的,所以音频(声 音)是多媒体计算机技术中一种不 可缺少的媒体。

3.1.1 多媒体中的音频信息
声音是由物体振动引发的一种

物理现象。这种振动会不断地向四
周传播,当被人耳接收时,我们就 听到了声音。

声音媒体分为三类
?波形声音:实际上已经包含了所有声音 形式,这是因为计算机可以将任何声音 信号通过采样、量化数字化,在必要的 时候,还可以准确地将其恢复。 ?语音:人的说话声不仅是一种波形, 而 且还通过语气、语速、语调携带着比文 本更加丰富的信息。 ?音乐:音乐是一种符号化了的声音,这 种符号就是乐谱,乐谱则是转变为符号 媒体形式的声音。

声音媒体具有三个要素
?音调:与声音的频率有关,频率越 快,音调就越高。
300~3000Hz 人说话的频率范围

20Hz 亚音频

20kHz 声音(音频) 超音频

?音强:又称为响度,它取决于声音的振幅。 振幅越大,声音就越响亮。 ?音色:音色是由于波形和泛音的不同所带来 的一个声音属性。
《纯音》一般的声音由几种振动频率的波组成, 若该声音只有一种振动频率就叫做纯音; 《复音》由许多纯音组成,复音的频率用组成这 个复音的基音频率表示,一般的乐音都是复音; 《基音》是复音中频率最低部分的声音; 《泛音》在一个复音中,除去基音外,所有其余 的纯音都是泛音。

声音质量的衡量

?主观打分是一种比较快捷、简单的衡量 声音质量的方法。 ?不同的应用对象,声音质量的衡量标准 也不尽相同。

3.1.2 数字化声音信号
声音是由物体的振动产生的,这种振动引起 了周围空气压力的震荡,我们称这种震荡的 函数表现形式为波形。

平时我们听到的大多数声音都是利用模 拟元件对模拟信号处理产生的效果。
特点:连续性 缺点:精度差、易于老化、易受周围环境影 若使用计算机处理声音信息,首先要解 决的问题就是声音信号的数字化.

采样量化的结果将用所得到的数值 序列表示原始的模拟声音信号,这 就是将模拟声音信号数字化的基本 过程。

声音的模拟信号

采样

量化

声音的数字信号

影响数字化声音质量的因素
?采样频率:每秒钟采取声音信号振幅数 值的次数,单位是Hz。采样频率越高, 数字化后的声音越接近原始声音,但需 要的存储空间也越多。 ?量化位数:表示采样数值所使用的二进 制位数。二进制位数越多,表示的数值 范围越大,量化后振幅的精度越高。 ?声道数:有单声道和双声道两种。

数字化声音文件的大小
数据量(字节/秒)= 采样频率?量化位数?声道数 8 44.1kHz(高保真) ? 16位 ? 2(立体声) 8 = 176.4 KB/秒 = 0.176 MB/秒 一张CD光盘 650 MB / 0.176 MB = 3693秒 ,约为1小时

3.1.4 数字化音频信息的编辑与特效处理

对于数字化后的波形声音文件,可
以使用声音处理实用软件工具对其

进行剪切、连接、混合、音调升降
处理,并可以为其增加回音、频率 过滤、边缘效果等特殊效果。

3.2 MIDI与音乐合成
3.2.1 什么是MIDI?
MIDI(Musical Instrument Digital Interface) 是乐器数字接口的英文缩写,它是指数字乐 器与计算机连接的接口,即在数字乐器与计 算机相连接时所使用的可以直接插入在计算 机串口上的一个小部件,通过它可以使数字 乐器与计算机相互“沟通”信息。 MIDI的特点是其文件内部记录的是演奏数字 音乐的全部动作过程,所以其数据量相当小。

? 在80年代,为了使各个厂商生产的设备 可以被不同的计算机接收与处理,由几 家电子乐器厂商共同制定一个MIDI接口 标准,这就是我们常说的 “GM(Gernera1 MIDI)标准”。 ? 这个标准主要由两部分组成:一是规定 了与设备相连的硬件标准;二是规定了 MID1数据的格式,主要包括硬件上传输 信息的编码方式。

3.2.2 音乐合成
常见的音乐合成有两种方法: (1)调频合成法(FM合成法) 这种合成技术是早期的电子合成乐器所采用的发音 方式 , 它主要通过叠加不同频率的正 ( 余 ) 弦波,模拟 真实的声音波形。 (2)波表合成法(Wave Table) 这种合成技术是将各种真实的乐器声音录制下来, 并保存在一个波形表格中。播放时根据MIDI文件记 录的乐谱信息向波形表格发出指令,然后从中找出 对应的声音信息,经过合成后回放出来。由于它采 用的是真实乐器的采样,所以效果自然要好于FM。

3.3.1 语音识别的发展简史
1952年K.H.Davis用电阻、电容、电子管等分立元件,实现

带通滤波器组进行语音频谱分析和匹配,对10个阿拉伯数字的
识别率达到了98%。 1960年RDenes等人共同研究成功第一个计算机语音识别系统, 开创了计算机语音识别的新阶段 1958年,中国科学院声学研究所用电子管设备识别10个元音。

1972年起开始用计算机识别语音。至今为止,汉语语音识别的
研究工作基本跟上了国际语音识别的基本步伐,结合汉语的特 点有些地方还有所独创。

3.3.2 语音识别

语音 信号

特征 取值 训 练

识别

相似度 测量

识别 结果

形成标准 样本或模型

建立标准样 板或模型库

3.3.4语音识别的应用
理解特定人的口语 辨认说话人:从一些人中辨认出某个人来, 可以用于刑事侦查。 确认说话人:确认说话人是指依据说话人说 出的某个特定语句,确认说话者是其本人, 可以用在银行系统中,验证确是顾客本人后 才给予服务。

3.4 声音文件的基本格式
1 . WAV 文件:这是 Windows 环境使用的标准波形 声音文件格式,扩展名为 .wav。 2.VOC文件:这是为特定音频卡设计的文件格式, 它主要应用于DOS环境。 3. MIDI 文件:这是记录 MIDI 音乐的文件格式,后 缀为 .mid。与波形文件相比较,它记录的不是实际 声音信号采样的数值,而是演奏乐曲的动作过程及 属性,因此,它的数据量很小。

4.mp3文件:这种文件格式是受MPEG技术启发产生

的。由于它将.wav中的音频信息进行了很好地压缩,
所以数据量很小,且保持音质不失真。

5.wma文件:这是微软公司新发布的一种音频压缩文 件格式,这种文件格式与MP3相比具有采样频率范围更 宽,有版权保护,数据量更小且不失真等优势。

6.ra文件:随着流媒体技术的发展,人们可以实现在 这是为了解决网络传输带宽资源而设计的。

网上边下载边收听歌曲,边下载边欣赏视频节目的愿望。

3.5 音频卡
音频卡又称为声卡,是计算机处理声音信 息的专用功能卡。

音频卡通过一些外部 接口实现声音信号的 采集和播放。

3.5 音频卡
《音频卡的基本功能 》
(1)录制、编辑和回放数字声音文件;

( 2 )在录制和回放声音文件时进行压缩和解 压缩,以节省存储空间; ( 3 )采用语音合成技术,使计算机能够朗读 书面文字; (4)有乐器数字接口(MIDI)。
(5)初步的语音识别。

第4章
图形图像信息处理技术

4.1 色彩的基本概念
人们对颜色感觉的形成有四个要素;
即光源、物体、眼睛和大脑。这四个 要素不仅使人产生颜色的感觉,而且 也是人能正确判断色彩的条件。

发射光及反射光
发射光

反射光

发光物体呈现的颜色是由物体本身发出不同波长的 光所造成;不发光物体呈现的颜色是光照射物体时 被物体反射出的光所具有的。

三基色原理
红、绿、蓝三色光可以混合成自然界的全部色彩,
而这三色光本身相互独立,所以人们常常将红、

绿、蓝称为色光三原色。从生理学上讲:人们眼
睛的视网膜上存在着三种不同类型的锥体细胞,

它们分别对红、绿、蓝有很高的灵敏度(对不同
波长有不同的灵敏度),物体反射光进入人眼睛

以后,在三种锥体细胞的作用下,产生不同颜色
的光感。这就是三刺激理论,又称三色学说理论。

度量色彩的三要素
色调:由可见光谱中各分量成分的波 长来确定,是彩色光的基本特性。 饱和度:是指颜色的纯度,即掺入白 光的深浅感觉。

亮度:指彩色光对人眼引起的光刺激
程度,显然它与光的能量有关。

加色法颜色和减色法颜色
? 加色法颜色是把不同的颜色相加得到的

颜色。该系统中,没有任何颜色呈黑色,
全部颜色出现时呈白色。加色法系统属

于发射光,计算机监视器采用这个系统。
? 加色法采用红、绿、蓝(RGB)三种颜

色作为基色。

? 减色法所得到的颜色是减后的颜色。没 有任何颜色时呈白色,全部颜色都出现 则呈黑色。减色法利用的是反射光原理。 打印机采用此系统。
? 反射光采用青色(Cyan)、粉红 (Magenta)及黄(Yellow)三种颜色作 为基色。由于打印墨的问题,往往需加 一些黑墨,所以真正打印机处理的是四 色。简称 CMYK。

色彩模型
《HSB 模型》
HSB 是艺术家习惯采用的颜色描述方法。

?Hue:色调
?Saturation:饱和度 ?Brightness:亮度

《RGB模型》
自然界中绝大多数的色彩都可以用适当比例的 三基原色混合组成的等效色来模拟。显示器这 类发光物体用的就是RGB模型。

红+绿=黄 红+蓝=品红 绿+蓝=青 红+绿+蓝=白

《CMY模型》
用彩色墨水或颜料进行混合,得到的颜色被称为

减法色。从理论上说,任何一种颜色都可以用三
种基本颜料按一定比例混合而成。这三种颜色是

红、绿、蓝色的补色,
即青(Cyan)、品红

(Magenta)和黄色
(Yellow),通常写 成CMY。

《YUV模型 》
这是一种电视系统使用的色彩表示形式。 其中Y表示亮度,U、V表示色差。所谓 色差是指三原色信号分量与亮度信号之 差。其特点:
?可以使黑白电视和彩色电视兼容 ?可以利用人眼对彩色的敏感度低于对亮度的 敏感度的视觉特性,将UV信息用较少的二

进制位数表示,较窄的频带传送

4.2 位图图像与矢量图形
《矢量图形与位图图像的特点》
矢量图像:用一组指令集合来描述图形的内容,这些指 令用来描述构成该图形的所有直线、圆、矩形等图元。 位图图像:图像是通过扫描仪、数字相机、摄像机等输 入设备导入到计算机中的。它们将原始图像分成许许 多多的点阵,我们将其称为像素。每个像素用若干个 二进制位记录色彩、亮度等反映该像素属性的信息, 并将每个像素的内容按一定的规则排列起来构成文件 的内容,我们将用这种形式表示的图像称为位图图像, 简称为图像。

矢量图形的优缺点
优点:适用于绘制简单的图形,

占内存小,数据量比位图小,颜
色数不影响文件的大小,易对个 别图元进行编辑,放大缩小后输 出的图形不失真。 缺点:对于复杂图形,矢量命令

会变得复杂,创建的图形不自然。
由于矢量图形依赖于简单的图元, 所以很难表现物体的复杂属性。

不如位图表现的形象、逼真。

位图的优缺点
优点:自然、直观,容 易描述细节内容,并可 进行特殊效果的处理。 缺点:数据量大,耗费 存储。进行图像的放大、 缩小和旋转等编辑处理 较困难。

矢量图形与位图的关系
?矢量图形的基本元素是图元

位图概念的基本元素是像素。
?矢量图形的显示过程是依照图元绘制的顺序

显示;
位图的显示过程按照位图中安排的像素顺序

显示,往往是从上到下,从左到右。

矢量图形与位图的关系
?矢量图形可进行变换,无失真。 图像变换会失真。 ?矢量图形可以图元为单位单独进行属性修 改编辑等操作,而位图不行。 ?矢量图形实际上是对位图的抽象。

4.2 图像的主要属性
? 分辨率
– 屏幕分辨率:指显示屏幕上的最大显 示区域,即水平和垂直方向的像素个 数 – 图像分辨率:指数字图像的尺寸,即 水平和垂直方向的像素个数

?颜色深度
位图矩阵中表示每个像素颜色的二进制 位数称为位深度。 常见的彩色或灰度图像位深度有:
4位(24)
8位(28)

16色
256色

16位(216=65536)
24位(224=16777216)

增强色
真彩色

4.3 图形图像的获取及表现
《图形的获取方式》
? 利用软件绘图图形
? 利用数字化仪绘制图形

? 利用光笔绘制图形

《图像的获取方式》
利用扫描仪、数字摄象机等图像采集设备获
取图像

《图形图像的表现》
呈现图形图像的主要设备有两类:
光栅扫描显示和硬拷贝设备。目前,

使用的主要光栅扫描显示部件是阴
极射线管( CRT ),图像打印机是 典型的硬拷贝设备。

4.4 图像的加工处理
我们将图像采集到计算机中,常常要

对其进行修版、编辑等处理。

常见的操作有:图像几何运算、图像 增强、图像复原和重建、图像分割和特 征提取、图像编码和压缩等。

图像几何运算
图像几何运算包括对图像进行缩放、剪贴、平移、 旋转和变形等操作。

图像增强
所谓图像增强是指增强图像中有用的信息,压低噪 音。其目的有: 一是处理原始图像使它更清晰、更适于人的观察;

二是变换图像以方便人或机器的分析和处理。

图像复原和重建
图像复原就是对退化或劣化的图像进行校正处理、 滤去退化痕迹、恢复图像的本来面目。其原则应是 尽可能复现或逼近无退化的真实图像。 图像分割和特征提取

图像分割是将图像分割成不同的部分或区域的过程。 其目的是把图像分成一些有用的或有意义的部分或 区域,以便进一步对图像进行分析与理解。 图像特征提取就是检测和提取图像的特征。

图像编码与压缩
多媒体数据量极大,为了存储、传输和实时处理这些

数据必须进行有效地压缩,只有这样才有可能播放出
高质量的视频、音频。

640*480分辨率24位真彩色图像数据量约为900KB; NTSC标准的帧速率为30帧/s,视频信号要求传输率 为26.4MB/s; 采样频率为44.1kHz,量化位数为16,双通道立体声, 100MB仅能存储约10分钟。

数据压缩的分类
数据压缩是由两个过程组成的:
?编码过程:压缩
?解码过程:解压

?按失真性分为
?无损压缩

?有损压缩

?无损压缩:利用数据的统计统计冗余进行 压缩,可完全恢复原始数据而不引入任何 失真,但压缩比较小,一般在2:1到5:1 之间。这类方法广泛应用于文本数据、程 序。有代表性的算法是:游程编码、 Huffman编码、算术编码等等。

?有损压缩:利用人类视觉和听觉器官对 图像或声音中的某些频率成分不敏感的

特性,允许在压缩过程中损失一定的信
息;虽然不能完全恢复原始数据,但所

损失的部分对理解原始图像或声音不会
产生影响。有代表性的算法有:PCM、

预测编码、变换编码、插值等等。

视频编码的国际标准
静止图像压缩标准JPEG
Joint Photographic Experts Group “多灰度静止图像的数字压缩编码”它是 一个适用于彩色和单色多灰度或连续色 调静止数字图像的压缩标准。它包括无 损压缩和有损压缩两部分。有损压缩的 压缩比可达到20~40倍。

运动图像压缩标准MPEG
Moving Pictures Experts Group
MPEG-1:针对传输率为1Mbit/s~1.5M bit/s 的普通电

视质量的视频信号的压缩
MPEG-2:针对每秒30帧的720*572分辨率的视频信号

进行压缩
MPEG-4:MPEG-4的特点是其更适于交互AV服务以 及远程监控。MPEG-4是第一个使你由被动变为主动 的动态图像标准,与MPEG1和MPEG2相比, MPEG4更加注重多媒体系统的交互性和灵活性。

4.5 图形图像的文件格式
?PCX格式:由Z-Soft公司设计。最初只支持16种 颜色,现在可以支持256色甚至真彩色图像。使 用游程长编码方法压缩,压缩比适中,速度较 快。 ?BMP和DIB格式:是Windows 所使用的与设备 无关的点位图文件存储格式。BMP文件有压缩 和非压缩。支持各种颜色。

?GIF格式:全称是“图形交换文件格式”
(Graphics Interchange Format)由

CompuServe开发,可支持黑白、16色和256色
的彩色图像,采用IZW压缩算法,压缩比高。

?TIF格式:由Aldus和Microsoft合作开发。最
初用于扫描仪和桌面出版业。分为压缩和非压

缩两种。

?JPG和PIC格式:是Apple Mac机器上使用的格
式。最大特点是文件非常小,而且可以调整压

缩比,但显示较慢,有一定的失真。
?PCD格式:是Kodak开发的照片文件格式,是

Photo-CD的专用存储格式,一般存储在CDROM上,读取需要Kodak提供的专门软件。

4.6 显示系统及数字像机
? 显示系统负责计算机的所有显示输出,它主要由显 示器和显示适配器组成。 ? 显示器的英文名称是Monitor , “监视器” ,其作 用是将主机发出的信号经过一系列处理后转换成光 信号,最后在屏幕上显示出各种文字、图形、图像 等信息。

? 目前市场上的显示器主要有两类:一类是 CRT显示 器;另一类是LCD显示器,LCD具有许多优点,它 占空间小、低功耗、低辐射、无闪烁,可以降低视 觉疲劳。

CRT显示器的工作原理
CRT显示器的核心部件是显像管,它直接决定了

显示器的价格、性能和显示质量。它的基本工作
原理是将显像管内部的电子枪阴极发出的大量电

子束,经过强度控制、聚焦和加速,形成很细的
电子流,高速、定点地去轰击荧光屏。荧光屏上 的荧光粉经过电子的轰击发出亮光。荧光屏上的 每一点(像素)都是由红、绿、蓝三原色组合而 成,电子枪发出的三束电子按不同强度比例点亮

荧光粉从而合成各种颜色。

数字像机
数字相机是一种新型的图像输入设备,它与普通 照相机的主要区别有两点: 1 、是存储的照片不是实际的影像,而是一个个 数字文件; 2 、是存储体不是传统的胶卷,而是数字化存储 片。 其特点有:由于每张照片以数字文件的形式存储, 所以可直接导入计算机中,以便利用计算机对其 进行加工、展示、永久性保存,并且具有保留时 间长,质量高,可以无损坏地无限次复制等优点。

第5章

视频信息处理技术

什么是“视频”?
视频动态图像是由多幅连续的单帧图 像序列构成的,当每一帧图像为实时 获取的自然景物或活动对象时,称之 为动态影像视频,简称动态视频或视

频(Video)。

数字视频
数字视频就是对模拟视频信号进行数字化后 的产物。模拟信号在时间和幅度上具有连续 性,它是基于模拟技术以及图像显示的国际 标准来产生视频画面的。它具有成本低、还 原性好等优点,因此,我们从电视机中看到 的大自然风景会让你具有身临其境的感觉。

数字视频的优点 ?可无限复制而不失真
?可进行视频编辑, 创意 ?可将视频溶进计算机环境

几个概念
?电视扫描:逐行扫描、隔行扫描

?长宽比例:4:3、16:9
?同步信号:水平时序信号、垂直时序信号

?水平分辨率:取决于扫描敏感点的大小
?垂直分辨率:取决于一帧的扫描行数

?扫描频率:指屏幕刷新的速度

电视制式
所谓电视制式,实际上是一种电视显示的标 准。不同的制式,对视频信号的解码方式、 色彩处理的方式以及屏幕扫描频率的要求都 有所不同,因此如果计算机系统处理的视频 信号的制式与连接的视频设备的制式不同, 在播放时,图像的效果就会有明显下降,甚 至根本无法播放 。

NTSC制式
NTSC 是 Notional Television System

Committe 的缩写,译为国家电视制式委 员会。它是 1953 年美国研制成功的一种 兼容的彩色电视制式。它规定每秒 30 帧, 每帧 526 行,水平分辨率为 240~400 个像 素点,隔行扫描,扫描频率 60Hz ,宽高 比例4:3。

PAL制式
PAL是phase Alternate Line的缩写,译为
相位逐行交换。它是前联邦德国1962年制

定的一种电视制式。它规定每秒25帧,每
帧625行,水平分辨率为240~400个像素点,

隔行扫描,扫描频率50Hz,宽高比例4:3。

SECAM制式
SECAM是Sequential Color Memory System 的缩写,译为顺序传送彩色存储。它是法国 于1965年提出的一种标准。它规定每秒25帧, 每帧625行,隔行扫描,扫描频率为50Hz, 宽高比例4:3。上述指标均与PAL制式相同, 不同点主要在于色度信号的处理上。

HDTV
HDTV是High Definition TV的缩写,译为 高清晰度电视。它是目前正在蓬勃发展的 电视标准,尚无完全统一,但一般认为: 宽高比例 16:9,每帧扫描在 1000行以上, 采用逐行扫描方式,有较高扫描频率,传 送信号全部数字化。

全屏幕视频
全屏幕视频是指显示的视频图像充满整 个屏幕,因此它与显示分辨率有关,对 于标准VGA全屏幕意味着640?480分辨率, 而对于Super VGA则可以是800?600或 1024?768等分辨率。在Windows环境中, 提供了播放视频文件默认窗口大小的设 置。

全运动视频
全运动视频是指以每秒30帧的 速度刷新画面,只有到达这个 速度,才不会产生闪烁和不连

贯的现象。

动态图像数据的特点
?动态图像具有时间连续性,故非 常适合于表示“过程”; ?数据量大; ?动态图像的帧与帧之间具有很强 的相关性 ; ?动态图像对实时性要求得很高

视频信号的获取方法
摄象机

模拟视 频信号

A/D 视频卡

数字视 频信号

录象机

压 缩

存 储

电视机

视频信息的处理
对视频信息可以实施的编辑操作包 括剪切、复制、粘贴片断,与音频 片段合成,调整叠加透明度,增加 场景过渡特技,滤镜效果、叠加字

幕等。

视频文件的格式
?AVI文件格式:AVI是Audio Video Interleaved的缩写 ?MOV文件格式:MOV文件格式是Quick Time视频处理软件所选用的视频文件格式 ?MPG文件格式:是采用MPEG方法进行压缩 的全运动视频图像文件格式 ?DAT文件格式:是VCD和卡拉OK CD数据文 件的扩展名,也是基于MPEG压缩方法的一 种文件格式

视频卡
所谓视频卡就是PC机上用于处理视 频信息的设备卡,其主要功能是将
模拟视频信号转换成数字化视频信 号或将数字信号转换成模拟信号。

视频卡的分类
? 视频采集卡:用于将摄像机、录像机等设备播放的

模拟视频信号经过数字化采集到计算机中;
? 压缩/解压缩卡:用于将静止和动态的图像按照

JPEG/MPEG标准进行压缩或还原;
? 视频输出卡:用于将计算机中加工处理的视频信息 转换编码,并输出到电视机等设备上; ? 电视接收卡:用于将电视机中的节目通过该设备卡 的转换处理,在计算机的显示器上播放。

流媒体技术简介
近年来,互联网的应用规模迅速扩展,更 多的宽带用户希望能够通过网络去观看电 影、收听广播、进行视频会议等。如果单 纯的希望带宽的扩充显然是不现实的,因 此要实现网上音频、视频传播就必须在传 播文件本身下功夫,流媒体技术就在这样 的背景下应运而生。

流媒体的概念
流媒体(StreamingMedia)简单来说就是应用
流媒体技术在网络上传输的音频、视频等多

媒体格式的文件。而流媒体技术就是把连续
的视频和音频信号经过压缩处理后放上网站

服务器,让用户实时的观看、收听,而不需
要把整个文件下载到自己机器后才可以使用

的的网络传输技术。

流媒体技术的基本原理
? 首先,流媒体技术采取了降低音频、视频文 件的品质并且对文件进行高效压缩的手段, 使得音频、视频文件的体积大大减小以适应 网络的传输。 ? 其次,流媒体技术先在客户端的电脑上创造 一个缓冲区,在播放媒体文件之前预先下载 一段资料作为缓冲,避免播放的中断。 ? 科学家还制订了一些专门针对于音频和视频 文件的网络传输协议,例如实时传输协议 (RTP)和实时流协议(RTSP)等。

流媒体播放平台和文件格式
1.Realnetworks公司 Realnetworks是流媒体技术的先行者,它最大优势在于其采 用了自己开发的RTSP协议来传输多媒体数据,并且采用专门 的服务器来做为流媒体服务器,该公司主要开发的流媒体文 件格式有RM、RA、RAM。 2.Mircosoft公司 Mircosoft 公司在Windows系列操作系统中捆绑了自己的媒体 播放器Windows Mediap1ayer,这使得Windows Mediap1ayer 占据了很大一部分市场份额。该公司主要开发的流媒体文件 格式有ASF、ASX、WMA、WMV等。 3.App1e公司 相对而言,App1e的流媒体播放平台Quicktime在完整性和兼 容性上处于劣势,而且价格相对较高。只是在一些习惯使用 MAC计算机和有其他特殊要求的用户中有一些市场,很多专 业美工设计人员还是习惯于使用Quicktime作为App1e MAC平 台上的首选媒体播放器。

流媒体技术的应用
1.网络电台和电视台 流媒体技术支持单播、组播、点播、广播的播放方式,同一 台流媒体服务器可以同时接受多个用户进行随意的点播,也 可以像广播电台和电视台一样随时向网络上发布音频和视频 信息。 2.网络直播 流媒体技术的发展使得网络直播成为可能。 3.远程会议 基于流媒体技术平台的远程会议系统能够轻易的使处在全球 不同国家的人能够通过网络进行面对面的交流。 4.近程教育 通过网络进行远程教学是一个综合性的系统,采用流媒体技 术进行远程教学的系统能够为教师和学生提供更加直接的交 流方式。学生可以看到教师的讲解过程,而教师也可以像在 真实的课堂中一样提问学生,这使得教学的效果更好。

第6章 光存储技术

磁存储技术
利用磁技术对数据进行读写。对应的存储 介质为磁盘,磁带等。

磁存储介质的优缺点
存储密度高、易于读写,但长期保存也存在 着风险性,气候环境、磁环境、人为因素都 有可能破坏磁记录,造成不可挽回的损失。

光存储技术
随着激光技术的产生和发展,科技工作者研
究出了利用激光进行高密度数据存储的技术

光存储技术是通过光对数据进行写入和读出
的存储技术。由于使用的是激光,因而对应

的存储介质--盘称作光盘。

光盘系统
光盘系统是由光盘驱动器和 光盘片组成。驱动器是用于

读/写信息的设备,而光盘片
是用于存储信息的介质。

光盘的分类
? 只读光盘(CD-ROM)
? 一次写多次读光盘(CD-R,WORM) ? 可擦写光盘

光存储介质特点
?密度高,存储容量大 ?采用非接触方式读/写信息
? ? ? ? 能自由更换光盘 不易划伤 无磨损 可长期保存信息

光盘的ISO标准——红皮书

CD-DA:
CD Audio 激光唱盘标准由荷兰 Philips公司和日本Sony公司共同制

订内容为记录音频的标准。

光盘的ISO标准——黄皮书

CD-ROM:
CD-ROM标准由荷兰Philips公司 和日本Sony公司等几家公司共同

制订规定了CD盘上记录数据的方
式。

光盘的ISO标准——绿皮书

CD-I:
CD-I是由Philips公司和Sony公司共 同制定的“绿皮书”标准,主要用

于交互式多媒体系统,存放采用
MPEG压缩的音频和视频信息。

光盘的ISO标准——橘皮书
CD-R:
可写入光盘标准。 根据这个标准将数据一次或多次写入空白 的 CD 盘。

光盘的ISO标准——白皮书
VCD:

用于存放视频图像和电影。该标准使
用MPEG压缩技术可在普通的CDROM盘上存储74分钟的全动态视频图 像和CD音质的同步声音。

6.2 CD-ROM驱动器
光盘驱动器可以分为:

CD-ROM(只读光盘驱动器)
CD-R(可写光盘驱动器)

CD-R/W(可擦写光盘驱动器)
DVD-ROM(DVD只读光盘驱动器)

DVD-RAM(可反复擦写DVD光盘存储器)

6.4

CD-ROM盘的制作过程

预处理

制作母盘

复制

6.5 DVD技术
DVD是“Digital Video Disc”的缩写,中文名 称为“数字视频光盘”。 DVD有以下优点: ?容量大,单面单层光盘容量高达4.7GB,双面 双层光盘容量高达17GB; ?视频图像质量好; ?采用Dolby Digital格式,通过Dolby AC-3系统 的5.1声道设计,能够产生5个声道的高品质环 绕立体声; ?可以兼容已有的 CD-Audio 、 CD-ROM 、 CDR等多种格式的光盘,性能价格比高。

DVD产品的规格
? DVD-ROM:只读型DVD
? DVD-Video:用来读取数字影音资料的 ? DVD-Audio:用来读取数字音乐信息的DVD ? DVD-R:一次写入数据的DVD规格 ? DVD-RAM:可擦写型的DVD

DVD的特点
? DVD光盘的生产成本低 ? DVD光盘易于携带和保存 ? DVD可播放高分辨率的高画质动态影像 ? DVD采用比较流行的数字环绕音效规格 ? DVD-Video提供4:3和16:9两种屏幕比例 ? DVD-Video可提供多种语言配音和字幕 ? DVD驱动器可读取CD-ROM光盘

DVD盘片
DVD的碟片的大小与 CD-ROM相同,最大的 特点之一在于可以单面存储,也可以双面存 储,所以DVD的碟片分为四种:

单面单层(DVD-5)容量为4.7GB、
单面双层(DVD-10)容量为9.4GB、

单面双层(DVD-9)容量为8.5GB、
双面双层(DVD-18)容量为17GB。

DVD-ROM驱动器的倍速
与CD-ROM驱动器类似,DVD-ROM的倍速

也是用来简单衡量DVD-ROM驱动器速度的
一个指标,但DVD-ROM驱动器的倍速并不

等于CD-ROM驱动器的倍速。对一些DVDROM驱动器来说,标识的倍速实际上只是最 大倍速。

防盗版措施
为了防止盗版现象的出现,DVD采用了分区制。即将全球分 为6个区域,规定各个区域的DVD机只能播放区号相同的 DVD碟片。 第1区:美国、加拿大、东太平洋岛屿;

第2区:日本、西欧、北欧、埃及、南非、中东;
第3区:中国台湾、中国香港、韩国、泰国等东南亚国家;

第4区:澳洲、新西兰、中南美洲、南太平洋岛屿;
第5区:俄罗斯、蒙古、印度半岛、中亚、东欧、朝鲜等; 第6区:中国大陆


更多相关文档:

多媒体技术应用总结

多媒体技术应用总结_其它课程_高中教育_教育专区。媒体 (medium) 在计算机领域有两种含义: 一是之存储信息的实体, 如磁盘、 光盘、磁带、半导体存储器等介质;二是...

多媒体技术应用反思总结

多媒体技术应用反思总结课程改革给信息技术教师带来了许多新的教育理念、教学内容、教学方式和方法,对信息 技术教师提出了许多新的要求, 给信息技术教师工作的创新提供...

多媒体技术应用实训总结

多媒体技术应用实训总结_教育学_高等教育_教育专区。实训报告 课 程: 多媒体技术应用 专业: 物联网应用技术 系(分院) : 信息学院 班姓学级: 名: 号: 指导...

多媒体技术应用_知识点总结

多媒体技术应用_知识点总结_其它课程_高中教育_教育专区。青岛一中 信息技术 学业水平考试 复习材料(二) 选修 多媒体技术应用 第一章 认识多媒体技术 知识点梳理:...

《多媒体技术应用》知识点汇总

P4 多媒体技术就是计算机综合处理声音、文本、图像等信息的技术。 使用计算机进行综合处理,建立逻辑关系和人机交互是多媒体技术的核心。 2.多媒体技术的主要特征(要...

高中学业水平测试-多媒体技术应用-知识点总结

高中学业水平测试-多媒体技术应用-知识点总结_其它课程_高中教育_教育专区。多媒体技术应用 复习提纲 第一章 认识多媒体技术 知识点梳理: 1.什么是多媒体技术? ...

多媒体技术应用实验报告2

多媒体技术应用实验报告2_学习总结_总结/汇报_实用文档。陕西理工学院实验报告(2015——2016 学年第 2 学期)院(系) 教科学院 专业班级 教技 130 学号 年 4 ...

多媒体技术应用模块反思总结

多媒体技术应用模块教学体会 经过这几年的实践和探索, 我发现相比较算法与程序...总结特点如下: (1)涉及的内容与学生的生活尤其是与网络中比较热的内容关系密切...

多媒体报告总结

多媒体技术应用制作报告——红学 年级专业:2010 级电子商务 姓名:张婷 学号:20101846074 课程:多媒体技术应用教程 多媒体报告总结 —ppt 实践报告前言: 多媒体技术...
更多相关标签:
多媒体技术及应用 | 数字媒体应用技术 | 多媒体技术与应用 | 多媒体技术应用 | 多媒体技术应用论文 | 数字媒体应用技术专业 | 多媒体技术的应用 | 多媒体技术应用领域 |
网站地图

文档资料共享网 nexoncn.com copyright ©right 2010-2020。
文档资料共享网内容来自网络,如有侵犯请联系客服。email:zhit325@126.com