1、《多媒体素材采集和处理》试验教学指导书 一、试验目标: 学会使用扫描仪获取书页影像并将之转换为电子文档;掌握图像、音频多媒体素材采集和编辑方法。 二、试验内容: 1.学会使用扫描仪扫描影像方法。 2.掌握扫描软件Scanwizard 5、OCR软件尚书七号使用 3.掌握在Windows环境下录制、播放和编辑声音文件方法。 4. 掌握Goldwav音频录制和编辑技巧。 三、试验仪器设备: Microteck ScanMaker 3860扫描仪、计算机 、耳麦。 四、试验原理: 扫描仪是一个获取影像装置,并将之转换为计算机能够显示、编辑、储存和输出数字格式。这里所说影像是
2、指照片、文字页、图形和插画等,甚至如硬币或纺织品等三维物件全部算是影像一个。实际上,这意味着扫描仪能够完成以下工作: l 在文件中结合美术图形和照片。 l 将印刷文字扫描输入到文书处理软体中,免去重新打字。 l 将传真文件扫描输入到数据库或文书处理软体中储存。 l 在多媒体中加入影像。 l 在摘要中结合影像资料使其能更有效表示专题。 扫描仪可区分为两种类型: l 平台式扫描仪,用来扫描照片和印刷品.平台式扫描仪全部含有一个玻璃面,用来摆放扫描稿件。 l 透射式扫描仪,用来扫描幻灯片和底片。 在我们试验中使用中晶Microteck ScanMaker 3860是一个经典平台
3、式扫描仪。 在扫描系统中,扫瞄仪仅是组成整个系统其中一部份,除了扫描仪以外,还需要其它组件: ①一条特定连接线,连接扫描仪和电脑。②控制扫描仪工作扫描软件。③用影像编辑软件将扫描影像结合到您工作中;或用文字辨识软件将扫描文字结合到您工作中。④一个适宜屏幕用来显示彩色或灰阶影像。⑤用来输出您工作结果输出设备,如印打印机。 工作原理:对原稿进行光学扫描,然后将光学图像传送到光电转换器中变为模拟电信号,又将模拟电信号变换成为数字电信号,最终经过计算机接口送至计算机中。 扫描仪扫描图像步骤是:首先将欲扫描原稿正面朝下铺在扫描仪玻璃板上,原稿能够是文字稿件或图纸照片;然后开启扫描仪驱动程序后,安
4、装在扫描仪内部可移动光源开始扫描原稿。为了均匀照亮稿件,扫描仪光源为长条形,并沿y方向扫过整个原稿;照射到原稿上光线经反射后穿过一个很窄缝隙,形成沿x方向光带,又经过一组反光镜,由光学透镜聚焦并进入分光镜,经过棱镜和红绿蓝三色滤色镜得到RGB三条彩色光带分别照到各自CCD上,CCD将RGB光带转变为模拟电子信号,此信号又被A/D变换器转变为数字电子信号。 至此,反应原稿图像光信号转变为计算机能够接收二进制数字电子信号,最终经过串行或并行等接口送至计算机。扫描仪每扫一行就得到原稿x方向一行图像信息,伴随沿y方向移动,在计算机内部逐步形成原稿全图。 人耳听觉特征包含生理声学和心理声学方面问题。人
5、耳可听声音频率范围为20Hz至20KHz,但人耳对不一样频率声音敏感程度是不一样,中频段(3 kHz~5 kHz)最敏感,幅度很低信号全部能被人耳听到。低频区和高频区较不敏感,能被人耳听到信号幅度比中频段要高得多。 话音信号是经典连续信号,不仅在时间上是连续,而且在幅度上也是连续。在时间上“连续”是指在一个指定时间范围里声音信号幅值有没有穷多个,在幅度上“连续”是指幅度数值有没有穷多个。我们把在时间和幅度上全部是连续信号称为模拟信号。 声音数字化就是将模拟(连续)声音波形数字化(离散化),方便利用数字计算机进行处理,关键包含采样和量化两个方面。数字化音频质量取决于采样频率和量化位数
6、这两个关键参数。采样频率是对声音波形每秒钟进行采样次数。人耳听觉频率上限在2OkHz左右,依据采样理论,为了确保声音不失真,采样频率应在40kHz左右。常常使用采样频率有11.025kHz、22.05kHz和44.lkHz等。采样频率越高,声音失真越小、音频数据量也越大。量化数据位数(也称量化级)是能够用来表示每个采样点数据范围,常常采取有8位、12位和16位。比如,8位量化级表示每个采样点能够表示成256个(0-255)不一样量化值,而16位量化级则是指每个采样点可表示成65536个不一样量化值。量化位数越高,表示区分声音差异更细致,所以音质越好,数据量也越大。 声音数字化信息量=
7、 采样频率(Hz/s)×量化位数(bit)×声道数 五、试验步骤 l 第一部分:扫描仪使用 步骤 1. 安装 ScanWizard 5 驱动程序 对于首次使用扫描仪,请首先打开镜头锁,对于Scanmaker 3860来说,镜头锁在扫描仪底面右下角,首先使用镊子或尖嘴钳把阻挡物拔出,然后把镜头锁开关向外拨动到“ON”位置。(注:试验用扫描仪均已打开镜头锁,此步可跳过)以下图所表示: 根据扫描仪所附安装指南和光盘片上安装界面,将ScanWizard 5 扫描仪驱动程序安装到Windows系统中。(注:本试验所用计算机系统已安装扫描仪驱动,此步可跳过。) 步骤 2. 将扫描稿件放
8、到合适位置 把扫描槁件(照片、书页等)面朝下,放到扫描仪玻璃面板上,摆放稿件时,尽可能靠齐扫描玻璃一个侧条,可确保稿件摆入端正。因为扫描仪会生成一个倒立像,所以放入待扫描材料时,应倒放在玻璃面板上。 步骤 3. 实施 ScanWizard 5 扫描软件 直接在桌面 ScanWizard Easy 图示 上点两下实施,或从“开始”->“程序”->“ScanWinzard 5”开始实施扫描程序。 扫描程序默认界面以下图所表示: 预览:当你一开始进入标准控制模式,程序预设会自动预览你稿件。假如你想取消此功效,能够隶属性 中取消即可。 到Web按钮:扫描到按钮能够切换为 到Web 按钮,
9、只要按住按钮两秒钟即会出现副选单. 原稿:选择待扫描材料材质 扫描类型:输出色彩位数 输出目标:图片输出到何处,本试验选择输出到文件 输出百分比:选择输出影像输出尺寸百分比大小. (50%, 75%, 100%, 150%, 或 200 %) 调整:调整对比度、锐度等 属性:扫描仪参数设定. 界面上各按钮功效以下表所表示: 图标 功效 移动 / 缩放(放大/缩小) 信息按钮 改变窗口尺寸 切换到高级模式 扫描仪信息 帮助说明 最小化 关闭程序 点击按钮后ScanWizard切换到高级模式,界面图所表示:
10、 可依据具体扫描要求选择不一样扫描参数,选择参数时,请注意以下几点:①对于照片,选择300ppi分辨率即可达成良好效果,无须选择最高1200ppi,不然会使扫描出图像文件过于庞大,甚至会达成上百光兆大小。②对于大头贴等较小等扫描材料,能够把缩放比设为大于100%,以使输出图像足够大。③假如待扫描材料很多,单张面积又比较小,能够把多张待扫描材料一块放到玻璃面板上,摆放时,注意待扫描材料间留出一定间距,方便于后期裁切,一次扫描输出,再使用图像处理软件(比如PhotoShop)进行裁切。比如能够玻璃面板上摆放多张照片,然后一次扫描到一张图像上,然后进行裁切。 步骤 4. 扫描稿件 进入Scan
11、Wizard 5 后,先预览你稿件, 假如发觉摆入稿件不端正,打开盖板,把稿件放正后,再进行预览,直到摆放端正为止。 步骤 5. 储存稿件 依据稿件材质类型,设定扫描参数。设定完成后,能够点击“扫描到”按钮直接存档,或是把影像传送到别地方做其它应用,如打印机、电子邮件、OCR及Web。 步骤 6. 离开 ScanWizard 5 扫描软件只关键点击窗口右上角 离开 按钮 即可。 l 第二部分:OCR软件使用 一、获取图像: 有两种方法获取图像,扫描图像或打开计算机中已经存在图像文件。 扫描图像之前应设置好保留扫描图像文件路径、图像文件名、图像文件名后缀。设置图像路径,能够直接在
12、 窗口中键入路径名,或单击 按钮,在浏览路径窗口中选定路径。 图像名命名规则为: 若干位字母前缀+3位数字,3位数字范围从000到999,每扫描一幅图像后系统会自动在数字尾数加1,图像名前缀取“hw”,图像名数字尾数取“003”,图像名后缀取tif,则目前图像名为hw003.tif,下一幅图像名自动改为hw004.tif;假如目前图像名尾数达成最大值,如hw999.tif,则下一幅图像名自动改回为hw000.tif,所以相同路径下相同文件名前缀文件数最多为1000幅。 假如扫描过程中弹出“此文件已经存在,是否替换该文件?”提醒框,说明该路径下已经存在同名旧图像文件,假如旧图像文件不再需要
13、择选择“是”,以新扫描图像替换旧图像;假如还需要旧图像文件,则选择“否”,并在“另存到”窗口中重新设定路径或图像文件名。不一样批次扫描图像最好分别保留于不一样路径之下,或在相同路径下而选择不一样图像名前缀,以预防相同路径下相同文件名前缀文件数超出1000幅。 图像文件名后缀只能取bmp,tif,jpg 三种图像格式,通常情况下,黑白二值图像保留为tif格式,灰度彩色图像保留为jpg格式将占用较少硬盘空间。比如,C:\hwocr\image\hw003.tif是一个完整正当图像文件名。 单击工具栏上按钮或单击“文件”菜单中“扫描”命令,经过扫描仪开始批量扫描文件;单击工具栏上按钮或单击“文
14、件”菜单中“打开图像”命令,打开计算机中已经扫描好图像文件。 二、图像处理: 为提升识别率,对图像进行图像反白,自动倾斜校正,调整边框,去噪音(如麻点、下划线等),表格画线等处理。 三、版面分析: 单击工具栏中按钮,或单击“识别”菜单中“版面分析”命令,自动对图像版面布局、内容进行分析了解,切分图像页,判别图像框版面属性(横栏、竖栏、表格、图像),并以不一样颜色线框标识图像框属性。对分析错误版面能够手动调整,方法为,先以鼠标选中需要调整版面块,再调整版面块边框改变大小,或单击工具栏上属性按钮(横栏、竖栏、表格、图像)改变该版面块属性。 四、识别图像: 单击按钮或单击“识别”菜单中
15、开始识别”命令,根据版面属性(横栏、竖栏、表格、图像),自动对图像文件管理器选择图像进行批量识别。 五、校对: 经过对比识别结果文本和原图像,以发觉识别错误文字。用户可按Ctrl+Tab、Shift+Tab组合健直接查找系统用醒目标颜色标出可信度不高文字,进行校对。 六、版面还原: 单击“输出”菜单中“到指定格式文件”命令,将识别并修改好文本输出、还原成可供计算机阅读和查询检索RTF、HTML、XLS、TXT 格式电子文档。 七、删除不再需要数据文件: 系统在识别处理过程中生成部分数据文件,这些文件和相关图像文件放在同一文件夹之下,这些文件以对应图像文件名字命名而分别加
16、上不一样后缀,包含 *.bki,*.pst,*.tmp。比如对于图像文件hw003.tif,对应生成数据文件有hw003.tif.bki(不一定存在该文件),hw003.tif.pst,hw003.tif.tmp。当这些图像识别结果不再需要时,用户能够使用Windows资源管理器删除这些文件。 l 第三部分 使用Windows“录音机”录制、编辑声音 Windows系统提供了方便声音处理工具,直接利用附件中“录音机”,就能完成声音录制、播放和部分简单编辑功效。 一、使用Windows录音机录制声音 在Windows系统中,能够经过“录音机”录制人语音、CD光盘音乐和任何能够输入声音卡外
17、来声音源声音,并将录制声音以一个标准文件格式WAV存放起来。 步骤1. 将麦克风插头插入声音卡麦克风(MIC)插座,然后试一下麦克风,确保在音箱中能听到麦克风中传出声音。 假如听不到麦克风中声音,则实施“程序”->“附件”->“娱乐”->“音量控制”。将麦克风选项下静音取消,然后试一下有没有声音。注意,试好声音以后,要将麦克风选项下静音重新设置好。同时,能够调整一下麦克风音量。方法是在“音量控制”菜单中,选择“选项”中“属性”命令,将“调 节音量”从“播放”改成“录音”,按“确定”后,可将“音量控制”窗口改成“录音控制”窗口。通常,麦克风音量设置在第六级,音量不要太小,不然,因为录音
18、时输入音量太小,录制好声音回放时效果不好。 步骤2. 开启“录音机”程序,实施“程序”->“附件”->“娱乐”->“录音机”程序。Windows 98下“录音机”程序操作界面和真实录音机很相同,使用很直观和方便。底部从左到右,依次为倒带、快进、播放、停止和录音按钮。录音机最大录音能力为60秒。 录音机正在录音 步骤3. 开始录音,用鼠标左键单击录音按钮,对着麦克风讲话,即可完成录音工作。讲话时,在操作界面上能够看到声音波形和目前已经录制时间,伴随人讲话,应该能够看到波形改变。讲完后,单击停止按钮。 步骤4. 保留录音,在“录音机”程序操作界面菜单上选择“文件”中“保留”命令,在
19、弹出对话框中输入声音文件名,然后保留,就能够将已经录入声音以WAV文件格式保留在指定位置。 二、使用Windows “录音机”播放音频文件 注意:使用Windows “录音机”只能用来播放WAV格式声音文件。 步骤1. 在“录音机”操作界面菜单上实施“文件”中“打开”命令。 选择要播放声音文件。 步骤2. 单击“录音机”中“播放”按钮,播放已经打开声音文件。 操作界面上位置滑块指示目前播放位置,能够随意地移动滑块到新位置进行播放。 三、使用Windows “录音机”编辑音频文件 录制声音或从其它路径得到声音文件并不总是能达成理想效果,我们能够对其进行编辑修改,使之达成我们要
20、求。Windows “录音机”能够对已经有WAV格式声音文件进行裁剪、合并、混音和属性转换。 1、对声音裁剪 Windows “录音机”提供了两种声音裁剪方法。一个是剪去目前点以前声音,另一个是剪去目前点以后声音。经过这两种裁剪方法综合使用,能够得到我们需要声音片断。 裁剪声音操作过程以下: (1)开启“录音机”程序并打开需要编辑WAV格式声音文件。 (2)将滑块移到期望保留声音开始位置。 (3)实施“录音机”菜单“编辑”中“删除目前位置以前内容”命令,在弹出窗口中单击“确定”按钮,即可剪去目前位置前不要声音。 (4)将滑块移到期望保留声音结束位置。 (5)实施“录音机”菜
21、单“编辑”中“删除目前位置以后内容”命令,在弹出窗口中单击“确定”按钮,即可剪去目前位置后不要声音。 (6)试听一下,检验声音是否在指定位置开始和结束,假如不对能够放弃这些操作,重新打开该声音文件重新裁剪。假如声音位置符合要求,就能够保留裁剪好声音,方法同上。 2、 合并多个声音文件 假如期望将两个WAV格式声音文件中声音合并为一个声音文件,比如,我们知道“录音机”程序录音功效最多只能提供60秒钟录音时间,假如需要录制声音长度超出了这个时间限制,那就不可能一次性录制完成。能够将这一段声音分几次录制,分别保留起来,然后再将她们合并成一个声音文件,这个合并起来声音数据文件是没有60秒钟时间长
22、度限制。 使用Windows “录音机”合并多个声音文件有两个不一样方法,一个方法是从其它声音文件中将声音插入到目前打开声音文件指定位置后面,其操作步骤以下: (1)开启“录音机”程序,并打开第一个声音文件。 (2)将滑块移动到第二个声音文件准备插入位置。 (3)实施“录音机”菜单“编辑”中“插入文件”命令。 (4)在弹出“插入文件”窗口中,选中第二个声音文件后,单击打开按钮。 (5)保留合并后声音文件。 另一个方法,则是利用Windows系统剪贴板,因为剪贴板除了能够储存文字、图象等信息外,也能够储存声音,所以,一样能够将剪贴板中声音插入到目前打开声音文件指定位置后面。
23、利用这种方法合并声音文件操作步骤以下: (1)开启“录音机”程序,并打开第二个声音文件。 (2)实施“录音机”菜单“编辑”中“复制”命令,将这段声音复制到剪贴板上。 (3)打开第一个声音文件,并将滑块移动到第二个声音文件准备插入位置。 (4)实施“录音机”菜单“编辑”中“粘贴插入”命令。 (5)保留合并后声音文件。 3、 两个声音文件叠加 为了增强声音效果,能够将两种不一样声音进行叠加,即混音。混音操作步骤是: (1)开启“录音机”程序,并打开第一个声音文件。 (2)将滑块移动到准备混合第二个文件开始位置。 (3)实施“录音机”菜单“编辑”中“和文件混合”命令。
24、 (4 在弹出窗口中,选择第二个声音文件,单击“打开”按钮。 (5 试听一下,再保留混音后声音文件。 声音文件混音,除了用“和文件混合”命令外,还能够使用“粘贴混合”命令,方法和声音文件合并时“粘贴插入”类似。 l 第四部分 GoldWave音频编辑和处理 一、录制诗朗诵或课件讲解词 步骤1. 开启GoldWave,使用“文件/新建”命令打开“新建声音”窗口,设置录音时声道数、采样率,依据诗朗诵或课件讲解词具体内容预设录制声音“初始化长度”。 步骤2. 使用“工具/控制器”命令,在“控制器”窗口点击“设置控制器属性”按钮或按F11键,在“录音”选项卡中“录音模式”选为“无限制
25、在“音量”选项卡中选择“麦克风”,并合适调整麦克风录音音量大小。 步骤3. 点击控制器窗口中“开始录音”按钮,开始录音,编辑窗中显示录制声音波形。录音结束后,按“停止录音”按钮,录音结束,并形成一个“无标题”音频文件。 步骤4 . 选择“文件/保留”命令,将录制声音命名和保留。 二、音频特效制作 1、音量效果 步骤1. 在GoldWave中打开刚才录制诗朗诵或课件讲解词,选择“效果/音量”中“更改音量”命令,在“更改音量”窗口,拖动音量滑块,0db表示原始音量大小,声音既不放大也不衰减。向右拖动音量滑块,分贝值大于0,声音被放大,分贝值越高,音量越大。向左拖动音量滑块,分贝值小
26、于0,声音被衰减,分贝值越低,音量越大。依据录音情况,合适拖动音量滑块,对录制诗朗诵或课件讲解词进行增益或衰减处理。利用绿色播放按钮,视听目前设置效果。 步骤2. 在GoldWave中打开音频文件(如吉祥三宝),按住并拖动鼠标左健,选择音频文件开始部分(选择声音片段以高亮度显示),选择“效果/音量”中“淡入”命令,合适调整初始音量,利用绿色播放按钮,视听目前设置效果,满意后单击“确定”,为音频添加淡入效果。 步骤2. 用鼠标拖选音频文件结尾部分,选择“效果/音量”中“淡出”命令,合适调整最终音量,利用绿色播放按钮,视听目前设置效果,满意后单击“确定”,为音频添加淡出效果。 2、回声效果
27、 步骤1. 在GoldWave中打开音频文件(如荷塘月色),选择“效果/回声”命令,弹出回声窗口。 步骤2. 合适调整参数设置,利用绿色播放按钮,视听目前设置效果,直到满意为止。 3、改变音高 步骤1. 在GoldWave中打开音频文件(如隐形翅膀),选择“效果/回声”命令,弹出回声窗口。 步骤2. 左右拖动参数设置滑块,降低或升高音调,利用绿色播放按钮,视听目前设置效果。注意:若选择“百分比”调整参数,数值100表示原始音高,大于100,音调升高,小于100,音调降低。若选择“半音”调整参数,数值0表示原始音高,大于0,音调升高,小于0,音调降低。 4、声相效果 步骤1.
28、 在音频文件(如隐形翅膀)中用鼠标选择部分片段作为选区,选择“效果/立体声/声相”命令,弹出声相窗口。 步骤2. 将声相包络线调成上图所表示形状,视听声音在声场中左右位置改变效果。 5、声音文件格式转换 步骤1. 选择“文件/批处理”命令,弹出“批处理”窗口。 步骤2. 利用“添加文件”按钮,添加欲转换格式声音文件,单击“另存类型”下拉按钮,选择新格式。 步骤3. 选择窗口中文件夹选项卡,在其中选择新生成文件保留路径,是否覆盖已存在文件,设置完成后,单击“开始”,即可生成和保留新格式音频文件。 六、试验注意事项 l 用好原稿 好原稿对于得到高品质扫描结果是十分关键,即使
29、您影像扫描软件和影像编辑程序含有改善影像品质工具,也不过是亡羊补牢做法,对于那些焦距不准、污损或感光很差影像,则不管花费多大精力进行处理全部不会有多大改善 l 保持扫描仪洁净 在扫描之前,要确定您扫描仪玻璃面板是洁净.假如发觉扫描仪玻璃面脏了,请用洁净软布沾玻璃清洁剂擦拭即可。 l 选择正确扫描类型和扫描设置 扫描前,先设定正确影扫描类型、合适分辨率和缩放百分比。 假如影像是单一颜色黑白影像,请选择黑白影像类型。 对于黑白照片.用灰阶影像类型进行扫描,能够得到较小影像档。 假如想打印车效果为黑白色,则在灰阶下扫描。 最终,在扫描时候,请设定合适扫描解析度,能够降低您影像档案大
30、小。 l 分辨率选择 选择正确品质原因标尺缩图,打印屏影像少于或等于133线per inch,设置品质原因到2;高于133线pei inch,设置到1.5;contone打印机(连续调色打印机,比如染料升华打印机)设置到1.0。 假如你输出影像到显示器(比如多媒体工作),你不需要把扫描影像分辨率高和72 ppi,因为显示器只能显示影像到72 ppi。高分辨率在显示器上显示不会有什么差异且只会使得文档过大。 越高分辨率,影像文挡也就越大,一个8.5" x 11" 彩色照片以75 ppi 扫描大约会有1.6M。成倍分辨率到150 ppi将会4倍增大文档,相当于6.3M!分辨率到300 ppi,大小将为26.2M。 若需要可选择尽可能低但可提供很好影像品质分辨率以保持易管理文档大小。 两个影像以不一样分辨率扫描,但打印出效果无大区分,这是因为全部打印机和印刷全部有她们最高分辨率。最终大小太小也无需在150 ppi。 l 正确使用影像修正工具 扫描彩色影像时使用ScanWizard 5 扫描软件色彩校正功效,能够得到更为正确色彩。 除此之外,您可尝试一下在扫描软件中所提供影像修正工具。比如使用亮度和对比度工具,调整影像整体显示效果,或使用曲线工具来处理影像某个特定区域。






