ThinkPad的音频功能初探
来源: 原创 作者:专门网 时间:2006-8-26 22:49
大家整天想把自己的电脑弄得快点, 当然没有错:P. 不过, 快了是用来干活的. 今天, 我们不讲硬盘的冷和热, 快和慢, 讲讲用小黑干点别的.

没贴完之前, 请大家先不要跟贴, 以保持完整性和可读性, 谢谢.


引子

众所周知, 我们的小黑都有内置的音频功能. 从硬件的角度来看, 包括声卡和喇叭, 大部分机型还有内置麦克风. 在输入输出接口方面, 一般都有外接耳机插孔和外接MIC插孔. 有些机型也有线路输入和线路输出接口. 这样, 就构成了ThinkPad的硬件音频系统. 从软件的角度来看, 一般支持WAV, 软件合成器和MIDI. 笔记本的声卡一般比较简单, 只支持最基本的双声道WAV音频功能, 软件合成器和MIDI, 如果要求多声轨的硬件支持(包括合成器和MIDI等), 就要上台机用专业的声卡, 或者可以用外接的USB声卡了. 另外一个非常有用的特性, 就是光纤输入/输出功能, 目前只在极少数的笔记本上出现, 在ThinkPad家族中尚未露面, 实属遗憾.
本文旨在探讨如何利用ThinkPad的音频功能, 也就是着眼于现有的硬件条件, 而不是讲如何在电脑上实现专业的音频处理. 说简单点, 如何利用小黑里面的声卡做点事情.
说起ThinkPad的声音功能, 大家一定不会陌生. 每次开机你都会听到一阵熟悉的声音, 那就是小黑的音频系统在工作啦. (PS.: 我在装电脑的时候, 在第一次重启之前, 一般都已经把这个声音去掉了).  除了开机关机的提示音, 大家最熟悉的, 莫过于用电脑来听歌了, 不管是MP3, 还是WMA, 最后都是通过声卡才能放出声音的(废话嘛).
简介
那么, 除了以上的二件事, 在音频方面小黑还能做点什么呢?
语音识别. 这是一个很典型的音频的功能, 但是一直也都很鸡肋. 想必大家都知道我说的是什么意思. 限于目前的技术水平, 完全没有限制的语音识别技术可能还要过一段时间才能出现吧. 目前来说, 不太实用. 当然, 如果你想试一试的话, 也很简单. 如果你安装的操作系统是XP, 你不再需要别的软件了, 只要装一套MS OFFICE XP就好了. 里面包含了全套的语音识别功能和朗读功能了. 具体的使用方法也比较简单. 但想要真正可以用一用的话, 要给它很多的训练. 这个不是本文的重点, 略过不讲了.
下面进入本文的重点, 就是录音功能了. 现在, 网络及电脑上的多媒体应用越来越多, 而所谓的多媒体, 其实也就是音频和视频罢了. 笔者写这篇文章的起因, 有一部分也是因为要做一个在线研讨会, 需要把一个PPT文件的内容预选录制并放在网上. 为了完成这个差事, 研究了一番, 买了一些东西, 做了一些试验. 做完了觉得可以把这个过程写出来与广大黑友分享一下. 传统上, 录音都是用录音机的, 但是因为要与电脑及网络相结合, 不管你用了什么录音器材, 最后总是要连接电脑并转成数字文件. 所以, 最后还是离不开小黑. 下面我们来看看, 如何在电脑上做一些录音的工作.


三个例子
在电脑上可以做的音频处理其实包括很多, 我们今天采用三个典型应用的例子来说明其中的一小部分. 这三个应用分别是:
1)        简单的语音留言, 语音邮件用的语音内容
2)        比较高要求的语音内容的录制, 如网上研讨会这类的内容
3)        歌曲及音乐内容的数字化
简单的录音操作及一些基本概念
先看第一个. 这个是最简单及容易的. 但其实已经包含了最基本的原理和操作. 弄懂了这个, 往下的几个也就不难了. 对于这样的应用, 我们无需太多额外的设备了. 这里主要会用到系统自带的”录音机”小软件及电脑内置的MIC. 对于没有内置的机型, 只需要一个最普通的耳麦(电子市场15元的货色)应该就可以胜任了.
具体的操作过程, 就是调出那个录音机程序了. 一般是在程序->附件->娱乐->录音机.
界面简单, 操作直观….但是, 并慢. 其实还有一些可以讲讲的.


在新窗口打开

混音器
        首先要讲的是混音器(Mixer). 不弄好这个, 是不会有声音的. 这个一般可以从控制面板->声音->音量->高级 调出, 也可以直接在”运行”那里输入”sndvol32”来得到.
混音器, 是属于系统的一部分. 严格来说, 可以算是声卡硬件的一部分. 声卡不同, 混音器的功能也会有所不同. 简单的来说, 混音器就是声卡的输入与输出的软件映射, 它控制了输入信号怎么样进入和离开声卡. 它有二个部分, 一个控制输入, 一个控制输出. 在选项-属性那里选择是”放音”还是”录音”. 放音部分对应于输出的控制, 录音部分对应于输入的控制.
输入控制的混音器, 有二大功能. 一是选择信号的来源, 二是控制输入信号的电平. 信号源的选择直截了当. 在我的电脑上, 有五个信号可供选择. 大家可以看到, 分别是CD播放器, MIC, 线路输入, 单音输出(就是电脑的内置喇叭)和一个WAVE混音输出(这个比较特别, 我们下面再详细解释). 因为这是一个最基本的混音器, 所以严格来说它不具备”混音”功能, 因为任一时刻它只能从上述五个音源中选择一个作为声卡的输入. 真正的混音器可以把上述输入信号中的任意个先行混合后才作为声卡的输入信号(这也是它为什么叫混音器的来由了). 很明显, 你要录什么内容就选择相应的输入信号就可以了.
第二个功能是控制输入电平. 这个又是什么呢? 这里首先要介绍一下”录音电平(Recording Level)”这个概念, 这个概念对于所有的音频工作来说, 都是头等重要的. 首先, 我们要知道的是, 录音电平代表了信号的大小. 其次, 录音电平表示的是一个相对值, 也就是一个比值. 然后, 录音电平的常用单位是分贝, 表达为db. 最后, 0 db的意思是相等, 也就是 1:1. 而每3db代表了一倍, db是对数关系, 所以倍数用db来表示是加减的. 所以, 二倍就是+3db, 四倍是+6db, 10倍是+10db, 一半是-3db, 1/4是-6db, 1/10是-10db等等. (大家明白其中的关系了吧?) (PS, 为什么要用这样的方法来表示呢? 因为它是对数的, 可以表示很大的范围. 举个例子来说, 我们可以听到的声音世界, 大概有120db的变化范围, 那么120db是一个概念呢? 就是1,000,000倍, 也就是说最轻的声音和最响的声音之间差100万倍了). 说完了分贝, 顺便说一下另外一个有用的概念, 就是动态范围(DR, Dynamic Range), 动态范围也用db来表达, 就是一个系统可以达到的最大值和最小值之间的范围了. 还是上面的例子, 声音系统大概120db的动态范围(这是因为人耳的听觉极限, 不算用仪器) 有没有人会问, 人耳的0db值是如何定义的? 这个先留一留, 或者有哪位XD可以替我讲一下?


在新窗口打开

先不管分贝的定义了. 让我们来看看为什么要控制输入电平.
还要说明一点, 分贝完全是一个相对的比值, 所以, 0分贝不是什么特别的东西, 只是一个基准点, 至于这个0分贝是什么, 是大还是小, 完全看人为的定义. 比如, 在人耳的例子里, 0分贝是最小值. 所以, 我们平常所说的分贝数都是正的, 比如街上的噪声是70分贝之类. 但是, 在录音世界里, 这个0分贝一般代表系统所能正确处理的最大信号, 所以, 在这里所有的分贝数基本上都是负数(注意负分贝只是代表比0分贝小的信号)
简单地说, 控制输入电平有二个作用, 一是保证信号不失真, 也就是电平不要太高. 按照定义, 0分贝是系统所能正确处理的最大信号了, 所以任何时间, 在系统的任何环节, 都不能出现大于0分贝的信号了(特定要求的地方除外). 很明显, 输入的信号是第一关, 一定要保证输入信号不大于0分贝. 另一方面, 控制输入电平的作用, 在于使输入信号不会太小. 记得每个系统都有自己的动态范围. 只有在这个范围以内的输入信号才能被正确地处理. 除了动态范围, 还有一个最重要的基本概念, 就是信噪比了(SNR, Signal-to-Noise Ratio). 信噪比就是信号与噪声的比值, 大家都用分贝来表示的时候, 比值(除法)就变成了减法. SNR存在于系统的任何地方, 有信号的地方(当然噪声是永远都有的), 就有SNR. 比如, 一个系统可以输出一个0db的信号, 而在这个输出的信号里面, 包含了-80db的噪声, 那么这个地方的SNR就是0-(-80)=80db了.
很容易理解, 一个系统的输出噪声, 可以分成二部分, 一部分是从输入端引入的, 另一个部分是系统固有的. 而这个系统的输出信号的大小, 取决于输入信号的大小和系统的增益. 在噪声不变的前提下, 输出信号的SNR就取决于输出信号的大小了. 很明显, 当输出信号过小时, 输出的SNR也将减小. 当然, 可以提高系统的增益来放大信号, 但这样做的同时也会放大噪声, 所以, 其实, 增益对于系统是不重要的(因为很容易提高), 真正重要的是信噪比(SNR).
上面这一部分过于理论, 说回我们的混音器. 我们知道, 混音器是很重要的, 有二大功能, 一是选择合适的你想要的信号源, 二是控制输入信号的大小, 使它既不太大也不太小.
终于可以开始了
操作是太简单了, 正确了设定了混音器后, 要做的就只有一件事了. 就是按下那个红色的小圆点了. 然后对着MIC(内置或外置)讲话就可以了. 当然, 在正式录音之前, 要对电平进行一些调节, 要求是不太大也不太小. 因为我们的工具太简陋, 其实, 只要录好后听一听, 差不多就行了. 然后, 就”保存”了. 常规的WINDOWS操作, 选择保存的地方和取一个文件名就好了. 要注意的是, 这个录音机只提供一个WAV格式. 缺点是文件的体积很大. 没有任何压缩.

较高要求的语音内容的录制
下面进入我们的正题了. 如何用小黑来录制一些比较正规的语音内容.
硬件方面, 我们没有太多的选择. 我们就用内置的声卡了. 当然, MIC是很重要的, 如果要录制比较正规的东西, 就不能用内置的MIC了. 倒不是内置的MIC太差, 主要是因为它会把机器本身的一些噪音, 如硬盘转动的声音录进去. 这个受安装位置的限制, 是不可避免的. 所以, 一定要用外置的.
外置的MIC当然也分三六九等. 我们一般用中等的就好了. 比如我用的这二款:
可以满足绝大部分的语音录制的要求了.
软件方面, 很明显, 系统自带的录音机不能满足我们的要求了. 第三方的音频软件当然多如牛毛. 我今天要介绍的是ADOBE的Audition. 它的前身是CoolEdit. 这个是PC平台上非常流行的一个专业/准专业音频软件了(注意不是最好的!). CoolEdit 2000分普通版和专业版, 分别简称CE2K和CE2KPro. 区别是CE2K支持双音轨, 而PRO版支持多音轨(多少轨没有深究, 不搞专业录音, 没有什么机会接触多轨录音). 对于ADOBE的产品, 我想大家知道最多的就是ACROBAT和PHOTOSHOP了. 其实, 这个AUDITION, 大家可以看成是声音世界的PHOTOSHOP就对了, 从地位和功能来看, 都不为过. ADOBE收购这个公司和这个软件, 用意大概也不过如此了. 下面就以Audition 1.0来简单地介绍一下.


在新窗口打开

好了, 安装部分就不说了. 正确安装并****后, 我们就可以开始了.
打开软件后, 我们首先要做的事是选择双音轨还是多音轨. 因为Audition是可以支持多轨的. 当然也支持双轨了. 如上所说, 不进录音棚, 玩玩双轨就可以了.
打开软件后, 如果看到是这样的, 注意中间有四条音轨被显示出来, 当然, 它所支持的音轨数就远远不至4条那么少了.



在新窗口打开

在左上角那个地方点一下, 就进入双轨模式了. 是这样子的:


在新窗口打开

然后, 重要的就是混音器了. 上面已经讲了不少了. 我们可以从这个软件的菜单里面快速地调出系统混音器, 在这里:


在新窗口打开

因为我们是以录制语音为目的, 所以当然是选择MIC啦.
这里还有一个地方, 就是大部分声卡都有内置一个MIC增强功能, 也就是把MIC来的信号放大20db (想一想20db是多少? 100倍啦). 这个注意是为了配合不同的使用距离. 因为一般的MIC使用有二种情况, 一种是头戴式, MIC距离嘴巴很近(几厘米), 这样的情况, 就不需要这个额外的增益了. 另一种情况就是非头戴式, 一般MIC距离嘴巴20-100厘米, 这种情况下, 就非常需要这额外的20db增益了. 可以根据你的实际情况. 因为我们使用的是外置的MIC, 所以, 需要在这里打上勾. (PS, 有些软件有一个MIC向导, 帮你选择要不要这个选项. 其实就是问你是不是头戴式MIC. 是就不选, 不是就选).
这样显示这个高级选项:


在新窗口打开

点下面的按钮打开这个选项卡, 根据需要选择合适的值.


在新窗口打开

选好了音源后, 还有一个要选, 就是录音里的参数了. 选择“File”->“New”就会出现这个对话框. 直截了当, 三个参数. 一般录语音, 选择“22K/Mono/16-bit”就可以了. 当然, 要求高的, 就可以选择“44K/Stereo/16-bit”啦.


在新窗口打开

好了, 做好了这些基本的准备工作, 在开始之前, 再讲一下界面上的一些主要的东西:


在新窗口打开

1.        控制功能, 什么开始, 停止之类的. 很清楚啦.
2.        这二条柱子, 显示了当前的瞬时电平. 你时时要注意这个地方. 一是看二个声道是不是平衡(如果你是录双声道的话), 另一个是看当前的电平是不是合适.
3.        这条短短的黄线, 代表了上一个峰值电平. 注意它有没有太高.
4.        0db的位置. 如上所述. 0db是系统的最高电平, 所以右边. 还有, 瞬时电平越高的时候, 显示的颜色也会变化, 从绿色变成黄色, 最后, 达到0db时会变成红色. 以做警示.
5.        时间显示, 显示当前光标所在的时间点.
6.        声音的波形
7.        那条横着的白线, 其实是采样值为30000位置. 因为16位的最大值是32767(注意有上下二边, 所以单边只有一半, 即15位). 所以, 30000已经很接近最大值了. 这些地方, 就是快要超过0db的地方了, 也就是快要失真的地方了. 要注意.
8.        整个文件的时间信息. 开始, 结束, 长度.

刚才忘了把二个MIC的资料放上去了, 现在补上.
第一个, ECM-717, SONY的. 这个体积比较小, 可以夹在领子上或放在桌面上.



在新窗口打开

好了, 到这里, 录音应该是没有问题了. 声音的文件量比起图像, 甚至视频, 那是小得多了. 所以, 对电脑的要求不太高, 当然, 硬盘上要有一定的空间, 内存当然是越大越好了. 给一个参考吧, 一分钟的声音, 44K/双声道/16位, 不压缩的文件量大概是10MB(字节).
{16位/(8位/字节)*2声道*44K/S*60S=10.5M字节}
这样就可以估计你大概需要多少硬盘空间了. 当然, 还有很多的临时文件, 刚刚好是不行的.
录音的时候, 就是控制环境和电平了. 别的也没有了.
录好后, 一般建议保存一个原始文件, 现在大概最少都有CDRW, 600M可以保存60分钟的原始文件, 问题也不是太大了.
最后, 再讲一下输出的文件格式.

另一个, ECM-MS907. 这个可以用作会议录音, 也可以用于野外使用. 它的那个支架设计得比较好, 还可以改变指向曲线, 使收音的角度在90度和120度之间切换. 而电声特性方面, 则与ECM一样的.



在新窗口打开

最后, 再讲一下输出的文件格式.
这个软件, 当然是功能强大, 支持多多种文件格式. 但我们常用的, 也就是那么几种. 以下与图形文件做一个类比, 希望对理解文件格式有点帮助.
WAV, 原始格式, 不压缩, 直接采样值. 相当于BMP.
ACM, ADPCM, 也是一种比较低级的格式, 可以选择不同的质量. 有点类似于TIFF. 有一些变种, 包括支持压缩. 后缀都是WAV的.
MP3, 地球人都知道了. 可以选择不同的压缩率, 类似于JPEG. 有一些变种, 包括MPEG I, MPEG II和MPEG IV等不同的压缩方法. 由于网络的关系, 成了目前最流行的格式了.
WMA, MS的格式, 与MP3对抗的.
AIFF, 苹果上的Native音频格式, 没有压缩的. 好象图形方面的PNG与它比较类似?
还有很多种, 大多是随一些不同的系统而使用, 一般在PC上, 以上的这些足够了.

就象在图形处理中一样, 在处理的过程中, 一定要采用不压缩的格式, 而且完成后一般要保留一个无损的文件, 最后的输出文件, 只是根据需要输出一个拷贝, 比如在网上传输, 需要尽量减小体积, 当然首选MP3/WMA, 与别人交流, 主要考虑兼容性, 根据对方的要求, 输出相应的文件. 但是, 始终应该保留一个无损的文件, 比如WAV或AIFF, 以备以后再做编辑.

通过上面的介绍, 我们已经可以录制一段声音并保存为我们需要的格式. 但这只是最基本的一步. 还有很多很重要的工作, 就是对这个声音文件进行编辑. 加以修饰, 最起码去掉一些偶然的杂音, 进行一些润色, 对一些错误的地方进行加工, 如讲的时候有一些结巴之类的, 都可以通过软件的处理来改善. 更高级的处理包括进行降噪, 频谱均衡, 变声, 剪接等等. 当然, 这些方面的内容, 不在我们这篇短文的涵盖之内了.

第一部分完.

本文作者: 咫尺天涯  责任编辑: HOPE  收录时间: 2004-6-4 11:23
讨论连接: ThinkPad的音频功能初探

  登陆  注册

我来说两句
:) ^v^ ^,^ :') *.*lll ^:^ **\ ^^? :$ ^u^ ^x^ :( :D :'( :o :P ^o^ :-| :handshake :victory: