发烧论坛

注册

 

发新话题 回复该主题

理想与现实的差距……..浅谈抽样定理 [复制链接]

查看: 8228|回复: 68
51#

低温 在 2006-3-21 13:45:39 发表的内容
从声学来讲,失去的上升沿损失的的是声音的特质。人们辨别一种乐器或人声靠的是辨别波形的上升沿。早期的电子琴是用正弦波来拟合各种乐器,出来的声音全是一种圆呼呼的貌似神离的东西,七十年代过来的人都会记得那种声音,当然那种振荡器的基频还达不到44.1KHz,这种现象反映的是一种声学原理。


失去“上升沿”那是因为失去了超高频的正弦波谐波所导致的。假如所失去的这一系列正弦波属于人耳可感知的范围,那当然就会影响听感,您所举的早期电子琴的例子,或许就是典型。

但是,假如所丢失的正弦波弦波远超过人耳所能感受的范围呢?——没错,“人们辨别一种乐器或人声靠的是辨别波形的上升沿”,但是或许要加一个前提:那个“沿”上升的速度(也就是说“陡峭”程度)不能超过某个值——因为越“陡峭”,可能就意味着该声波频率越高。

举个例子:比如说来一个50kHz的正弦波,按时间 - 振幅坐标来绘图的话,可以发现这个正弦波看上去很尖,几乎一下子就从振幅为0升为1——但是为何人耳却听不到、感受不到这个声波呢?——但明显这里声波的确是“上升”啊——关键在于,这个声波上升得太快了,从0升为1所花的时间远小于人耳可处理的最短时间,所以人耳就根本没意识到外来声波有过这样的变化。

所以说,只要“上升”的速度快过某一个值(也就是说对应了人的听力频率上限),超过了人耳的最短感受反映时间,那么它上升得多快、多陡峭、甚至是垂直上升的方波——都是没区别了——人耳已经无法区别它们有什么不同了。

以上叙述可能对于听觉生理领域来讲很不专业,但有兴趣的朋友不妨去看一看关于人耳听觉原理的介绍,就会发现:对于“上升”太“陡峭”、太“快”的声波,的确是不能引起人耳的任何反应的。
TOP
52#

低温 在 2006-3-21 0:15:38 发表的内容
开兄的贴子着实有趣,这正是困扰了俺很久的问题,直到前年才理清个头绪。

奈奎斯特定律害人不浅。
定律本身并没有错,但是应用的条件出了错,前提是正弦波。
谁说音频的20-20KHz只是正弦波呢?,如果遇到18KHz方波如何采样、如何还原呢?如果一个正弦波信号发生相位跳动(同频) 如何表达呢?这一切用44.1KHz的采样频率全是错误的。
用FFT去分解如果22.1KHz的频响,只能换得大约7.8KHz以下方波<3%失真度的还原,因为5次以上的高次谐波丢失。
众所周知钢琴的波形类似方波,所以在普通CD还原钢琴是最差的。

奈奎斯特定律害人不浅哪!


定理的应用条件没有强调是正弦波,而是强调最高频谱是fm(由我们确定),所以只要在fm以内的所有频率,在理论上都能百分之百的还原。
TOP
53#

dr kuang 在 2006-3-21 20:47:01 发表的内容
felixcat 在 2006-3-21 14:22:34 发表的内容


所以说,只要“上升”的速度快过某一个值(也就是说对应了人的听力频率上限),超过了人耳的最短感受反映时间,那么它上升得多快、多陡峭、甚至是垂直上升的方波——都是没区别了——人耳已经无法区别它们有什么不同了。

以上叙述可能对于听觉生理领域来讲很不专业,但有兴趣的朋友不妨去看一看关于人耳听觉原理的介绍,就会发现:对于“上升”太“陡峭”、太“快”的声波,的确是不能引起人耳的任何反应的。



虽然对结论无影响,还是想确定一下人耳是感受振动次数还是上升速度来判断频率?


这个问题比想象的要复杂些,根据俺的理解应该是波形前沿的频谱是识别的核心部分,前沿的这些频谱被大脑记忆,再次听到时把收到的信号和大脑中的记忆进行比较,才能判别出音色特质。即然是集中在上升沿段的频谱,应该是分布特定音色的较高频段,这种在语音段集中在6-8KHz一段,可以做个试验,如果在一个带宽低于6KHz的传输系统里,不同人的声音被分辨出来的概率大大降低。

一件乐器也好人声也好其频谱是相当丰富的,但是基波中频率最高的部分和调制波最丰富的部分基本都在波形的上升前沿。

侃的不对请行家指正。
TOP
54#

felixcat 在 2006-3-21 14:59:34 发表的内容
低温 在 2006-3-21 13:59:49 发表的内容
可以肯定在fm点只能是正弦波,小于fm的用正弦波拟合,如果俺没记错的话。
就这个问题俺十多年前和外教请教过,同样无法解释。比如同频率的相位跳动,如果这个频率=fm,采样后是会得到2fm的信号点还是什么结果?但百分百事还原肯定做不到的。


虽然这里我不太清楚您的具体意思,但是我猜测是说信号开始时 Y = Sin(X),但突然间相位跳动变为 Y = Sin(X + P),您说这种情况下用该频率对应的Nyquist频率取样,不能还原这种有相位跳动的正弦波是吧。

那么请看下图:
[upload=jpg]Upload/200632114475492593.jpg[/upload]

信号开始是y = Sin(x),到了某一点就相位跳成是y = Sin(x -  pi/2)。这里为了叙述方便,不妨把正弦函数的频率说成是fm。那么,虽然前半段和后半段曲线分别单独来看都是频率为fm的正弦波,并且很肯定假如单单对前半段,或者对后半段曲线,都以2fm的频率来取样的话,那都能分别还原出各自的曲线。

不过假如现在把两段曲线前后连接看作一个最终的信号来看的话,那么我们肯定不能用2fm的取样频率来取样——因为整段信号里所含有的最高频率已经远远超过fm了——为何?请看上图红圈圈住的那一段信号,信号在那个“尖点”处虽然是连续,但是没有导数——因此用傅立叶展开的话我们会发现在红圈圈住的这一处会出现很多频率高于fm的正弦和余弦项——这就意味着信号在这一段里面含有很多频率超过fm的谐波,因此假如我们仍然用2fm来对整段信号来取样,那这就明显不满足Nyquist定理的前提条件,那当然就无法100%还原了。

总之:两段频率相同(都是fm),相位不同的正弦信号前后相接,得出的新信号里面所含有的最高频率大于fm

因此Nyquist取样定理肯定是没有错的。只是我们常常忽略了它的前提条件。

希望我上述描述的问题是您心目中所想的那一个。假如不是的话就权当我自说自话一番好了。


正是这个问题,老兄功底很深,佩服!
这种信号抖动在实际中是会遇到的,也正是CD多年来不能被烧友认可的根本所在。
TOP
55#

felixcat 在 2006-3-21 14:22:34 发表的内容


所以说,只要“上升”的速度快过某一个值(也就是说对应了人的听力频率上限),超过了人耳的最短感受反映时间,那么它上升得多快、多陡峭、甚至是垂直上升的方波——都是没区别了——人耳已经无法区别它们有什么不同了。

以上叙述可能对于听觉生理领域来讲很不专业,但有兴趣的朋友不妨去看一看关于人耳听觉原理的介绍,就会发现:对于“上升”太“陡峭”、太“快”的声波,的确是不能引起人耳的任何反应的。



虽然对结论无影响,还是想确定一下人耳是感受振动次数还是上升速度来判断频率?
TOP
56#

人耳是感受振动次数来判断频率;感受振动上升速度来判断(频率)的区别。
人耳的听觉和视觉一样,存在生物“滞留效应”。比如,24幅/s以上的电影画面,50~60幅/s以上的电视画面,80幅/s以上的电脑画面,我们就基本上看不出“断断续续”的现象而且认为是连续的。
人耳的听觉方面,青年人20KHz以上,中老年人16KHz以上,由于频率的“上升速度”太快,人耳的听觉反应速度跟不上,所以就感觉不到或者说听不到了。12KHz的方波和12KHz的正弦波我们听上去几乎完全一样,就是12KHz的方波上升沿速度太快,人耳反应不出来它的变化“存在”,“误”认为是正弦波了。如果你明确的可以听到16KHz的频率,那么,8KHz以下的方波和正弦波你就应该可以听出区别(上升沿速度小于听力最高频率上升速度两倍以下)。但是,这时你仍然不能区别8KHz的方波和三角波(适当增加三角波的幅度后)。
最后编辑松香味
TOP
57#

开心果 在 2006-3-21 13:47:29 发表的内容
定理的应用条件没有强调是正弦波,而是强调最高频谱是fm(由我们确定),所以只要在fm以内的所有频率,在理论上都能百分之百的还原。
低温 在 2006-3-21 13:59:49 发表的内容
可以肯定在fm点只能是正弦波,小于fm的用正弦波拟合,如果俺没记错的话。
就这个问题俺十多年前和外教请教过,同样无法解释。比如同频率的相位跳动,如果这个频率=fm,采样后是会得到2fm的信号点还是什么结果?但百分百事还原肯定做不到的。
低温 在 2006-3-21 14:26:32 发表的内容 补一张相位跳动的图
[upload=jpg]Upload/200632114261946834.jpg[/upload]


关于相位跳动的问题 felixcat 兄已经从数学的角度说得很清楚了。

现在借用您的图,试图从物理学的角度讲一下。下图是最高频谱fm受到相位跳动的波形图。由图中可知,在最高频谱fm的情况下,波形从C 到O2 的最少时间是T2  。但在相位跳动处的波形从A 到O1的时间是T1 。很明显T1远小于T2 ,说明在相位跳动处的最高频谱远远超过了fm ,否则它不可能在很短的时间T1内,由A 点转到O1点。


因为在相位跳动处的频谱要远远超过了fm,所以对于抽样频率只有2fm的情况下,已经不能满足抽样定理前提条件了,自然就不能还原了。
[upload=jpg]Upload/200632519184523938.jpg[/upload]
TOP
58#

低温 在 2006-3-21 23:49:15 发表的内容
dr kuang 在 2006-3-21 20:47:01 发表的内容
felixcat 在 2006-3-21 14:22:34 发表的内容


所以说,只要“上升”的速度快过某一个值(也就是说对应了人的听力频率上限),超过了人耳的最短感受反映时间,那么它上升得多快、多陡峭、甚至是垂直上升的方波——都是没区别了——人耳已经无法区别它们有什么不同了。

以上叙述可能对于听觉生理领域来讲很不专业,但有兴趣的朋友不妨去看一看关于人耳听觉原理的介绍,就会发现:对于“上升”太“陡峭”、太“快”的声波,的确是不能引起人耳的任何反应的。



虽然对结论无影响,还是想确定一下人耳是感受振动次数还是上升速度来判断频率?


这个问题比想象的要复杂些,根据俺的理解应该是波形前沿的频谱是识别的核心部分,前沿的这些频谱被大脑记忆,再次听到时把收到的信号和大脑中的记忆进行比较,才能判别出音色特质。即然是集中在上升沿段的频谱,应该是分布特定音色的较高频段,这种在语音段集中在6-8KHz一段,可以做个试验,如果在一个带宽低于6KHz的传输系统里,不同人的声音被分辨出来的概率大大降低。

一件乐器也好人声也好其频谱是相当丰富的,但是基波中频率最高的部分和调制波最丰富的部分基本都在波形的上升前沿。

侃的不对请行家指正。


声波是纵波,是空气分子的疏密变化,我有点怀疑方波能否在空气中传播?
TOP
59#


开心果 在 2006-3-21 13:52:34 发表的内容

这是属于另一范畴的问题了。


低温 在 2006-3-21 14:08:30 发表的内容

没错!所以说奈奎斯特定律没错,问题出在应用条件上了。
很高兴和各位讨论此问题,延伸下去还有很多疑问,大家可以探讨。

比如现场乐队开始演奏前提琴落弓的声音,据声学专家讲其基波在15KHz 类似阶越响应,去过现场的人都能感受到,但录音中从来对未见踪影。如果做FFT,加上闻域等响度曲线根本没法解释等等。


这个与人的听觉动态范围能自动调整有关。在现场,乐队开始演奏前的那几秒钟,观众原来等待的心情终于有结果,自然就很安静下来了(这点与心理学有关),于是现场本来就比较低的本底噪声就更低了,这时人耳的听觉灵敏度就会提高,于是微弱的提琴落弓的声音就能听到了(这点与人在较黑的环境里,借助微弱的光线也能看到眼前的物体的道理类似)。但在演出的过程中,提琴落弓的声音就不再被人注意到了。为什么呢?因为相对于提琴落弓的声音,演出的声音是一个较高的噪声了,人耳的听觉灵敏度为了适应新的本底噪声,听觉灵敏度已经降低了,且短时间内不能恢复到演奏前的情况。
但录音器材就不同,它没有这个自动调整功能(除非认为干预),自然录下这个声音时的信噪比就很低,再加上重放环境的噪声影响,所以就听不到了。
TOP
60#

置疑Nyquist定理其实没有什么必要,这应该是数学界的问题,需要几个玩音响的来讨论,我不认为会得出什么结果.

现在有说法,基于Nyquist定理,所以44.1khz和96khz的采样率,对于20hz-20khz这个区域没有差别.ok, 取样的时候"或许"没有差别.但明显漠视了某些实际情况.

CD不是直刻的.Nyquist定理的基础是什么?采样后,使用采样值,可以恢复出原波形.但我想请问的是CD上面的信息,是否是录音时候ADC采样下来的信息?

混音过程中,经过了各种混合,效果等处理.是否有相关的定理证明,44.1khz和96khz在经过这些处理,能够提供的精确性是相同的?

Nyquist定理适用于录音采样的时候,但是采样值经过各种计算变化以后,Nyquist定理是否仍然适用?很明显采样下来的信息A,并不是我们CD上面的信息B.在A => B这个转换过程中,Nyquist定理仍然适用吗?
最后编辑Raxel
TOP
发新话题 回复该主题