哎,说起现在这看电视吧,我这心里头就跟那 Friday night 瘫沙发上想看个大片的劲儿似的,结果你猜怎么着?那平板电视里传出来的声儿,就跟有人捂着他嗓子眼儿说话一样,黏黏糊糊的。尤其是那种大片,砰砰砰炸得欢实,可人一说话,那嘴皮子就跟没张开似的,我这耳朵都快贴电视上了,愣是听不清说的啥玩意儿。
以前吧,咱们鼓捣那些个音响设备,讲究的是个啥?是那个数字信号处理,也就是大伙儿常说的DSP。那玩意儿就跟个死心眼儿的木匠似的,你给他个指令,他就照着做,比如把高频提一提,让说话声儿亮堂点。可问题是,他分不清哪块儿是说话,哪块儿是背景里的嗡嗡声或者爆炸声啊。结果有时候你为了听清俩人唠嗑,把高频一拧,得,背景那些个“滋啦滋啦”的电流声也跟着贼清楚,听着更闹心。这就是传统DSP的笨处,他不懂音儿,只会傻干活儿。

但现在不一样了,这几年冒出个新词儿,叫 DSP AI调音。我跟你讲,这玩意儿一上手,那感觉就像是给家里那老实的木匠请了个懂行的军师。他不光会干活,他还能听声儿辨位了!那个DTS公司搞了个叫Clear Dialogue的技术,人家那研发的头儿说了,以前为啥听着费劲?是因为咱们的电视喇叭就那么小个地儿,高动态的声音一进来,全挤一块儿了,对白自然就被背景音乐和音效给“淹死”了-3。而这DSP AI调音,他第一件事儿就是用他那机器脑袋,把电影里的音轨给掰开了、揉碎了,能认出来哪坨是人在说话,哪坨是背景风声音乐,哪坨又是砰砰砰的特效-3。然后呢,他单独把说话那轨拎出来,给你加点儿“佐料”,提亮堂点儿,完事儿再给你天衣无缝地放回去。这时候你听到的,就是对白清清楚楚,但背景那种排山倒海的音效一点儿没打折的声儿。
我记得有一回用了个带这功能的机器,看的是个老战争片,以前都是看字幕才能懂剧情。那次我把这功能一开,哎哟,炮火连天里头,那指挥官在掩体里下命令的喘息声、沙哑声,就跟在我耳边似的,那身临其境的感觉,跟你光靠猜词儿看字幕完全两码事儿。这感觉,就像雅马哈他们搞的那个SURROUND:AI,人家把这声音分成了对话音、环境音、效果音,甚至还有个“增强音”,机器会自己判断这时候该让你听清啥,该加强哪股劲儿-4-10。这不比你抱着遥控器一会儿加低音一会儿减高音瞎捅咕强多了?
而且啊,这玩意儿还不光是让你听清,他还真懂你听不听得惯。就说那DSP AI调音里头的一些高级货,现在都能根据你的喜好来了。比如说,你觉得电影里人声太硬,想要暖一点儿?或者你觉得晚上看球赛,怕吵着老婆孩子睡觉,但还想听清楚解说员叨叨?以前的DSP可办不到,他只能给你整体压音量,结果解说员听不见了,进了球的欢呼声反而显得特诡异。但有了AI加持,他能给你做个“个人定制版”的音轨,把人声和周围声分开伺候-3。我有个哥们儿,家里刚添了二胎,这小子瘾又大,半夜偷偷爬起来看球,就用这功能,把解说和场上噪音的比例重新调了调,用他话说:“终于不用再盯着字幕猜谁犯规了,那感觉,就像球场里就我一个人,解说在耳朵眼儿里跟我咬耳朵。”
说到这儿,可能有人要嘀咕了,这东西听着玄乎,用起来麻烦不?其实真不麻烦,现在很多新出的播放器、甚至一些高端点儿的电视机和回音壁里头,都集成了这玩意儿。就好比那个XMOS的芯片,人家现在做的都是在一颗指甲盖大小的芯片里头,把高性能的DSP和AI加速器给塞一块儿了-2。这意味着啥?意味着反应贼快,基本感觉不到延迟,而且聪明得很,能实时处理你正在看的声儿。甚至像咱们国内艾为电子搞的那些方案,不光是用在电视上,连车载的、手机上的音频处理,都开始往这个“会思考”的路子上走,能根据车里头几个人,或者你是在打电话还是在听歌,自动给你调出最舒服的声场-5。
我自个儿觉得吧,这DSP AI调音最打动我的,还不是那些个冷冰冰的技术参数,而是他对咱们这些耳朵不那么灵光的人的关照。现在生活压力大,谁还没个神经衰弱、听力下降的时候?有时候不是不想听清,是真听不清。以前那种粗暴的“增强音量”,其实就是把所有的声音都放大,跟拿个喇叭对着你吼似的,不但没用,还更吵。但现在这AI技术,他能做到的是“清晰”,不是“响”。就像DTS那团队研究的,通过把对话剥离出来增强,哪怕你是轻中度的听力损失,也能在不打扰旁人的情况下,轻松理解剧情-3。这点儿小温暖,对于咱这种喜欢窝在家里看个片儿解压的中年人来说,比啥花里胡哨的灯效都来得实在。
所以说啊,科技这东西,有时候真不是越复杂越好。像DSP AI调音这种,能解决咱们瘫在沙发上那点儿“听不清”的小尴尬,让你重新沉浸在故事里,而不是跟那几寸大的电视喇叭较劲,我觉得,这就是好科技。它让冰冷的机器,终于开始学着用咱们的耳朵,去听这个世界了。