作者：杜奕寧

今天布置了這學(xué)期信號(hào)與系統(tǒng)的小論文作業(yè)。有參加了上海中學(xué)生的科技節(jié)作品評(píng)選。他們的一篇關(guān)于聲音與年齡的論文讓我很感興趣。不知道這學(xué)期我的信號(hào)與系統(tǒng)班上的同學(xué)提交的小論文能否趕上這位中學(xué)生研究論文的內(nèi)容。

01 引言

1.1 項(xiàng)目由來

我對(duì)音樂很感興趣，所以，我在尋找課題時(shí)，最初的想法也落在了“聲音”上。我了解到諧波分析可以提取聲音特征，于是在經(jīng)過幾次嘗試、調(diào)整后，我選擇以年齡為變量分析人的聲音。

對(duì)于“諧波”的好奇，源于一個(gè)聲音的實(shí)驗(yàn)：用濕潤(rùn)手指摩擦裝水高腳杯發(fā)出的440 Hz以及國(guó)際基準(zhǔn)音中央A（440 Hz），它們的聲音是完全不一樣的。前者聲音刺耳且古怪，但后者卻完全處于我們的舒適的認(rèn)知范圍內(nèi)。這個(gè)例子也說明諧波對(duì)人聽覺所帶來的影響不可忽視，是很值得去探究的。

所以最后的題目就定為：“基于頻譜分析探究人的聲音隨年齡的變化”。

1.2 文獻(xiàn)綜述

通過對(duì)于“聲帶”、“年齡”等關(guān)鍵詞的內(nèi)容模糊搜索，我在許多生物學(xué)、醫(yī)學(xué)的期刊或論文里進(jìn)一步了解了人的發(fā)聲機(jī)制。通過對(duì)于“諧波”、“頻譜”等關(guān)鍵詞的搜索，我看到了較多有關(guān)于聲音的特征提取以及諧波對(duì)于聲音的影響。這兩部分各自的檢索結(jié)果都比較多。相對(duì)而言，二者相結(jié)合的研究就非常少了。

尹基德的漢語(yǔ)韻律嗓音發(fā)聲研究便是一例，他將聲帶發(fā)聲機(jī)制以及聲音的基音、諧波結(jié)合在一起考慮，重點(diǎn)把不同的漢語(yǔ)發(fā)音作為變量。雖然此研究與漢語(yǔ)發(fā)音并無關(guān)系，但是是為數(shù)不多的涉及到發(fā)聲機(jī)制以及諧波特征的綜合研究。

1.2.1 聲帶發(fā)聲原理

聲帶位于人類的喉部，是一個(gè)發(fā)聲器官，主要是由甲狀軟骨、杓狀軟骨、環(huán)狀軟骨、環(huán)甲肌、真聲帶（聲襞）、假聲帶（前庭襞）等部分組成。

覃折波等人利用超聲成像，解析正常人聲帶區(qū)的發(fā)聲原理。在研究中他們提到：“聲襞本身構(gòu)成了聲門的一部分，其游離的內(nèi)側(cè)緣所形成的開口即為聲門裂，聲門裂是喉腔最狹窄的部位。在喉內(nèi)肌協(xié)調(diào)作用的支配下，聲襞運(yùn)動(dòng)使聲門裂有規(guī)律的開放和閉合，從氣管和肺沖出的氣流不斷沖擊聲帶，引起振動(dòng)而發(fā)聲。”同時(shí)他們?cè)诜治鰯?shù)據(jù)時(shí)也指出了隨著年齡增長(zhǎng)發(fā)聲器官的老化現(xiàn)象：“這與甲狀軟骨隨著年齡增加鈣化逐漸嚴(yán)重的生理特點(diǎn)相符，而聲像圖上顯示因甲狀軟骨嚴(yán)重鈣化致影遮擋也證實(shí)了這點(diǎn)。”

▲ 圖1.2.1 聲帶結(jié)構(gòu)示意圖

在尹基德漢語(yǔ)韻律的嗓音發(fā)聲的研究中，他從三個(gè)調(diào)節(jié)方面來論述了漢語(yǔ)韻律的發(fā)音方式：音調(diào)調(diào)節(jié)、時(shí)長(zhǎng)調(diào)節(jié)以及強(qiáng)度調(diào)節(jié)。在音調(diào)調(diào)節(jié)方面，作者提出，最重要的便是環(huán)甲肌與聲帶肌。如上圖1所示，環(huán)甲肌通過拉扯甲狀軟骨來調(diào)節(jié)真聲帶的張力，從而改變聲帶肌的硬度與有效質(zhì)量以調(diào)節(jié)音調(diào)。另外，文中提到真聲與假聲的發(fā)聲原理是不同的，“從正常嗓音發(fā)聲轉(zhuǎn)變?yōu)榧俾晻r(shí)，環(huán)甲肌的變化不明顯而聲帶肌的電信號(hào)明顯下降。”1注意到這一點(diǎn)，本項(xiàng)目的聲音樣本全部采用的是真聲。

另外，日本耳科會(huì)報(bào)的一篇文章提出：聲帶肌截面積變化、聲帶肌纖維數(shù)的變化、肌纖維類型的變化、脂褐質(zhì)沉積率四個(gè)方面是聲帶老化的重要指標(biāo)。

通過這些文獻(xiàn)的查閱，我認(rèn)為，人的聲音會(huì)隨著年齡的增加而有一定的變化，而如何對(duì)其進(jìn)行測(cè)量，并找到其中的關(guān)聯(lián)性，則是我的研究重點(diǎn)。

1.2.2 諧波的研究概述

“諧波”在許多有關(guān)聲音文章中都被作為了一個(gè)關(guān)鍵數(shù)據(jù)去看待，因?yàn)?ldquo;諧波”確實(shí)是與我們平時(shí)所說的“音色”是分不開的。

張雪源在其研究中提到，人在聽到一個(gè)具有諧波結(jié)構(gòu)的聲音時(shí)，不會(huì)依次感知到每一個(gè)單一泛音的頻率，而是將信號(hào)整體感知為基頻頻率，而將泛音的個(gè)數(shù)、能量大小、泛音能量衰減速率等感知為音色。黃天乾等人通過分析鋼琴比較特殊的七次諧波、九次諧波來研究其音質(zhì)5；張雪源則分析得出：小提琴因其泛音多且能量衰減慢、黑管因其泛音少而能量衰減快，所以前者聲音明亮而后者較為低沉（張雪源）4；楊婧基于諧波的特征對(duì)于不同樂器進(jìn)行音色特征提取6……這些都反應(yīng)了諧波作為一個(gè)聲音特征的重要地位。所以，在對(duì)聲音進(jìn)行定量分析的過程中，諧波的研究有其重要的意義。

1.3 研究意義

在除了純粹的科學(xué)探究以外，本實(shí)驗(yàn)還可能為其它切實(shí)的領(lǐng)域提供幫助：

1. 在此基礎(chǔ)上進(jìn)一步了解聲音衰老的機(jī)制，幫助提出修復(fù)方法

2. 進(jìn)一步擴(kuò)大數(shù)據(jù)，可以提取特定年齡的特定聲音特征，可用于身份識(shí)別等領(lǐng)域。

1.4 創(chuàng)新點(diǎn)

本人認(rèn)為，該研究的創(chuàng)新點(diǎn)主要有以下兩點(diǎn)：

1. 通過對(duì)人的聲音的諧波分析，在前人定性聲帶衰老的基礎(chǔ)上，為定量研究人的聲帶衰老提供可能。

2. 通過對(duì)頻譜特征的提取讓聲音在數(shù)據(jù)層面上與年齡相關(guān)聯(lián)，并輔助其推測(cè)。

02 原理

▲ 圖2.1 諧波示意圖

如上圖2諧波原理圖所示：黑色直線是弦，藍(lán)線、黃線、綠線都是這根弦的振動(dòng)方式，分別代表著二次諧波、三次諧波、四次諧波……以此類推，但一般而言越往后的能量就越微弱。可以很容易知道：波長(zhǎng)λ乘以諧波次數(shù)n就等于半條弦的長(zhǎng)度，同時(shí)：一秒鐘速度u = 一秒內(nèi)波的頻數(shù)f每一段波的長(zhǎng)度λ。所以得到：。把第二個(gè)式子帶入第一個(gè)式子，。

如果假設(shè)弦長(zhǎng)一定，且弦各部分均勻，那么L與u皆為定值，則f與n成正比。這證明了倍頻的頻率在理論中應(yīng)為基頻的整數(shù)倍。

03 實(shí) 驗(yàn)

3.1 實(shí)驗(yàn)器材

【表-1 實(shí)驗(yàn)器材】

使用軟件	功能	使用版本
Sigview	音頻分析軟件	Sigview v5.0
Adobe Audition CC	音頻截取軟件	Adobe Audition CC20
OriginPro	圖表制作軟件	OriginPro9.1 64-bit

3.2 音頻采集

本文的研究方向在于一個(gè)人的聲音特征隨年齡變化的改變。因?yàn)楹茈y短時(shí)間做到跟蹤一個(gè)人幾十年的聲音，所以實(shí)驗(yàn)的音頻來源采用了李谷一幾乎每年春晚都演唱的《難忘今宵》。并且采用《難忘今宵》也有另一原因：歌唱與講話不同，歌唱可以確定一個(gè)相對(duì)穩(wěn)定的音高，有效地為實(shí)驗(yàn)控制了變量。如楊婧在其學(xué)術(shù)論文中所言，樂音信號(hào)與語(yǔ)音信號(hào)相比更具有明顯的諧波特征。

從第一次演唱的1984到最近期的2019，時(shí)間跨度為三十五年，除去一些并非李谷一演唱的部分，大概可以留下13份左右的樣本，數(shù)據(jù)較為充足。我兩次截取了所有不同年份音頻之中的“忘”字以及“宵”字。

伴奏音樂其實(shí)是一個(gè)實(shí)驗(yàn)中非常大的干擾。一開始我粗糙截取了她演唱的整個(gè)音，但它們的伴奏往往在后半段掩蓋了人聲，導(dǎo)致音頻價(jià)值較低。所以我使用adobe audition較精細(xì)地裁剪掉了后邊樂聲掩蓋了人聲的部分。

3.3 頻譜分析

我將音頻導(dǎo)入sigview后，進(jìn)行了fft分析。如圖4所示，藍(lán)色是打開音頻時(shí)的初始狀態(tài)，是橫軸為時(shí)間的圖像；紅色則是傅里葉變換后輸出的頻譜。這一步操作完畢以后得到近三十份的頻譜便是我的“原始數(shù)據(jù)”了。

▲ 圖3.3.1 1990年“宵”字音頻分析

“數(shù)據(jù)收集”可以說是本實(shí)驗(yàn)中遇到的一個(gè)挺大的困難，這是與我實(shí)驗(yàn)本身的特性相關(guān)的。經(jīng)過fft分析以后得到的數(shù)據(jù)是原始的、復(fù)雜的、凌亂的，所以我在抉擇到底采用那些數(shù)據(jù)作為有效數(shù)據(jù)時(shí)遇到了困難。為了避免混亂，得到一個(gè)固定的數(shù)據(jù)收集方式是非常重要的。下文將簡(jiǎn)單展示本人在確定數(shù)據(jù)收集方式時(shí)，多方面的分析與考量。

3.3.1 基頻數(shù)據(jù)錄入方式

錄入基頻數(shù)據(jù)從三方面著手：

1. 假設(shè)其為基頻，是否能尋找到其對(duì)應(yīng)倍頻

2. 是否落在歌曲中該音的范圍內(nèi)（“忘”：392Hz-415Hz，“宵”：440-460Hz）

3. 以上二者任意答案為否的備選峰值直接排除，若仍有多選項(xiàng)，取其y值明顯更高的。

若并不存在“明顯更大”，則改組數(shù)據(jù)不參與分析計(jì)算，僅作參考。

3.3.2 倍頻數(shù)據(jù)錄入方式

倍頻數(shù)據(jù)的錄入都是基于一個(gè)已經(jīng)確定的基頻之上的，要同時(shí)用到“set harmonic marker”、“show 5 highest points”兩個(gè)sigview的自帶功能。第一個(gè)是可以選定一個(gè)頻率以后自動(dòng)顯示出它所有理論倍頻的所在位置。“show 5 highest points”同字面意思，會(huì)顯示出你框定范圍內(nèi)的五個(gè)最高點(diǎn)并直接讀出此點(diǎn)坐標(biāo)。

左下圖的情況（紅圈為理論倍頻，藍(lán)色為實(shí)際峰值）是容易解決的，直接將理論倍頻往最近最高的峰值靠攏即可，但如果遇到右下圖這種情況，又該如何？左側(cè)不遠(yuǎn)處是最高峰，右側(cè)更近一點(diǎn)的地方是次高峰，那么取峰值更大的還是取更近的？實(shí)際操作一下就不難發(fā)現(xiàn)，取最高峰非常好操作，答案也唯一。反之，如果把“取更近的”作為規(guī)則，那么在遇到圖5情況時(shí)，就得不到答案了。

▲ 圖3.3.2 倍頻數(shù)據(jù)錄入案例-簡(jiǎn)單

▲ 圖3.3.3 倍頻數(shù)據(jù)錄入案例-復(fù)雜

圖5中，如果按照取最近峰值的原則，4號(hào)點(diǎn)應(yīng)該是首推，但4號(hào)點(diǎn)的縱軸數(shù)值極小。那在就近的原則下，再取了3號(hào)點(diǎn)作為最終數(shù)據(jù)。但一比對(duì)，最高峰1號(hào)似乎只比三號(hào)點(diǎn)略遠(yuǎn)非常微弱的一點(diǎn)點(diǎn)，卻在縱軸數(shù)值上大了一倍，二者便很難取舍了……這種混亂的取值方式是行不通的，因?yàn)樵谶x擇過程中，只要數(shù)據(jù)采集者隨意地心念一動(dòng)，最終的取值就會(huì)發(fā)生翻天覆地的變化，數(shù)據(jù)也就失去了它應(yīng)有的價(jià)值。

故而，在所有倍頻數(shù)據(jù)的采集過程當(dāng)中，我都是直接取了候選名單中的最高峰。這樣子完全地杜絕了采集標(biāo)準(zhǔn)搖擺不定帶來的問題，但這樣做同時(shí)也可能在實(shí)驗(yàn)中留下問題——憑什么最大值就是真正應(yīng)該選擇的倍頻呢？理由有二：

第一，在這些候選峰值之中，橫坐標(biāo)的差值是非常小的，往往都在理論值的正負(fù)0.1-0.7%的區(qū)間內(nèi)。上圖是為了凸顯選擇數(shù)據(jù)的糾結(jié)所以把圖像放得很大，但實(shí)際上，往往橫坐標(biāo)只浮動(dòng)了幾赫茲就能讓縱坐標(biāo)翻一倍、甚至三四倍，那么取舍也很分明了。

第二，李谷一她自己唱出的聲音并不完美，有多個(gè)峰值是正?，F(xiàn)象。雖然我記錄的n次倍頻不能全然代表整段的n次諧波，但它是這一段諧波里最能代表這段諧波的峰值。

故而經(jīng)過仔細(xì)取舍，我最終選擇采取“取最高峰”的方式來記錄倍頻的值。

04 數(shù)據(jù)分析

我的基礎(chǔ)數(shù)據(jù)來源于兩波樣本——聲源為“忘”字的12份、聲源為“宵”字的12份。其中“宵”字樣本的質(zhì)量我觀察下來是更高的，所以在之后也會(huì)使用的略多一點(diǎn)。

在第二部分“原理”中，已經(jīng)解釋了基頻與倍頻的關(guān)系——倍頻頻率按理論來說必然是基頻頻率的整數(shù)倍。回顧我們得到理想公式的諸多假設(shè)，其中兩點(diǎn)實(shí)際上并不能完全成立：一.振動(dòng)的弦長(zhǎng)度是一定的。二.弦是各處均勻的。人的聲帶在振動(dòng)時(shí)長(zhǎng)度是一定的嗎？人的聲帶是均勻的嗎？正是因?yàn)檫@些假設(shè)我們不能保證，所以說會(huì)出現(xiàn)各種具有研究意義的誤差以及有意思的現(xiàn)象，也能觀察到一些規(guī)律。

4.1 峰值偏離與是年齡關(guān)系

4.1.1 峰值偏移與年齡觀察

在理想模型里面，倍頻應(yīng)該是嚴(yán)謹(jǐn)?shù)厥腔l的整數(shù)倍。所以我在最開始時(shí)，是非常嚴(yán)格地遵守這一條規(guī)則去采集數(shù)據(jù)的。但是我逐漸發(fā)現(xiàn)，恰在x值=基頻整數(shù)倍的時(shí)候，y值并不在峰之上，甚至還有的恰好落在了谷底，那樣子的得到的y值數(shù)據(jù)十分不恰當(dāng)。所以在實(shí)驗(yàn)進(jìn)程初期個(gè)人就有猜測(cè)：當(dāng)把理論體系搬運(yùn)到實(shí)際實(shí)驗(yàn)中時(shí)，因?yàn)榉N種理想假設(shè)失效，會(huì)出現(xiàn)一些小誤差。得出這個(gè)結(jié)論以后，我轉(zhuǎn)變了數(shù)據(jù)的采集方法，也開始深入研究真實(shí)峰值與理論峰值的偏離與年齡的關(guān)系。

在這個(gè)問題中首先要把握住“偏離”這個(gè)詞匯，也由此延伸出兩條不同的道路——分析差值，分析比值。

基礎(chǔ)數(shù)據(jù)中不難發(fā)現(xiàn)，在倍頻倍數(shù)增大的同時(shí)，理論峰值與真實(shí)峰值橫坐標(biāo)上的差值也在增大。可是這個(gè)趨勢(shì)并不意為著什么，分析差值的大小我個(gè)人認(rèn)為不可取。第一、這個(gè)偏離的產(chǎn)生雖然原因不明，但偏離的大小是很可能與基頻取值相關(guān)的，表中可見每年的基頻都有變化，未經(jīng)過歸一化就去分析相當(dāng)于忽視了基頻取值這一變量，讓基頻不同的年份無法統(tǒng)一分析。第二、在倍頻被得出的過程中，牽涉到的變量?jī)H僅有“基頻”與“倍頻是乘以幾”這兩項(xiàng)，所以在同一年中基頻固定時(shí)，造成這個(gè)偏離的只能是來源于“真實(shí)乘上去的數(shù)”與“理論上應(yīng)乘上去的數(shù)”不一樣。倍頻是一個(gè)經(jīng)過乘法（而不是加減）得到的數(shù)據(jù)，所以該分析是真實(shí)測(cè)出的倍頻與整數(shù)倍倍頻的比值（而不是差值）。

所以我放棄了對(duì)于數(shù)據(jù)散亂的差值的分析，轉(zhuǎn)入對(duì)于比值的分析。在此部分中，新的問題又涌現(xiàn)出來，這也是我至今并未給出確定答案的——如何用幾個(gè)已知的變量去定義這個(gè)偏離？我在嘗試中從三種思路提出了三種效果不同但各有道理的方案：

令基頻=b，諧波次數(shù)=n，真實(shí)頻率=t，abs()為取絕對(duì)值函數(shù)，理論頻率=b · n

三個(gè)方案的數(shù)據(jù)意義是不同的。第一個(gè)反應(yīng)的是真實(shí)與理論的差值以真實(shí)頻率值為參考的偏離率；第二個(gè)反應(yīng)的是真實(shí)與理論的差值以理論值為參考的偏離率；第三個(gè)反應(yīng)的則是基頻與倍頻的直接運(yùn)算關(guān)系，即基頻*（h(x)+n）=倍頻。在三者都各自有其不可替代的意義的情況下，我把三種分析方式的結(jié)果都羅列了出來。另外，為了對(duì)于每一年的總體偏離狀況有一個(gè)總體的了解，我把2-8次諧波的偏離率全部相加，得到了total一欄。此處以“宵”字為例，計(jì)算得三張表格：

年份	f(x) total	g(x) total	h(x) total
2019	0.037030	0.036831	0.153925
2018	0.040015	0.040001	0.187327
2017	0.014949	0.014903	0.061542
2016	0.035468	0.035663	0.120753
2015	0.040381	0.040372	0.172545
2014	0.045170	0.045437	0.204236
2013	0.051366	0.051117	0.247460
2011	0.045015	0.045084	0.265867
1996	0.025946	0.025933	0.108896
1992	0.019542	0.019492	0.091860
1990	0.032161	0.032152	0.145650
1984	0.032722	0.032963	0.132432

（注：在求和時(shí)考慮到有些年份觀察不到某些次數(shù)的諧波，所以在計(jì)算時(shí)引入變量k，表示有k個(gè)諧波是觀測(cè)不到的。因?yàn)橛^測(cè)不到諧波并不能夠證明偏離是沒有的，所以為公平起見，total這個(gè)量在通加的基礎(chǔ)上進(jìn)行覆蓋：

total=total·7/(7-k)。）

三者雖然不盡相同，但三個(gè)公式得出的值的大趨勢(shì)是一樣的。根據(jù)數(shù)據(jù)制作的相應(yīng)變化趨勢(shì)圖如下圖所示：

▲ 圖4.1.1 年份與偏離率相關(guān)趨勢(shì)圖

1997-2010年間，因?yàn)槔罟纫徊⑽囱莩?，所以?shù)據(jù)缺失，這是本實(shí)驗(yàn)的一個(gè)遺憾。根據(jù)先前他人的研究，一個(gè)字的發(fā)音方式不同也會(huì)對(duì)于這個(gè)實(shí)驗(yàn)帶來影響1，并且也不好確定不同歌里面的音調(diào)是否一致，所以缺失年份數(shù)據(jù)很難補(bǔ)充。

回到這三張圖，可以看到他們大趨勢(shì)一致：其偏離率都隨著演唱者年齡的增大而增大。這個(gè)趨勢(shì)作為結(jié)論不夠嚴(yán)謹(jǐn)，因?yàn)槿匀荒芸吹侥挲g增大、偏離卻減小的許多例子。本人認(rèn)為這與基音可能有關(guān)，此問題將在下一部分中解釋。

4.1.2 峰值偏移、基頻頻率與年齡關(guān)系

隨著李谷一年齡的增長(zhǎng)，她歌唱的基音是在下降的。比如“忘”字：（為了讓這個(gè)下降表現(xiàn)得更加直觀，它的頻率的數(shù)值統(tǒng)一被減去了385 Hz）。又如“宵”字，仍然是明顯的下降趨勢(shì)。隨著演唱者年齡的增大，她有意或無意地降低了基音的高度?？v觀1984-2019的35年，在兩個(gè)音的演唱中都大約下降了20-25 Hz，不過仍然還處在半音范圍內(nèi)。

▲ 圖4.1.2 忘與宵基頻下降趨勢(shì)

年紀(jì)增長(zhǎng)時(shí)基頻有所下降并不難理解，相比更有趣的事情是峰值微弱偏離與基頻的存在的一種互動(dòng)。我們把2011-2019年這一段數(shù)據(jù)密集的內(nèi)容單獨(dú)拿出，并把他們n次諧波的x值分別除以n來反應(yīng)偏移。

▲ 圖4.1.3 反映偏離程度的折線圖

可以看到在2011年時(shí)它的五種顏色的點(diǎn)都很接近，沒有較大的偏離且基頻教高；2013年，即年齡+2后，幾個(gè)點(diǎn)的偏移略微增大（這與我4.2.1對(duì)于偏離率增大的趨勢(shì)是吻合的），同時(shí)基音下降；2014年基音抬高，讓五個(gè)點(diǎn)的上下浮動(dòng)達(dá)到了一個(gè)峰值，偏離嚴(yán)重；2015年，基音重新降下來以后這個(gè)浮動(dòng)也有縮小；2016年基音再抬升，偏移達(dá)到最大值；2017基頻下降，偏移縮??；2018年基頻沒有下降，偏移增大；2019年基頻下降，偏移縮小。

就本圖中的三個(gè)變量：年齡、基音、偏移而言，年齡的增長(zhǎng)是客觀的，偏移來源于聲帶的條件，唯獨(dú)“基音”是一個(gè)可以隨著演唱者主觀意志而改變的。正是因?yàn)檫@種主觀意志的影響，所以對(duì)于“基音”我們僅把握住一個(gè)大趨勢(shì)即可。同時(shí)我們也發(fā)現(xiàn)，在年齡增加的過程中，每一次基音的抬高都帶來了偏移程度的擴(kuò)大。做一個(gè)總結(jié)，基音的升高與年齡的增長(zhǎng)都會(huì)導(dǎo)致偏移程度的增加，而基音降低可以導(dǎo)致偏移程度降低。

把樣本擴(kuò)大進(jìn)行進(jìn)一步分析。本圖的擴(kuò)大體現(xiàn)在兩方面：年份添加了1984、1990、1992、1996四份數(shù)據(jù)，諧波最高次數(shù)從上一張的5次提升到了7次?；l為黑色，而2-7次諧波x值除以各自次數(shù)分別為紅色、綠色、藍(lán)色、淡紫色、黃色、深紫色。

▲ 圖4.1.4 反應(yīng)偏離的折線圖全圖

在這一張圖中，通過圖像與數(shù)據(jù)可以發(fā)現(xiàn)，這組數(shù)據(jù)完全滿足結(jié)論：1.隨著年齡增長(zhǎng)，每一次基音的抬高都會(huì)導(dǎo)致偏移程度的增大。2.每一次基音的降低都會(huì)導(dǎo)致偏移程度的縮小。

第一條結(jié)論與第一張小范圍的數(shù)據(jù)分析結(jié)論是一致的，而第二條個(gè)人認(rèn)為是屬于巧合——基音降低使偏移縮小、年齡增加使偏移增加，兩個(gè)作用相反的變化同時(shí)存在，最后恰巧前者的影響力更大一些。

分兩次來制圖分析是我認(rèn)為有必要的。第一，1984-2010年跨越了26年卻僅有4份數(shù)據(jù)，要研究一個(gè)連貫的變化不如2011-2019年的數(shù)據(jù)有效。第二，諧波次數(shù)增加以后數(shù)據(jù)過于復(fù)雜，直接上手分析會(huì)造成困擾，不過最后發(fā)現(xiàn)的規(guī)律也得到了驗(yàn)證。

本章承接4.1.1峰值偏移與年齡的初步結(jié)論，觀察到偏移、基頻、年齡三者互動(dòng)關(guān)系的存在，為定量嘗試做了事實(shí)基礎(chǔ)。

4.2 基頻倍頻與峰值偏移與年齡相關(guān)分析

本部分旨在提出基于上文所觀察到明顯規(guī)律的進(jìn)一步探索的方法。

本部分將圍繞“關(guān)聯(lián)函數(shù)”（即兩個(gè)數(shù)組協(xié)方差比上各自標(biāo)準(zhǔn)差的值）展開。一般而言，兩個(gè)數(shù)組的關(guān)聯(lián)度如果可以達(dá)到0.9以上，那么就可以認(rèn)為是具有較強(qiáng)關(guān)聯(lián)性的。在初步嘗試中，本人將各年齡的峰值偏移總和作為數(shù)組A，各年齡的基音頻率作為數(shù)組B，經(jīng)計(jì)算得關(guān)聯(lián)函數(shù)等于0.61545。這個(gè)數(shù)據(jù)表明，三個(gè)因素在計(jì)算關(guān)聯(lián)函數(shù)是是必須要同時(shí)考慮到的。

為把“年齡”融入到這個(gè)關(guān)聯(lián)系數(shù)的計(jì)算當(dāng)中，經(jīng)過思考，我把[峰值偏移+f(相對(duì)年齡)]作為數(shù)組A，各年齡的基音頻率作為數(shù)組B進(jìn)行嘗試。相對(duì)年齡是我在這里使用的年齡計(jì)算方式，即把最早的1984年作為0，1990作為6，1992作為8，以此類推。

現(xiàn)在待確定的是這個(gè)f(x)到底是何種關(guān)系。因?yàn)槊恳淮斡?jì)算關(guān)聯(lián)系數(shù)步驟很復(fù)雜，所以我手動(dòng)計(jì)算不是很切實(shí)際，因?yàn)槲乙幚淼臄?shù)據(jù)量是極大的。鑒此，我用python簡(jiǎn)單地編程了一個(gè)程序來進(jìn)行計(jì)算。我先假設(shè)它的影響方式是一次的，設(shè)斜率為k，以0.1為步長(zhǎng)從0開始增大到100，又以0.1為步長(zhǎng)從0開始減小到100。下圖是結(jié)果展示，k>0時(shí)最大值在k=100時(shí)取到0.89左右，并仍然具有緩慢上升的趨勢(shì)，可能在0.90左右存在其漸近線。k<0時(shí)，最大值在k=-2時(shí)取到，為0.91141。由此，最合理的猜測(cè)是數(shù)組(峰值偏移-2*相對(duì)年齡)與數(shù)組f有關(guān)。

▲ 圖4.2.1 程序輸出結(jié)果

這個(gè)嘗試是初步的，具有很大的發(fā)展空間。

首先，年齡以正比例形式影響偏離量是我的假設(shè)，也有可能是有常數(shù)項(xiàng)的一次、二次、三次……在這個(gè)方案中，只需要略微改動(dòng)程序?yàn)殡p層嵌套、三層嵌套也能實(shí)現(xiàn)。其次，年齡是使用相對(duì)年齡還是李谷一本人的年齡有待考量。這兩種算法的結(jié)果是不一樣的，但這很可能牽涉到生物領(lǐng)域，要了解聲帶老化過程的起始點(diǎn)等等復(fù)雜因素。

希望本嘗試對(duì)于峰值偏移、年齡、基頻之間定量關(guān)系的探索有一定意義。

4.3 倍頻相對(duì)峰值偏移與年齡原因探索

先從基音隨年齡增長(zhǎng)而下降的趨勢(shì)說起，因?yàn)樵诖颂幱?jì)算還不涉及到倍頻峰值偏移的問題，所以用較理想的公式進(jìn)行計(jì)算。整理一下現(xiàn)有公式：u=λ•f；F=k•f；另外是波在弦中的速度u=根號(hào)下T/ρ，其中T 為張力，ρ為線密度。

最后得到的式子，拋開定量L與ρ，本質(zhì)是基頻與k、Δx二者變化的關(guān)系。粗淺來講，隨著一個(gè)人年齡增長(zhǎng)的聲帶肌肉老化松弛，這個(gè)系數(shù)k會(huì)降低，從而也在Δ降不發(fā)生改變的情況下使基頻f0下降，這也就能成功解釋在4.1.2開頭提到的現(xiàn)象了。

當(dāng)然，也很明顯這個(gè)下降是可以有意識(shí)地人為避免的，如果演唱者想要在年齡增大以后仍然保持基頻在同一高度，如果仍然對(duì)其施加一樣的力的話，T一定那么k下降則Δ降增大，結(jié)果是分子不變，分母變大，基音下降。想要使f0保持穩(wěn)定的關(guān)鍵是在于保持下式不變：

可見為使基頻穩(wěn)定，T隨k的減小應(yīng)當(dāng)減小，但這個(gè)減小的程度便涉及到這個(gè)復(fù)雜的函數(shù)了。所以本部分得出結(jié)論：由于肌肉的老化導(dǎo)致的松弛，使k減小從而導(dǎo)致基頻下降。演唱者通過有意識(shí)地抬高基頻可以緩解，并且在這個(gè)抬高的過程中肌肉拉力T會(huì)減小。

4.4 倍頻值歲年齡變化

上一部分是對(duì)于峰值x值的研究，而此板塊則是對(duì)于分析y值數(shù)據(jù)的嘗試。

初始數(shù)據(jù)因?yàn)橐粼错懚取㈦s音等問題雜亂無章，所以第一步要進(jìn)行歸一化。把每份音頻中基頻的y值定為1，那么其余峰值的y值也得相應(yīng)地縮小，匯入下表以后得到的便是比較有意義的數(shù)據(jù)（數(shù)據(jù)見附錄）。

把它們制圖后得到：

▲ 圖4.4.1 諧波值與基頻比值

▲ 圖4.4.2 歸一化后的y值

最明顯的現(xiàn)象是二次諧波、三次諧波的突出。如果把各年數(shù)據(jù)進(jìn)行累加則同時(shí)能在二次、三次諧波上面發(fā)現(xiàn)這一點(diǎn)。另外，把各個(gè)年份的同次諧波的y值進(jìn)行累加，也可以看到在其宵字中在七次諧波的一個(gè)略微上浮。

▲ / 各年份諧波折線圖

結(jié)合年齡來看，隨著李谷一年齡的增大，“宵”字同年各次諧波歸一化后y值之和隨著年齡增大而減?。ㄈ绫硭荆?ldquo;忘”字?jǐn)?shù)據(jù)則混亂不堪沒有規(guī)律，趨勢(shì)線為水平。結(jié)合上一章的分析，我認(rèn)為導(dǎo)致此結(jié)果的原因可能是李谷一隨著年齡上升，基頻各峰值趨于分散所致。正是這種分散，在我只采取最高峰值的數(shù)據(jù)收集方法下，很難觀察到隨年齡變化的結(jié)論。這一部分的分析是不成功的。

05 結(jié)論與展望

5.1 結(jié)論

這里我按照數(shù)據(jù)分析各板塊的順序來進(jìn)行結(jié)論的總結(jié)。

首先是在4.1.1中，通過不同的定量方式來考察“宵”字12份樣本中每一次峰值橫坐標(biāo)與理論的偏離程度，并發(fā)現(xiàn)隨著年齡上升，偏離率在三種定量方式中都處于上升的趨勢(shì)之中。隨后在4.1.2進(jìn)一步分析，加入基音頻率作為第三個(gè)變量分析，發(fā)現(xiàn)基音的上升和年齡的上升共同會(huì)導(dǎo)致偏離程度的加劇。此兩章論證了年齡增長(zhǎng)會(huì)導(dǎo)致這個(gè)偏離變大，但同時(shí)降低基頻可以一定程度上掩蓋此問題。

4.1.3是一個(gè)對(duì)上文三變量定量情況的討論，目前得出最合理的說法是：數(shù)組(峰值偏移-2*相對(duì)年齡)與基頻關(guān)聯(lián)度最大。這個(gè)嘗試具有可拓展性，也或許可以為定量表示聲帶衰老程度提供提示。

最后，在4.2中，我對(duì)于每一次峰值的y值進(jìn)行分析，發(fā)現(xiàn)二次、三次諧波顯著含能量更大。因?yàn)閿?shù)據(jù)采集方式問題導(dǎo)致此板塊無法深入分析。如果可以在進(jìn)一步研究中把圖像圍成的面積作為新的y值標(biāo)準(zhǔn)，或許會(huì)有新的突破。

5.2 展望

一方面，這個(gè)項(xiàng)目本身可以被進(jìn)一步優(yōu)化。

因?yàn)榍昂蟠隧?xiàng)目并前后用時(shí)也未超過一年，我是很難做到自己來做實(shí)驗(yàn)樣本的。所以就只能在網(wǎng)上去獲得實(shí)驗(yàn)樣本?！峨y忘今宵》作為一個(gè)跨度非常大而且還是同一位演唱者的一份數(shù)據(jù)在我看來已經(jīng)是非常好的突破口了。然而它也存在著伴奏音樂、背景噪聲、多次錄制使音頻質(zhì)量下降（它錄一次，我再錄一次）等等問題。如果能把這個(gè)項(xiàng)目作為一個(gè)長(zhǎng)期項(xiàng)目（至少……四五年）的話，一定會(huì)是對(duì)于實(shí)驗(yàn)的一個(gè)重要優(yōu)化。

我的對(duì)于這個(gè)課題所涉及的領(lǐng)域的了解還需要加深。舉一個(gè)例子，我在確定諧波峰值（見3.2.4）時(shí)最終統(tǒng)一采取了最高峰峰值，雖然成功避免了數(shù)據(jù)的混亂，但這樣子是不夠嚴(yán)謹(jǐn)?shù)?。我想可能是因?yàn)槲覍?duì)于諧波的認(rèn)知不夠到位所以才找不到一個(gè)更好的方法。

其實(shí)做這個(gè)項(xiàng)目的過程也是一個(gè)我自己去摸索去提高的過程，在我的認(rèn)知不斷地被新知更新的時(shí)候，許多原先做的老數(shù)據(jù)就會(huì)暴露出問題。我不斷地回過頭去刷新老數(shù)據(jù)實(shí)際上花了挺多時(shí)間。如果時(shí)間允許，我希望可以再多挑幾個(gè)字出來進(jìn)行研究來把這個(gè)數(shù)據(jù)量進(jìn)一步擴(kuò)大。相信那樣能讓我發(fā)現(xiàn)更多。

另一方面，這個(gè)項(xiàng)目在幾個(gè)點(diǎn)上可以被進(jìn)一步拓展：

此處引入的僅僅是“年齡”這個(gè)單一變量，那么性別呢？是否經(jīng)過訓(xùn)練呢？歌唱技巧呢？……更多的變量在一個(gè)全新的課題里是可以被拓展進(jìn)去的。

可觀測(cè)到的最高諧波次數(shù)到底與什么有關(guān)？這個(gè)問題在調(diào)查過程中就已經(jīng)引起了我的好奇了，為什么我第一波樣本里一般只能最高到達(dá)三次、四次，而第二波里卻能達(dá)到八次、九次？是時(shí)長(zhǎng)問題，還是強(qiáng)度問題，還是發(fā)音口型問題呢？

是否能將我的結(jié)論與生物板塊進(jìn)行更多的結(jié)合，而不要只是停留在發(fā)聲器官老化這一層上？（當(dāng)然我可以預(yù)想到，這個(gè)結(jié)合是對(duì)現(xiàn)在的我還是有一定技術(shù)困難的。）

聲帶老化在生物領(lǐng)域中更多是現(xiàn)象性的，如果本研究足夠成熟，本人認(rèn)為有可能可以作為定量聲帶衰老程度的一種方式。

音發(fā)聲研究[D]. 博士學(xué)位論文，北京大學(xué)，2010 [2]覃折波，何蕓，馮玉潔，郭燕麗，華興. 正常成人聲帶區(qū)解剖結(jié)構(gòu)的超聲成像[J]. 臨床超聲醫(yī)學(xué)雜志 2017，19(1):14-17 [3]鈴木徹. 聲帶肌的衰老變化[J]. 日本耳科會(huì)報(bào)1982,85(11):1469 [4]張雪源. 面向音頻檢索的音頻特征分析方法研究[D]. 博士學(xué)位論文，華南理工大學(xué)，2015 [5]黃天乾，謝志文. 鋼琴幅度譜的七、九次諧波對(duì)鋼琴音質(zhì)影響的研究[J]. 電聲基礎(chǔ) 2005，4:4-7 [6]楊婧. 基于諧波結(jié)構(gòu)的樂器音色提取方法研究[D]. 碩士學(xué)位論文，哈爾比工業(yè)大學(xué)，2018

信號(hào)與系統(tǒng)：聲音與年齡

01 引言

1.1 項(xiàng)目由來