天
- 免費(fèi)試聽
- 免費(fèi)直播
10月30日 19:00-21:00
詳情9月25日 19:30-21:00
詳情摘 要:目的 比較不同語音輸入法的異同,為進(jìn)一步認(rèn)識(shí)漢語病理性語言的音聲特征提供參考。方法 11例腭咽閉合功能不全患者,男性6例,女性5例;年齡7~35歲,平均16.18歲。被檢敏感音為/m/、/pa/、/ku/,分別直接和間接輸入計(jì)算機(jī)語音工作站,測定音長、能量、音高和第一、二、三共振峰,并使用統(tǒng)計(jì)軟件(SPSS9.0)對數(shù)據(jù)進(jìn)行處理和分析。結(jié)果 兩種語音輸入法的音長、音高和第一共振峰無明顯差異(P>0.05),而能量和第二、三共振峰有明顯差異(P<0.01)。結(jié)論 直接語音輸入法和間接語音輸入法有一定的區(qū)別,二者不能互相代替。
在唇腭裂序列治療中,語音治療已越來越受到廣大臨床醫(yī)師的重視。但有關(guān)病理性語音的研究在國內(nèi)尚不多見。隨著計(jì)算機(jī)技術(shù)的高速發(fā)展,計(jì)算機(jī)語音工作站(computerspeechlab,CSL)也已進(jìn)入了語音研究領(lǐng)域,它可以直接對語音進(jìn)行圖像化和定理分析,使“只能聽”的聲音“可視化”,使人們對語音的特性有了更加深入、全面的了解。由于大量的臨床語音資料均由磁帶保存,本文通過對病理性語音的直接輸入和間接輸入進(jìn)行對照研究,希望能夠闡明兩種方法之間的異同,為進(jìn)一步認(rèn)識(shí)漢語病理性語音的音聲特征提供參考。醫(yī)學(xué)教育網(wǎng)搜集整理
1.材料與方法
研究對象:選自1999年6月~1999年9月在上海第二醫(yī)科大學(xué)附屬第九人民醫(yī)院口腔頜面外科確診的11例腭咽閉合功能不全(velopharyngealincompetence,VPI)患者,男性6例,女性5例,年齡7~35歲,平均16.18歲,其中6例為腭裂術(shù)后腭咽閉合功能不全,3例為咽成形術(shù)后腭咽閉合功能不全,2例為先天性腭咽閉合功能不全。所有患者智力正常,無明顯聽力障礙,熟練掌握普通話,未接收過語音治療。
研究方法:被檢者取坐位,自然放松,距麥克風(fēng)5cm,練習(xí)被檢敏感音/m/、/pa/、/ku/后,直接輸入CSL4300B(美國KAY公司)和錄音(日本松下公司EAC錄音器材)。錄音機(jī)距麥克風(fēng)5cm,磁帶播放錄音再次輸入CSL.樣本采樣頻率為10000Hz,均測量音長(DOMAIN)、能量(ENERGY)、音高(PITCH)和第一、二、三共振峰(FORMANT)的平均值。重復(fù)三次,取平均值。使用SPSS9.0對數(shù)據(jù)行配對t檢驗(yàn)。
2.結(jié)果
間接輸入法的平均能量較直接輸入法低,而它的第二、三共振峰的平均值較直接輸入法高(見表1),且有統(tǒng)計(jì)學(xué)上的差異(P<0.01),見表2.直接輸入法的音長、音高和第一共振峰的平均值較間接輸入法高,但無統(tǒng)計(jì)學(xué)上的差異(P>0.05),見表2。
表1 統(tǒng)計(jì)量
均值 | 例數(shù) | 標(biāo)準(zhǔn)差 | 標(biāo)準(zhǔn)誤 | ||
1 |
音長a |
33 33 |
0.568 0.551 |
0.123 0.138 |
0.021 0.024 |
2 | 能量a 能量b(dB) |
33 33 |
67.627 61.965 |
6.097 6.900 |
1.061 1.201 |
3 | 音高a 音高b(H2) |
33 33 |
200.899 192.945 |
47.001 44.261 |
8.182 7.705 |
4 | 第一共振峰a 第二共振峰b(H2) |
33 33 |
461.617 427.653 |
177.252 162.330 |
30.856 28.258 |
5 | 第二共振峰a 第地共振峰b(H2) |
33 33 |
1240.445 1413.815 |
235.222 216.350 |
40.947 37.662 |
6 | 第三共振峰a 第三共振峰b(H2) |
33 33 |
2249.395 2438.370 |
257.777 218.276 |
44.873 37.997 |
注:末位字母為a是直接輸入法,末位字母為b是間接輸入法。
3.討論
CSL:CSL是一種動(dòng)態(tài)音頻頻譜分析議,可將聲音信號(hào)轉(zhuǎn)變?yōu)榭梢晥D譜并輸入計(jì)算機(jī),具有語音信號(hào)獲取、分析、編輯和回放功能,能提供圖譜中的各種物理量并顯示它們之間的動(dòng)態(tài)關(guān)系。它操作簡單、技術(shù)先進(jìn),分析手段主要包括波形圖、FFT頻譜和LPC濾波曲線、語圖和音高,為語音學(xué)研究提供了一種準(zhǔn)確而有效的儀器,也是目前國際上在語音分析中最常用和先進(jìn)的儀器之一。它的優(yōu)點(diǎn)為:對患者無損害,不帶來痛苦,在學(xué)齡前兒童中也可廣泛應(yīng)用,既可研究元音,又可研究輔音,重復(fù)性和可靠性好。其不足之處是需要有一定的專業(yè)知識(shí),同時(shí)其價(jià)格昂貴,還需要計(jì)算機(jī)、打印機(jī)和電腭圖等配套設(shè)備,難以在基層醫(yī)院推廣。
VPI的診斷:VPI的診斷并不復(fù)雜,常包括以下幾個(gè)方面:詳細(xì)詢問病史、體格檢查、語音清晰度測試、輔助檢查(包括X線、內(nèi)窺鏡、呼氣流體力學(xué)、超聲、電腭圖、EMG、CT等)和智力、個(gè)性和可教性的評價(jià)(包括IQ測試,個(gè)性測試和其它測試)。值得注意的是語音清晰度測試的手段。國際上通常是使用各種嚴(yán)格設(shè)計(jì)且經(jīng)過科學(xué)論證的字表進(jìn)行測試。如美國一般使用IowaPressureArticulationTest(IPAT),現(xiàn)在國內(nèi)也有類似的《漢語語音清晰度測試字表》。它既能較全面地評價(jià)語音障礙的程度,又能客觀地語音反映障礙的類型。還有比較重要的VPI的臨界值,Warren(1964)用氣流動(dòng)力學(xué)方法對健康人和腭咽模型進(jìn)行的試驗(yàn)研究表明區(qū)別腭咽閉合是否完善的腭咽口面積的臨界值是20mm2,McWilliams(1981)采用鼻流計(jì)、壓力氣流儀、口腔氣壓計(jì)、和多位X線電影投照等四種方法結(jié)合語音檢查對腭裂術(shù)后患者的腭咽閉合狀況進(jìn)行了深入的研究,提出應(yīng)將臨界值修訂的15mm2,腭咽口面積0~5mm2者可認(rèn)為有完善的腭咽閉合。Mayo(1998)再次將臨界值修訂為10mm2.也有學(xué)者(1985)認(rèn)為語音效果優(yōu)劣的不一定與腭咽通道的大小有直接關(guān)系,腭咽結(jié)構(gòu)的神經(jīng)肌肉運(yùn)動(dòng)模式才是最主要的影響因素??偠灾?,腭咽口閉合面積是一個(gè)重要依據(jù),但它并非是診斷VPI的唯一標(biāo)準(zhǔn)。
表2 配對t檢驗(yàn)
均值 | 標(biāo)準(zhǔn)差 | 標(biāo)準(zhǔn)誤 | t | 自由度 | 概率 | ||
1 | 音長 | 0.017 | 0.190 | 0.033 | 0.522 | 32 | 0.605 |
2 | 能量 | 5.662 | 4.576 | 0.797 | 7.108 | 32 | 0.000 |
3 | 音高 | 7.953 | 40.556 | 7.060 | 1.127 | 32 | 0.268 |
4 | 第二共振峰 | 33.963 | 127.678 | 22.226 | 1.528 | 32 | 0.136 |
5 | 第二共振峰 | -173.370 | 219.213 | 38.160 | -4.543 | 32 | 0.000 |
6 | 第三共振峰 | -188.975 | 217.105 | 37.793 | -5.000 | 32 | 0.000 |
被檢音的選擇:音聲研究中被檢音的選定非常重要。VPI患者的異常語音有其自身的特點(diǎn),以輔音為主,其語音清晰度往往較低,通常包括聲門爆破音、咽喉爆破音、咽喉摩擦音等。本研究所選的/pa/、/ku/均為VPI患者的敏感音,它們最容易在聲門爆破音和咽喉爆破音中檢測出。/m/為雙唇鼻輔音,它代表聲波在鼻腔內(nèi)的共振狀況,對于過低鼻音的檢測有重要的意義。此三個(gè)音節(jié)也是選自于《漢語語音清晰度測試字表》。醫(yī)學(xué)教育網(wǎng)搜集整理
語音的特征:音色、音高、響度和音長是語音的四要素。它們?yōu)楣P者提供了區(qū)別所有語音的最方便的方法。音色是聲音互相產(chǎn)生區(qū)別的本質(zhì)特征。發(fā)音方法、發(fā)音體以及共鳴腔形態(tài)的不同都會(huì)產(chǎn)生音色上的差異。對音色的區(qū)別可以通過波形、共振峰頻率等表征語音聲學(xué)特征的物理量表現(xiàn)。國內(nèi)有學(xué)者報(bào)道:“腭裂語音”的第一共振峰與正常人接近,而第二、三共振峰均低于正常人。本研究選擇了第一至三共振峰為對象,第一共振峰與開口度成正比;第二共振峰與舌位前后成反比,也與園唇有關(guān),唇越園,第二共振峰越低;第三共振峰與軟腭的升降有關(guān),軟腭降低,咽腔面積增大,第三共振峰就越低。根據(jù)本研究結(jié)果:兩種語音輸入法的第一共振峰無統(tǒng)計(jì)學(xué)差異,這是因?yàn)榛颊咴诎l(fā)相同音節(jié)時(shí)開口度不會(huì)有較大變化。而間接輸入法的第二、三共振峰明顯高于直接輸入法,這可能與錄放音器材對不同頻率的語音處理不同有關(guān),也可能與患者對敏感音的不穩(wěn)定發(fā)聲有關(guān)。音高是一種聽覺的主觀心理量,人們對聲音信號(hào)頻率的感覺表現(xiàn)為音調(diào)的高低,即音量。任何聲音都有基頻和許多諧波組成。音高的確切數(shù)值用聲音的基頻表示,而不包括聲音的諧波部分。本研究顯示:兩種語音輸入法的音高無統(tǒng)計(jì)學(xué)差異。這說明錄音對聲音的基頻影響較小。響度也是一種聽覺的主觀心理量,它受聲強(qiáng)的制約。音接輸入法的能量值明顯低于直接輸入法,可能與錄放音過程中能量的損耗有關(guān),也可能與每次發(fā)音的響度不同有關(guān)。音長在輔音中非常重要,起著區(qū)別特征的作用。它包括聲母時(shí)長和韻母時(shí)長。本研究所指音長是指整個(gè)音節(jié)的長度。兩種輸入法的音長基本相同。這說明患者每次發(fā)音的長短基本一致。
綜上所述,直接語音輸入法和間接語音輸入法雖然在音高、音長和第一共振峰上保持一致,但在決定音色的第二、三共振峰上有明顯的差別。這說明二者難以互相代替。建議在語音研究中固定使用一種輸入法,以保持?jǐn)?shù)據(jù)的準(zhǔn)確性和可靠性。
天
10月30日 19:00-21:00
詳情9月25日 19:30-21:00
詳情官方公眾號(hào)
微信掃一掃
官方視頻號(hào)
微信掃一掃
官方抖音號(hào)
抖音掃一掃