APP下載

掃一掃,立即下載

醫(yī)學(xué)教育網(wǎng)APP下載

開發(fā)者:1

蘋果版本:1

安卓版本:1

應(yīng)用涉及權(quán)限:查看權(quán)限 >

APP:隱私政策:查看政策 >

微 信
醫(yī)學(xué)教育網(wǎng)微信公號(hào)

官方微信Yishimed66

您的位置:醫(yī)學(xué)教育網(wǎng) > 口腔執(zhí)業(yè)醫(yī)師 > 其他信息

不同語音輸入法的比較研究

  摘 要:目的 比較不同語音輸入法的異同,為進(jìn)一步認(rèn)識(shí)漢語病理性語言的音聲特征提供參考。方法 11例腭咽閉合功能不全患者,男性6例,女性5例;年齡7~35歲,平均16.18歲。被檢敏感音為/m/、/pa/、/ku/,分別直接和間接輸入計(jì)算機(jī)語音工作站,測定音長、能量、音高和第一、二、三共振峰,并使用統(tǒng)計(jì)軟件(SPSS9.0)對數(shù)據(jù)進(jìn)行處理和分析。結(jié)果 兩種語音輸入法的音長、音高和第一共振峰無明顯差異(P>0.05),而能量和第二、三共振峰有明顯差異(P<0.01)。結(jié)論 直接語音輸入法和間接語音輸入法有一定的區(qū)別,二者不能互相代替。

  在唇腭裂序列治療中,語音治療已越來越受到廣大臨床醫(yī)師的重視。但有關(guān)病理性語音的研究在國內(nèi)尚不多見。隨著計(jì)算機(jī)技術(shù)的高速發(fā)展,計(jì)算機(jī)語音工作站(computerspeechlab,CSL)也已進(jìn)入了語音研究領(lǐng)域,它可以直接對語音進(jìn)行圖像化和定理分析,使“只能聽”的聲音“可視化”,使人們對語音的特性有了更加深入、全面的了解。由于大量的臨床語音資料均由磁帶保存,本文通過對病理性語音的直接輸入和間接輸入進(jìn)行對照研究,希望能夠闡明兩種方法之間的異同,為進(jìn)一步認(rèn)識(shí)漢語病理性語音的音聲特征提供參考。醫(yī)學(xué)教育網(wǎng)搜集整理

  1.材料與方法

  研究對象:選自1999年6月~1999年9月在上海第二醫(yī)科大學(xué)附屬第九人民醫(yī)院口腔頜面外科確診的11例腭咽閉合功能不全(velopharyngealincompetence,VPI)患者,男性6例,女性5例,年齡7~35歲,平均16.18歲,其中6例為腭裂術(shù)后腭咽閉合功能不全,3例為咽成形術(shù)后腭咽閉合功能不全,2例為先天性腭咽閉合功能不全。所有患者智力正常,無明顯聽力障礙,熟練掌握普通話,未接收過語音治療。

  研究方法:被檢者取坐位,自然放松,距麥克風(fēng)5cm,練習(xí)被檢敏感音/m/、/pa/、/ku/后,直接輸入CSL4300B(美國KAY公司)和錄音(日本松下公司EAC錄音器材)。錄音機(jī)距麥克風(fēng)5cm,磁帶播放錄音再次輸入CSL.樣本采樣頻率為10000Hz,均測量音長(DOMAIN)、能量(ENERGY)、音高(PITCH)和第一、二、三共振峰(FORMANT)的平均值。重復(fù)三次,取平均值。使用SPSS9.0對數(shù)據(jù)行配對t檢驗(yàn)。

  2.結(jié)果

  間接輸入法的平均能量較直接輸入法低,而它的第二、三共振峰的平均值較直接輸入法高(見表1),且有統(tǒng)計(jì)學(xué)上的差異(P<0.01),見表2.直接輸入法的音長、音高和第一共振峰的平均值較間接輸入法高,但無統(tǒng)計(jì)學(xué)上的差異(P>0.05),見表2。

表1 統(tǒng)計(jì)量 

      均值  例數(shù) 標(biāo)準(zhǔn)差 標(biāo)準(zhǔn)誤
1 

音長a
音長b(SEC)

33
 33 
0.568
 0.551
0.123
 0.138
0.021
 0.024 
2  能量a
能量b(dB)
33
 33 
67.627
 61.965
6.097
 6.900
1.061
 1.201 
3  音高a
音高b(H2
33
 33 
200.899
 192.945 
47.001
 44.261 
8.182
 7.705 
4  第一共振峰a
第二共振峰b(H2) 
33
 33 
461.617
 427.653 
177.252
 162.330 
30.856
 28.258 
5  第二共振峰a
第地共振峰b(H2
33
 33 
1240.445
 1413.815 
235.222
 216.350 
40.947
 37.662 
6  第三共振峰a
第三共振峰b(H2) 
33
 33 
2249.395
 2438.370 
257.777
 218.276 
44.873
 37.997 

  注:末位字母為a是直接輸入法,末位字母為b是間接輸入法。

  3.討論

  CSL:CSL是一種動(dòng)態(tài)音頻頻譜分析議,可將聲音信號(hào)轉(zhuǎn)變?yōu)榭梢晥D譜并輸入計(jì)算機(jī),具有語音信號(hào)獲取、分析、編輯和回放功能,能提供圖譜中的各種物理量并顯示它們之間的動(dòng)態(tài)關(guān)系。它操作簡單、技術(shù)先進(jìn),分析手段主要包括波形圖、FFT頻譜和LPC濾波曲線、語圖和音高,為語音學(xué)研究提供了一種準(zhǔn)確而有效的儀器,也是目前國際上在語音分析中最常用和先進(jìn)的儀器之一。它的優(yōu)點(diǎn)為:對患者無損害,不帶來痛苦,在學(xué)齡前兒童中也可廣泛應(yīng)用,既可研究元音,又可研究輔音,重復(fù)性和可靠性好。其不足之處是需要有一定的專業(yè)知識(shí),同時(shí)其價(jià)格昂貴,還需要計(jì)算機(jī)、打印機(jī)和電腭圖等配套設(shè)備,難以在基層醫(yī)院推廣。

  VPI的診斷:VPI的診斷并不復(fù)雜,常包括以下幾個(gè)方面:詳細(xì)詢問病史、體格檢查、語音清晰度測試、輔助檢查(包括X線、內(nèi)窺鏡、呼氣流體力學(xué)、超聲、電腭圖、EMG、CT等)和智力、個(gè)性和可教性的評價(jià)(包括IQ測試,個(gè)性測試和其它測試)。值得注意的是語音清晰度測試的手段。國際上通常是使用各種嚴(yán)格設(shè)計(jì)且經(jīng)過科學(xué)論證的字表進(jìn)行測試。如美國一般使用IowaPressureArticulationTest(IPAT),現(xiàn)在國內(nèi)也有類似的《漢語語音清晰度測試字表》。它既能較全面地評價(jià)語音障礙的程度,又能客觀地語音反映障礙的類型。還有比較重要的VPI的臨界值,Warren(1964)用氣流動(dòng)力學(xué)方法對健康人和腭咽模型進(jìn)行的試驗(yàn)研究表明區(qū)別腭咽閉合是否完善的腭咽口面積的臨界值是20mm2,McWilliams(1981)采用鼻流計(jì)、壓力氣流儀、口腔氣壓計(jì)、和多位X線電影投照等四種方法結(jié)合語音檢查對腭裂術(shù)后患者的腭咽閉合狀況進(jìn)行了深入的研究,提出應(yīng)將臨界值修訂的15mm2,腭咽口面積0~5mm2者可認(rèn)為有完善的腭咽閉合。Mayo(1998)再次將臨界值修訂為10mm2.也有學(xué)者(1985)認(rèn)為語音效果優(yōu)劣的不一定與腭咽通道的大小有直接關(guān)系,腭咽結(jié)構(gòu)的神經(jīng)肌肉運(yùn)動(dòng)模式才是最主要的影響因素??偠灾?,腭咽口閉合面積是一個(gè)重要依據(jù),但它并非是診斷VPI的唯一標(biāo)準(zhǔn)。

表2 配對t檢驗(yàn)

      均值 標(biāo)準(zhǔn)差  標(biāo)準(zhǔn)誤  t 自由度  概率 
1  音長 0.017 0.190 0.033  0.522  32 0.605 
2  能量 5.662 4.576 0.797  7.108  32 0.000 
3  音高 7.953 40.556 7.060  1.127  32 0.268 
4  第二共振峰  33.963 127.678  22.226  1.528  32 0.136 
5  第二共振峰  -173.370  219.213  38.160  -4.543  32 0.000 
6  第三共振峰  -188.975  217.105  37.793  -5.000  32 0.000 

  被檢音的選擇:音聲研究中被檢音的選定非常重要。VPI患者的異常語音有其自身的特點(diǎn),以輔音為主,其語音清晰度往往較低,通常包括聲門爆破音、咽喉爆破音、咽喉摩擦音等。本研究所選的/pa/、/ku/均為VPI患者的敏感音,它們最容易在聲門爆破音和咽喉爆破音中檢測出。/m/為雙唇鼻輔音,它代表聲波在鼻腔內(nèi)的共振狀況,對于過低鼻音的檢測有重要的意義。此三個(gè)音節(jié)也是選自于《漢語語音清晰度測試字表》。醫(yī)學(xué)教育網(wǎng)搜集整理

  語音的特征:音色、音高、響度和音長是語音的四要素。它們?yōu)楣P者提供了區(qū)別所有語音的最方便的方法。音色是聲音互相產(chǎn)生區(qū)別的本質(zhì)特征。發(fā)音方法、發(fā)音體以及共鳴腔形態(tài)的不同都會(huì)產(chǎn)生音色上的差異。對音色的區(qū)別可以通過波形、共振峰頻率等表征語音聲學(xué)特征的物理量表現(xiàn)。國內(nèi)有學(xué)者報(bào)道:“腭裂語音”的第一共振峰與正常人接近,而第二、三共振峰均低于正常人。本研究選擇了第一至三共振峰為對象,第一共振峰與開口度成正比;第二共振峰與舌位前后成反比,也與園唇有關(guān),唇越園,第二共振峰越低;第三共振峰與軟腭的升降有關(guān),軟腭降低,咽腔面積增大,第三共振峰就越低。根據(jù)本研究結(jié)果:兩種語音輸入法的第一共振峰無統(tǒng)計(jì)學(xué)差異,這是因?yàn)榛颊咴诎l(fā)相同音節(jié)時(shí)開口度不會(huì)有較大變化。而間接輸入法的第二、三共振峰明顯高于直接輸入法,這可能與錄放音器材對不同頻率的語音處理不同有關(guān),也可能與患者對敏感音的不穩(wěn)定發(fā)聲有關(guān)。音高是一種聽覺的主觀心理量,人們對聲音信號(hào)頻率的感覺表現(xiàn)為音調(diào)的高低,即音量。任何聲音都有基頻和許多諧波組成。音高的確切數(shù)值用聲音的基頻表示,而不包括聲音的諧波部分。本研究顯示:兩種語音輸入法的音高無統(tǒng)計(jì)學(xué)差異。這說明錄音對聲音的基頻影響較小。響度也是一種聽覺的主觀心理量,它受聲強(qiáng)的制約。音接輸入法的能量值明顯低于直接輸入法,可能與錄放音過程中能量的損耗有關(guān),也可能與每次發(fā)音的響度不同有關(guān)。音長在輔音中非常重要,起著區(qū)別特征的作用。它包括聲母時(shí)長和韻母時(shí)長。本研究所指音長是指整個(gè)音節(jié)的長度。兩種輸入法的音長基本相同。這說明患者每次發(fā)音的長短基本一致。

  綜上所述,直接語音輸入法和間接語音輸入法雖然在音高、音長和第一共振峰上保持一致,但在決定音色的第二、三共振峰上有明顯的差別。這說明二者難以互相代替。建議在語音研究中固定使用一種輸入法,以保持?jǐn)?shù)據(jù)的準(zhǔn)確性和可靠性。

題庫小程序

相關(guān)資訊
編輯推薦
    • 免費(fèi)試聽
    • 免費(fèi)直播
    鴻 儒 口腔執(zhí)業(yè)醫(yī)師 《口腔解剖生理學(xué)》 免費(fèi)試聽
    免費(fèi)資料
    口腔執(zhí)業(yè)醫(yī)師 備考資料包
    歷年考點(diǎn)
    應(yīng)試指導(dǎo)
    仿真試卷
    思維導(dǎo)圖
    立即領(lǐng)取
    回到頂部
    折疊
    您有一次專屬抽獎(jiǎng)機(jī)會(huì)
    可優(yōu)惠~
    領(lǐng)取
    優(yōu)惠
    注:具體優(yōu)惠金額根據(jù)商品價(jià)格進(jìn)行計(jì)算
    恭喜您獲得張優(yōu)惠券!
    去選課
    已存入賬戶 可在【我的優(yōu)惠券】中查看