基於混合集訓練的肺氣管聽診音分析兩用深度學習模型

研究焦點
  1. 研究結果:

根據我們的研究結果,相較於其他模型,NCs表現最差。這是因為肺聲音和氣管聲音在頻率範圍、能量下降、吸氣-呼氣持續時間比率以及暫停時段等方面都有不同[2]。此外,HF_Lung_V2和HF_Tracheal_V1的I、E和C標籤的平均持續時間之間存在明顯差異(請參閱表2)。大多數特徵分佈的差異源於在生成肺聲音和氣管聲音的物理和生理機制中存在的固有差異[58]。因此,在構建計算機分析模型時,未來的研究必須將肺聲音和氣管聲音視為兩個不同的領域。然而,不容忽視的是,用於記錄肺聲音[16],[24]和氣管聲音的不同設備可能也會產生一些特徵差異。此外,參與者的設置,例如使用機械通氣、供氧、麻醉深度、體位等,可能導致特徵分佈的差異。  正如表4所示,混合集訓練和領域適應可以提高肺聲音分析中吸氣和呼氣檢測的性能,以及氣管聲音分析中吸氣、呼氣和CAS檢測的性能。好處的程度可能取決於肺聲音和氣管聲音數據的組成;此外,當肺聲音和氣管聲音的數據規模增長到更大範圍時,無法保證這種好處仍然存在。然而,如表5中清楚顯示的,經混合集訓練的模型能夠處理包含混合肺聲音和氣管聲音數據的測試集。混合集訓練對於開發多功能呼吸監測器是一個有吸引力的選擇;用戶無需選擇特定通道或切換到特定算法進行肺或氣管聲音分析。  對於CAS檢測,氣管聲音的模型性能顯著優於肺聲音(見表4)。這可能是因為氣管聲音中的CAS聲音更大聲,提高了信噪比,有助於CAS模式識別。此外,HF_Lung_V2中的C標籤可能會有噪音,目前正在進行重新處理[16],[24]。此外,HF_Tracheal_V1中的CAS被認為主要是在吸氣階段發生的單音事件,表現為由麻醉藥物引起的胸外上氣道阻塞[59]。然而,HF_Lung_V2中的CAS可以分為吸氣、呼氣和雙相型式,並且可以是單音和多音事件[2]。因此,HF_Tracheal_V1中的CAS特徵不如HF_Lung_V2中的特徵多樣。  需要注意的是,本研究中的氣管聲音是從接受帶氧氣供應的受監護麻醉護理的參與者那裡收集的。氧氣供應產生了一致的額外背景噪音,降低了收集的氣管聲音的信噪比。然而,我們的模型表現出在輕微背景噪音干擾下學習吸氣、呼氣和CAS模式的能力。在受監護麻醉護理中,麻醉深度大多控制在中度水平,偶爾轉向較低或較深的水平。在輕度和中度麻醉中,參與者的氣道受到的影響不大,他們可以自行呼吸[47]。收集的氣管聲音仍然是通過相同的機制生成的,即空氣湍流通過咽喉和聲門[2],因此我們假設它們與正常氣管聲音差異不大。我們的訓練模型在應用於正常氣管聲音時表現良好。

  1. 研究貢獻與臨床應用:

肺聲音和氣管聲音的自動分析在臨床上具有重要意義。肺聲音和氣管聲音具有不同的聲學特徵。因此,使用肺聲音訓練的自動吸氣、呼氣和CAS(持續的異常聲音)檢測模型對於氣管聲音分析表現不佳,反之亦然。然而,混合集訓練和領域適應可以改善模型的性能,分別用於肺聲音分析的吸氣和呼氣檢測,以及用於氣管聲音分析的吸氣、呼氣和CAS檢測,相對於僅由肺聲音或氣管聲音訓練的模型(PCs)。特別是,從混合集訓練中派生的模型具有極大的靈活性,使用戶不需要為肺聲音或氣管聲音分析選擇特定的模型,這有助於在繁忙的手術室、病房或診所中建立呼吸監測。