使用ORT进行语音降噪模型推理

在深度学习语音降噪模型的部署过程中,选择合适的推理引擎至关重要。ONNX Runtime(ORT)作为微软开源的跨平台推理引擎,在性能、兼容性和易用性方面表现出色,已成为许多生产环境的首选。本文将介绍为什么选择ORT,ORT的核心概念和使用流程,以及在使用ORT进行语音降噪推理时需要注意的关键事项,特别是针对时序模型(如GRU/LSTM)的隐状态管理。 ...

十一月 3, 2025 · 14 分钟 · 6916 字 · Marshall Liu

语音增强算法评估指南

语音增强算法评估指南 如今语音增强算法已成为智能设备、视频会议和助听器等应用的核心,它能从嘈杂环境中“拯救”清晰的语音信号,但如何判断一个算法的好坏?这就是评估的意义所在。今天,我们来聊聊语音增强算法的评估体系,通过一个国际挑战赛作为切入点,带你一步步了解关键指标和计算方法。无论你是初学者还是从业者,这篇文章都能帮你理清思路。 ...

八月 11, 2025 · 7 分钟 · 3504 字 · Marshall Liu

WebRTC语音降噪之Wiener滤波

WebRTC中的Wiener滤波降噪算法 引言 在实时语音通信系统中,背景噪声的抑制对于提升通话清晰度至关重要。Google 的 WebRTC 项目在其开源语音引擎中实现了高质量的语音降噪模块,其中 Wiener 滤波器作为核心组成部分,结合语音概率估计、多特征建模、噪声谱跟踪等模块构建了一个高度实用的增强框架。 ...

七月 7, 2025 · 5 分钟 · 2227 字 · Marshall Liu

WebRTC语音降噪之语音概率估计

WebRTC的语音降噪算法中实现了一个频点维度的语音概率估计器SpeechProbabilityEstimator,本质是一个多特征融合的线性分类器。统计计算以下三种特征, ...

六月 30, 2025 · 6 分钟 · 2801 字 · Marshall Liu

WebRTC语音降噪之基于分位数的噪声估计

噪声估计的作用 噪声估计算法在整个语音降噪系统中起到核心支撑作用,先验SNR和后验SNR的计算都依赖于当前帧的噪声功率谱估计。若噪声估计偏低,会导致保留太多噪声(过度保留);若噪声估计偏高,会把语音当作噪声过滤掉(语音失真); 更新不稳定,整体听感时好时坏,忽大忽小,出现”泵声“、”音乐噪声“现象。本文介绍WebRTC中目前使用的基于分位数的噪声估计算法,及其在工程实现中的巧妙之处。 ...

六月 28, 2025 · 4 分钟 · 1899 字 · Marshall Liu