🖥️语音转文字本地模型

“语音转文本本地模型”节点用于将输入的语音音频文件转换为可编辑的文本。它基于本地部署的 Whisper 系列模型（如 openai/whisper-small）或其他支持的语音识别模型。常用于语音笔记整理、会议转写、视频字幕生成、对话输入等场景。

🖥️语音转文字本地模型-节点参数说明

输入参数
audio	音频数据，通常来自“加载音频”节点的输出。
输出参数
text	识别后的纯文本内容，供下游节点调用（如展示、保存或进一步处理）。
控件参数
model_name_or_path	指定语音识别模型名称或路径，例如 openai/whisper-small。
is_enable	是否启用该节点。设置为 false 时，跳过语音转文本处理。
audio_path	音频文件路径，可直接指定本地音频文件。

通过openai的whisper-small模型，将通话录音转换成文字。

ComfyUI原生节点