comfyui_llm_party>🖥️语音转文字本地模型
comfyui_llm_party
时间:2025/11/03

🖥️语音转文字本地模型

“语音转文本本地模型”节点用于将输入的语音音频文件转换为可编辑的文本。它基于本地部署的 Whisper 系列模型(如 openai/whisper-small) 或其他支持的语音识别模型。常用于语音笔记整理、会议转写、视频字幕生成、对话输入等场景。
🖥️语音转文字本地模型-节点参数说明
输入参数
audio音频数据,通常来自“加载音频”节点的输出。
输出参数
text识别后的纯文本内容,供下游节点调用(如展示、保存或进一步处理)。
控件参数
model_name_or_path指定语音识别模型名称或路径,例如 openai/whisper-small。
is_enable是否启用该节点。设置为 false 时,跳过语音转文本处理。
audio_path音频文件路径,可直接指定本地音频文件。

示例工作流

   通过openai的whisper-small模型,将通话录音转换成文字。

广告

可加入知识星球获取所有示例工作流

广告

微信扫码入群,加入AIGC大家庭,与大家一起交流学习