Open WebUI：手把手教你用语音跟大模型沟通(附http网页开麦克风权限)

下载STT模型

先得启用一下Open WebUI的STT(Speech To Text）语音转文本的功能，用管理员登录进去，然后点OpenWebUI的右上角Admin Panel（管理面板）设置，再到Setting的Audio设置项，如下图所示，先在STT Model那里填一个wisper模型名，如：base（截图的时候忘记填了），然后点击一下那个下载按钮。

若是点了后没任何响应，看下后台的日志，如果碰到诸如此类的报错：

    |   File "/root/miniconda3/lib/python3.12/site-packages/open_webui/routers/audio.py", line 195, in update_audio_config
    |     request.app.state.faster_whisper_model = set_faster_whisper_model(
    |                                              ^^^^^^^^^^^^^^^^^^^^^^^^^
    |   File "/root/miniconda3/lib/python3.12/site-packages/open_webui/routers/audio.py", line 112, in set_faster_whisper_model
    |     whisper_model = WhisperModel(**faster_whisper_kwargs)
    |                     ^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^
    |   File "/root/miniconda3/lib/python3.12/site-packages/faster_whisper/transcribe.py", line 139, in __init__
    |     model_path = download_model(
    |                  ^^^^^^^^^^^^^^^
    |   File "/root/miniconda3/lib/python3.12/site-packages/faster_whisper/utils.py", line 121, in download_model
    |     return huggingface_hub.snapshot_download(repo_id, **kwargs)
    |            ^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^
    |   File "/root/miniconda3/lib/python3.12/site-packages/huggingface_hub/utils/_validators.py", line 114, in _inner_fn
    |     return fn(*args, **kwargs)
    |            ^^^^^^^^^^^^^^^^^^^
    |   File "/root/miniconda3/lib/python3.12/site-packages/huggingface_hub/_snapshot_download.py", line 219, in snapshot_download
    |     raise LocalEntryNotFoundError(
    | huggingface_hub.errors.LocalEntryNotFoundError: Cannot find an appropriate cached snapshot folder for the specified revision on the local disk and outgoing traffic has been disabled. To enable repo look-ups and downloads online, pass 'local_files_only=False' as input.

那我只能说，你没有任何错，只是错在你身处的这个网络（需要科学上网）
在服务器上，执行下面的命令设置一下huggingface的镜像站，然后再重新下载一下。

export HF_ENDPOINT=https://hf-mirror.com

若是还是没有任何响应，确认一下STT Model那里的wisper模型名有没有填，有填的话填的对不对。

解决http地址无法访问麦克风问题

http网页默认情况下是不允许开麦克风和摄像头的，但是如果是为了测试功能，我们可以通过如下步骤在chrome里来给打开

打开chrome：
chrome://flags/#unsafely-treat-insecure-origin-as-secure

然后在Insecure origins treated as secure里将默认的Disabled改成Enabled，并将你要访问的地址填一下到里边（可以多个）。
填完后会提示你重启浏览器生效。
重启后你就可以在这个地址开麦克风、摄像头了。

解决了http无法开麦克风问题后，到Open WebUI就可以录音频的方式去问问题了。

下载STT模型

解决http地址无法访问麦克风问题

Leave a comment Cancel reply