Open WebUI:手把手教你用语音跟大模型沟通(附http网页开麦克风权限)

同之前的Open WebUI联网搜索功能异常问题一样,一样步骤很简单。

下载STT模型

先得启用一下Open WebUI的STT(Speech To Text)语音转文本的功能,用管理员登录进去,然后点OpenWebUI的右上角Admin Panel(管理面板)设置,再到Setting的Audio设置项,如下图所示,先在STT Model那里填一个wisper模型名,如:base(截图的时候忘记填了),然后点击一下那个下载按钮。


若是点了后没任何响应,看下后台的日志,如果碰到诸如此类的报错:

    |   File "/root/miniconda3/lib/python3.12/site-packages/open_webui/routers/audio.py", line 195, in update_audio_config
    |     request.app.state.faster_whisper_model = set_faster_whisper_model(
    |                                              ^^^^^^^^^^^^^^^^^^^^^^^^^
    |   File "/root/miniconda3/lib/python3.12/site-packages/open_webui/routers/audio.py", line 112, in set_faster_whisper_model
    |     whisper_model = WhisperModel(**faster_whisper_kwargs)
    |                     ^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^
    |   File "/root/miniconda3/lib/python3.12/site-packages/faster_whisper/transcribe.py", line 139, in __init__
    |     model_path = download_model(
    |                  ^^^^^^^^^^^^^^^
    |   File "/root/miniconda3/lib/python3.12/site-packages/faster_whisper/utils.py", line 121, in download_model
    |     return huggingface_hub.snapshot_download(repo_id, **kwargs)
    |            ^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^
    |   File "/root/miniconda3/lib/python3.12/site-packages/huggingface_hub/utils/_validators.py", line 114, in _inner_fn
    |     return fn(*args, **kwargs)
    |            ^^^^^^^^^^^^^^^^^^^
    |   File "/root/miniconda3/lib/python3.12/site-packages/huggingface_hub/_snapshot_download.py", line 219, in snapshot_download
    |     raise LocalEntryNotFoundError(
    | huggingface_hub.errors.LocalEntryNotFoundError: Cannot find an appropriate cached snapshot folder for the specified revision on the local disk and outgoing traffic has been disabled. To enable repo look-ups and downloads online, pass 'local_files_only=False' as input.

那我只能说,你没有任何错,只是错在你身处的这个网络(需要科学上网)
在服务器上,执行下面的命令设置一下huggingface的镜像站,然后再重新下载一下。

export HF_ENDPOINT=https://hf-mirror.com

若是还是没有任何响应,确认一下STT Model那里的wisper模型名有没有填,有填的话填的对不对。

解决http地址无法访问麦克风问题

http网页默认情况下是不允许开麦克风和摄像头的,但是如果是为了测试功能,我们可以通过如下步骤在chrome里来给打开

  1. 打开chrome:
    chrome://flags/#unsafely-treat-insecure-origin-as-secure


然后在Insecure origins treated as secure里将默认的Disabled改成Enabled,并将你要访问的地址填一下到里边(可以多个)。
填完后会提示你重启浏览器生效。
重启后你就可以在这个地址开麦克风、摄像头了。

解决了http无法开麦克风问题后,到Open WebUI就可以录音频的方式去问问题了。

Leave a comment

Your email address will not be published. Required fields are marked *