You may also like
Had a party at last weekend with Mars and some others former UniSVR Shanghai R&D colleagues. Mars Chen, VP of UniSVR, responsible […]
目前EzStreamSvr可以同时Streaming音频和视频,且支持多个摄像头,及Dual Stream(多码流)功能,是同一个视频源在同一时间内既可以提供适合电脑观看的大解析度的高清的视频,又可以提供适合手机看的小解析度的低码流的视频。 EzStreamSvr简易使用说明文档: Windows版:https://oddmeta.net/p/ezstreamsvr/EzStreamSvr.For.Windows.Deploy.Guide.doc Linux版:https://oddmeta.net/p/ezstreamsvr/EzStreamSvr.For.Linux.Deploy.Guide.doc EzStreamSvr v2.0 for Windows版下载:https://oddmeta.net/p/ezstreamsvr/EzStreamSvr.rar Linux版暂停更新。 ———————————————————- V 2.0 (2011-08-08) 功能:先把音频加了一种进去(PCMA),让EzStreamSvr可以支持音视频。 功能:加强RTCP控制,但发现丢包尚未处理重发。 功能:更强大的Dual Stream支持。 V 1.6 (2011-08-07) 这几个月一直在做一个Linux上的视频监控平台,忙得死去活来,一直都没时间来看这个东西。前阵子在一个北京的网友的建议下,我把这个东西放到了RG4.NET上,特地修改了一下程序的界面。 […]
About Phabricator, just like what said in Phabricator.org: Phabricator is a collection of open source web applications that help software companies build […]
前两天研究了一下Moonshine Voice,当时拿了几个简单的音频文件测试了一下,感觉效果还可以,所以我就开始将其整合到了OddASR项目里。 但是在完成了整合后,再进行测试的时候发现一些比较严重的问题,所以,我又赶紧把我刚刚上传到pypi的OddASR给撤了,然后重新将主力模型改回到paraformer-zh-streaming和paraformer-zh。 当前OddAsr最新版本:v2.1.0,已恢复paraformer模型。 以下是在OddAsr自带的测试界面上分别跑paraformer-zh和moonshine base模型的效果 测试音频 具体的声音情况可以看这个视频: https://mp.weixin.qq.com/s/y4l-YtaUhayV9k9EDatCzw 注:这个视频中并未使用我的OddASR,效果差不是我OddAsr项目的锅。相反,下面我后来有将这个视频中的音频提取出来,专门作为OddAsr的一个测试集,每次测试不同的ASR模型的时候都会来测试一下这种场景。比如:这次的Moonshine base中文模型的测试。 测试效果 测试使用的音频就是上面那个视频里提取出来的音频。 paraformer模型效果 只想用一个字来形容:bravo! moonshine base模型效果 看上去转写出来的每个发音都是对的,但是。。。。这些个字呢。。。。好像就没几个是对的。 总结 唉,如果不是因为我这个用了超过十年的老笔记本CPU不太够用,我也完全不想去折腾一些其他的轻量级的ASR模型。