jacky – OddMeta

一、前言前前后后的给小落同学加了许多的MCP。但是这些功能之前一直在我本地的小落同学上跑，部署在阿里云ECS上的小落同学因为买的ECS配置太低（99元一年的2H2G特惠主机）跑不动，这个周末在家没事做，想想是不是干脆用frp让公网上的小落同学也可以把这些MCP也都给支持起来。所以这个周末的任务就是：把原先一直在我本地电脑上跑的小落同学的MCP Server部署到公网，并让阿里云上的小落同学来访问和使用。目前小落同学支持的MCP包括：既然想了，那不管有没有人用小落同学，咱先给它配上去再说。二、MCP Server可配置化 1. 新增ODDMCP配置在小落同学的.env环境变量里新增mcp相关环境变量配置 2. 同步调整MCP Server和MCP Client中与MCP相关的配置把原先固定的localhost的地址，改成从环境变量中获取。 1）代码：oddmcp_server.py 2）代码：oddmcp_client.py 3）代码：oddmcp_status_callback.py 4）oddagent 同步的时候发现几个新的MCP Server功能还没同步到小落同学上的oddagent，也顺手改了一下。三、利用frp来做跳转 ODDMCP用了两个端口，一个是MCP Server所绑定的9600端口，另一个是每个在MCP运行过程中的一些实时进展状态回调时所使用的redis。 1. 客户端配置代码：frpc-https.toml 杀掉并重新启动 frpc 2. 服务端口配置客户端修改并新增了这两个端口，并且重启了frpc之后，先到ECS服务器端查看一下，端口状态是否都正常。如果都有正常绑定了，说明frp已经可以工作了。需要注意的是：服务绑定地址应该是 0.0.0.0:9600，而不是 127.0.0.1:9600（后者只允许本地访问）。四、阿里云ECS配置配置好frp后，还需要让阿里云ECS放行这两个端口。 1. 修改ECS安全组配置打开浏览器，登录阿里云控制台，进入安全组配置，并在其中新增、放行9600和63579这两个TCP的端口。阿里云控制台上的功能比较多，不常用的话，可能要找地址找半天。由于忘记功能名字了，搜索也不好搜索，呵呵。为方便记录，特把安全组的链接地址也贴一下：https://ecs.console.aliyun.com/securityGroup/region/cn-shanghai 2. 放行防火墙打开xshell，ssh登录上ECS服务器，查看是否放行 9600/tcp 如果是centos/openEuler操作系统： […]

LLM ProjectXL Utilities

把你的MCP Server部署到公网，让阿里云上的应用来访问和使用

一、前言昨天用OpenCode Desktop做了下书签管理的SKILL，今天就想去看看这个“早就想去看看的”、“国内第一个支持SKILL”的扣子。于是，今天我就把昨天在Open Code Desktop上做的事情原封不动的在扣子上做了一遍。下面的完整的过程。具体的SKILL的原理什么的我就不讲了，网上随处可见，咱们来实操。为省流，直接上结论：总的来说，单纯对于我这个书签管理功能来说，生成的SKILL的确还可以，但是SKILL描述和references还是需要自己仔细分析一下改一下。除此之外，简单列一下我个人的一点经历和看法也为扣子加一把油，为国内的开发者搭建了一个更好的平台和环境。二、在扣子上创建skill 1. 创建skill 进入扣子网站（ www.coze.cn ），输入提示词如下：快速出了一个版本，但是自测验证报错，但是扣子会自己修改代码重测。a little monments later（约二十来分钟），终于完成。 2. 上传skill 作为一个懒人，只想动嘴，不想动手，所以第一个尝试是让扣子直接把它写好的这个skill安装到扣子上。 1）自动安装：失败但是，扣子实际上只是给了一个帮助文档，还是让我自己上传安装。那好吧，那我先下载一下扣子生成的skill及代码。 2）手动安装：成功下载下来后，到扣子技能商店：https://www.coze.cn/skills?tab=my 然后点击右上角的“创建技能”，把下载下来的这个zip文件上传，扣子就会自动按照标准流程帮你适配这个 Skill。但是扣子会将原先的 MCP 服务器实现重写为纯函数式工具，这说明扣子不会在上面自己开一个MCP Server来让Skill调用。 3. 部署Skill 点击右上角的“部署”按钮，跳过变量设定，秒级完成部署。三、Skill的使用通过上面的步骤，我的扣子版的书签管理Skill就完成了，并且可以直接在扣子上使用了。使用方法也很简单，在聊天框里输入 @ ，然后在跳出来的选项框里选择技能，技能列表里会包括所有你安装的和创建的技能列表，在那里选择“书签管理技能”。四、进一步完善希望收藏下来的文章的可以按我的要求来命名文件，保存的路径，以及图片的路径，那就让它再来改一下吧。最后，扣子再输出了一版SKILL，并简单测试了一下包括新浪新闻，今日头条，CSDN，博客园，知乎等网站的文章都可成功抓取。收工！五、完整代码考虑到未来SKILL无限的可能性，我准备再建一个仓库，然后把一些自己实现的SKILL都放到这个仓库里。今天的扣子版本的书签功能的SKILL是第一个。仓库地址： https://github.com/oddmeta/odd-skills 感兴趣的大佬可以直接到这里下载完整的代码。也可私信我，我发你。

LLM ProjectXL Utilities

上手扣子编程：国内skills第一家

一、前言上周扣子成为第一个支持skills的国内的大模型，但是这阵子公司这边的事情一直很忙，项目急，领导们都盯着，所以一直没有没时间去测试。但是事实上之前我已经用open code desktop试过来实现一个skills，只是文章写了一半，一直没发，今天晚上再重新整理了一下，让open code实际来写一个skills，并将完整的过程给大家做一个演示，相信看了之后，任何一个小白（不需要编程知识）都可以来实现自己想要的功能了。我一直想给小落同学做一个书签功能。原因如下：当你看到一篇好文章，想保存下来慢慢看，结果网页上广告横幅、导航栏、推荐阅读啥的占了一大半空间。等到真正想看的时候，还得翻半天找正文。更烦人的是，现在很多网站都是单页应用，用JavaScript动态加载内容。直接用浏览器保存或复制粘贴，往往只能拿到个加载动画，完全看不了内容。于是我就想，能不能做一个工具，自动抓取网页，去掉那些乱七八糟的东西，把正文提取出来，保存成干净的Markdown格式？图片也能一并保存下来。现在刚好用OpenCode Desktop来演示一下，如何实现一个书签功能的Skills，而且可以通过MCP协议接入外部服务。二、测试运行环境 1. 测试环境依旧在我这个超过十年的老笔记本上，我的操作系统是Windows 7。如果你是新版本的Windows，或者是Mac OS，或者Linux，整个流程基本上也没什么差别（理论如此哈，我还没验证过，若真在安装使用open code时，有什么问题也可提出来）。 2. 测试使用的版本 Open Code Desktop 的下载安装我就快速跳过了，大家随便哪儿搜一下都能下载到。安装完成OpenCode Desktop后，启动，完成基础登录 / 初始化配置，比如：选择使用的大模型。三、从零开始实现书签功能Skills 1. 给OpenCode的提示词直接在OpenCode Desktop里，告诉他你想要一个什么样的东西，一些具体的要求。注：这里的描述很重要，而且最好是描述能够一次成型。但是实际上一次成型是不可能的。不过你可以生成一次后，看下效果是否跟你预期一致，如果不一致，那就直接左上角：新建会话（+ New session），然后再一步步完善你的描述，然后一次次重试直到你基本满意。以下是我的提示词： 2. OpenCode Desktop的输出输入提示词之后，OpenCode就开始工作了，大概等待了两三分钟，它给我输出了一个结果，同时也创建好了整个书签Skills，书签的MCP Server：bookmark_it_server.py，以及这个MCP Server的Python依赖，具体项目目录结构如下： 3. 关键代码 1）MCP服务器配置代码位置： .opencode/opencode.json 2）MCP服务器主要代码代码位置：bookmark_it_server.py 3）Skills配置 […]

LLM

手把手带你用OpenCode实现一个完整的Skills：网页书签

2 comments

一、前言上周四下午领导说公司的某个助手项目准备启用自研的备用方案，然后我的 OddAgent 项目就开始从备胎出现转机，有可能会成为正式方案了。原先我没有为 OddAgent 设定开源授权方案，大家都可以继续在 OddAgent 现有的开源代码基础上自行演进，而公司的产品一旦正式使用了 OddAgent，那可能日后的一些功能实现就不方便放到我的github上了。不过，以我自己在小落同学项目中一些实际功能的测试体验，现有的 OddAgent 已经足以应付各种个人/企业场景下的意图识别功能。为了避免日后大家在授权问题上出现顾虑，我特别将 OddAgent 的授权从GPL改成了MIT。二、关于新的开源协议MIT MIT协议允许你任意的使用、复制、修改原MIT代码库，随便你是选择跟我一样继续开源，还是选择闭源甚至商用，唯一需要遵循的原则就是在你的软件中声明你也使用的是MIT协议就行了。 MIT 协议三、OddAgent的安装与使用 1. 安装 2. 配置项目配置样例：https://oddmeta.net/tools/oddagent/config.json.sample智能体配置样例：https://oddmeta.net/tools/oddagent/conference_config.json 下载好后放在你前面创建的目录下。然后复制config.json.sample，并将其改名为config.json 然后开始调整设置 config.json 里配置你自己的系统配置下面是一个系统配置的示例。 1）大模型配置 2）智能体功能配置根据你自己的业务需求，配置你的功能意图和槽位的语料。OddAgent自带了一个视频会议场景的示例 conference_config.json ，可供您的参考。具体的配置方法可参考这里：https://pypi.org/project/oddagent/ 3. 运行启动命令：oddagent -c config.json 4. 测试后台默认的测试后台地址是：http://localhost:5050 5. API接口 OddAgent只做意图、指令的识别，所以实际场景里基本上都是在你自己的产品里用API来调用OddAgent识别意图指令，然后自行去实现相应的功能。以下是一个API调用OddAgent的完整示例代码：运行测试代码：python […]

Utilities

开源全能意图、指令识别框架 OddAgent 更新

1 comment

一、前言为简化 OddAgent 的安装、使用流程，准备将OddAgent打成一个包，上传到pypi，这样后面只要pip install oddagent就可以直接安装使用了，方便大家利用OddAgent来实现自己的智能体。不废话，直奔主题。二、打包工具安装及配置 1. 安装打包和上传工具打包和上传工具的安装，走强制升级更新模式。 2. 注册 PyPI 账号如果你还没有注册PyPI，那就先去注册一下，注册地址： https://pypi.org/account/register/建议同时注册 TestPyPI 用于测试发布。PyPI和TestPyPI是两套独立的环境，账号系统也是独立的，所以需要分别注册，包括后面会提到的用于上传包的API token也需要分别申请。 3. 准备项目结构一个典型的 Python 包结构如下： 4. 编写 pyproject.toml 5. 构建发行包在项目根目录下运行： 6. 配置 .pypirc 登录 PyPI → Account Settings → API tokens创建一个 token（建议选择设置为全局token）复制 token（只显示一次！你要自己保存好） .pypirc 是一个配置文件，用于存储Python包仓库的认证信息，通常位于用户主目录下：内容如下：三、发布及测试打包好的包，建议先发布到 […]

Utilities

完整实例：将你的项目OddAgent打包发布到pypi

一、前言前阵子写了几篇大模型开发相关的入门的文章，然后有同学私信说自己训练或者微调出来的模型效果不如预期，对于这一点，我在前面的文章里也反复强调过多次，对于大模型来说，唯一真正有价值的只有：数据。脸书扎克伯格花大价钱ScaleAI的底层逻辑也在于此。在现在这个时代，完全可以说，大部分的技术都是没有什么价值的，因为大部分的技术都是有手就行。真正的价值都在数据，而且最有价值的数据往往都是一个个的专业领域的数据，决定大模型微调效果的是数据，决定你整个产品成败的也是数据，这个事情一定要搞清楚。所以呢，建议大家从现在开始，给自己好好做积累吧，把你的行业数据、专业领域的数据一点点积累好，这才是你的未来。而数据中最重要的还是实际的业务数据，并不是让大模型帮你生成的数据，但是如果你是为了做一些项目的测试的话，让大模型来帮忙丰富一下你的数据集也是一个不错的选项。这里就用我自己的一个实际的用于语音助手的案例，来手把手教你如何利用大模型来帮你生成一些数据。【有手就行】大模型开发入门系列二、让大模型帮忙生成训练集之前用的更多的是利用ChatGPT来生成数据，但是为了写这篇文章，我又专门用千问、文心、豆包、ChatGPT走了一遍完整流程。这篇文章主要有用的就是生成数据的提示词，顺便用这个实例介绍对比一下几个主流模型的表现，供大家参考。从这一轮次的的测试生成数据集的情况来看，印象分最好的要算Qwen3-Max，而ChatGPT则垫底了。看来中文还是得选中国的大模型。另外，犹记当年第一届世界人工智能大会时，马云跟马斯克吹牛：AI就是Alibaba Intelligent，这牛吹的当年所有人都想笑，再过几年看看Alibaba到底能不能笑傲江湖，让咱们座目以待。此外，具体每个大模型生成的数据由于太大，在这里我就不列了，不过我保存到了云盘，感兴趣的可以后台私聊我：【测试集】，会自动回复下载链接，同时你也可以自行生成。 1. 千问使用模型：Qwen3-Max 秒级响应。刺溜一下就给生成好了。而且是一步到位，不像豆包、文心那样，先生成数据，再自己写代码把数据保存到一个json文件。千问牛逼格拉斯。不过，生成的json文件在公司不能下载（在家里正常），可能跟公司网络DNS有关。生成的文字多样性佳： 2. 百度文心一言使用模型：文心大模型X1.1 为每个意图生成50条数据很快，但是文心一言为了将结果保存到json文件费了老大的劲，因为它是自己写代码来实现的，而它写的代码执行的报错了好多次，然后它自己一直在改它自己的代码，结果浪费了很多时间，XD 生成的文字多样性：但是它在这个请求里自己生成的代码出问题，扣掉了我对它的印象分。 3. 豆包使用模型：豆包上没写版本号，公有云的反正是最新的。豆包-同文心，也是自己写代码生成json，比百度好一点，保存json的代码一次成功，没有改半天代码。生成的文字多样性也不错。槽位的准确率100%。它相比文心好的地方就是保存json的代码一次成功，没让我等半天。生成的文字多样性： 4. ChatGPT 使用模型：普通版本（非Business版本） For quick tasks & answers 速度跟豆包差不多。思考过程在生成后不能查看，所以不清楚是跟千问一样，一步到位，还是跟豆包、文心一样，先生成数据，再写代码存文件。生成的文字的多样性：三、注意事项如果你生成数据的目的是为了训练的话，建议的做法还是要用一些实际的数据，而不是找大模型来帮你生成数据，这一点很重要。但是如果你是为了学习大模型训练或者大模型微调的话，可以考虑让大模型帮你生成一些数据，但仅限于学习。毕竟，大模型生成的数据都不一定是真正你的产品、业务所需要的数据。四、广而告之新建了一个技术交流群，欢迎大家一起加入讨论。扫码加入AI技术交流群（微信）关注我的公众号：奥德元让我们一起学习人工智能，一起追赶这个时代。

LLM

【有手就行】利用大模型批量生成数据集

一、前言 1. 本文目标你有没有问过大模型“你是谁”？问了的话，拿到的答案清一色都是大模型厂商的名字。而如果你自己部署了一个模型的话，通常都希望有人在你的应用里问你是谁的时候能给出一个“你的答案”。这篇文章就是干这个事情的，20分钟让大模型的名字变成你自己的名字。 2. 大模型入门系列介绍前阵子介绍了两个【有手就行】的大模型基础知识，今天是大模型开发【有手就行】的第三篇。前两部在这里：这个是入门三步曲最后一步：MS-SWIFT认知微调，把大模型的名字改成你的名字。上手学习大模型、人工智能相关的开发并没有什么太过高深的门槛，真的很简单，真的就是【有手就行】。二、SWIFT认知微调相关的一些废话 1. 什么是ms-swift ms-swift（全称 Scalable lightWeight Infrastructure for Fine‑Tuning）是阿里的魔搭社区（ModelScope）推出的一个大模型全流程工程化框架，是 “大模型轻量微调与部署的基础设施”，在消费级 GPU 与国产硬件也都可用，我有在4090，PPU平头哥、Ascend昇腾上都用过。 2. 为什么要做ms-swift微调就像之前讲的那样：自己从头开始训练一个基座大模型是不现实的，只能以学习目的来了解大模型是如何训练出来的，有哪些步骤，会有一些什么样的训练参数、每个参数的意义和影响是什么等。所以大家更多会涉及的是利用一些现有的开源大模型来做微调，用自己的个人数据、行业数据来微调训练大模型，然后让这个大模型变成你自己的私人大模型或者行业大模型。可惜我自己觉得最重要的LoRA微调的那篇文章反而看的人比较少（一如既往的不太懂，呵呵），可能是我取的标题不够“标题党”（求大佬们指教），也可能跟公众号推荐规则有关。而一旦你自己微调训练了一个大模型，那随后必做的一件事情就是把这个大模型的名字变成你自己，当有人问它：“你是谁？”的时候，它回答的应该是：它是xxx（你给它取的名字），是由yyy（你的名字）开发出来的。比如：我是小落，是由落鹤生开发的个人智能助手。我主要的目的是通过记录落鹤生每天的日常工作、生活的点点滴滴，然后希望在数据足够的某一天，我可以成为一个数字复刻版本的落鹤生。如果您对小落同学有任何疑问或需要帮助，请随时提出，我会尽力为您解答。三、开始 ms-swift支持 600 多个纯文本大型模型和 300 多个多模态大型模型的训练。为方便同学们复现，我以 Qwen3-4B-Instruct模型为例，从模型下载开始介绍整个流程。如果有问题可以直接在下面留言，或者加一下AI技术学习交流群一起讨论。 1. 模型下载从modelscope下载需要的模型（huggingface不太稳定，当然也可以用镜像站：https://hf-mirror.com ） 2. 原始模型部署原则上，你的服务器上有多少GPU就都给你用上先。 3. 原始模型测试 4. 微调Qwen3-4B-Instruct-2507模型这里在我原先的OddAgent项目基础上训练一个会议语音指令助手。这里使用官方的示例对Qwen3-4B-Instruct-2507模型进行自我认知微调。 1）安装ms-swift框架 pip 源码方式 […]

LLM

【有手就行】SWIFT：花20分钟把大模型的名字变成你的名字

1 comment

一、说在前面训练基座大模型那都是大公司们的事情，普通人、普通公司肯定是玩不起的，但是作为一个技术人，你可以不去做真正的大模型训练，但是你还是有必要知道和了解一下一个大模型是如何训练出来的。而GPT_teacher-3.37M-cn 是一个很好的示例项目，让你可以用一台普通的PC，用CPU来训练一个3.37M的中文GPT模型，整个训练耗时不到20分钟，回答训练集里的问题的效果也还是挺不错的。感兴趣的同学可以用这个项目来练手、实操复现一下“自己动手从0开始训练一个大模型”的完整流程。二、项目概述一个轻量级中文GPT模型项目，专为在CPU上快速训练和演示而设计：模型参数量：3.37M架构：4层Transformer解码器特点：使用RMSNorm、RoPE位置编码、权重共享等优化技术目标：45分钟内在普通CPU上训练出可用的中文问答模型参考训练时长：三、完整复现流程介绍完了，就让我们来实操整个从0到1的训练吧。先下载代码： 1. 环境准备依赖项包括： 2. 构建中文分词器这将： 3. 配置文件确认 config.yaml包含了所有必要配置，我在这里给每个参数加了个说明，以便于理解每个参数的意义。 4. 执行训练 5. 测试模型训练完成后，根据src/train.py中的代码，最终会在config.yaml指定的目录下(checkpoints)生成一个标准的模型，以及一个量化的模型，分别是: 然后你可以用下面的命令来测试一下训练集（位于data/train.jsonl)里的一些问题：四、关键技术点解析在这个示例的大模型训练里，我们基于Decoder-only的Transformer（因果语言模型），使用下三角掩码确保每次只关注历史信息，这正是GPT系列模型能够生成连贯文本的核心。 1. 训练参数说明具体的训练参数我在上面的config.yaml里给每个参数都写了一个注释，用于说明每个参数的意义。而总结概括一下这个配置参数的话，主要如下： 2. 关键代码五、补充说明 1. 仅3.37M参数远达不到scale law 这个项目只是一个演示项目，教你如何自己动手从0到1来训练一个大模型，但是必须要知道的是大模型有个别称是 scale law，所以走传统transfomer路线的话，注意力是非常吃参数的，这么一个参数量，其输出完全肯定不会非常好（除非你问的就是训练集里的知识）。同时在这个项目的训练集（位于data/train.jsonl)里你也可以看到，虽然有510条训练数据，但实际上里面的内容全是Ctrl C + Ctrl V出来的，真正的prompt和completion就几条。 2. 为什么问一些不在训练集里的问题时，返回乱七八糟的东西，而不是“不知道” 大模型的本质是一个词语接龙游戏，每出一个字，根据概率去预测下一个字是什么。其目标是生成流畅的文本，而不是正确的文本，它只是在模仿训练集里的文本概率，而不是真正的理解内容，所以最终的效果完全取决于你给它的训练数据。因此，当你去问不在训练集里的问题的时候，大模型就只能随便的去猜下一个字可能是什么字，而不是直接给你回答一个“不知道”，这也是大模型“幻觉”的由来。 3. 关于大模型幻觉大模型幻觉主要有四种幻觉类型：前后矛盾，提示词误解，事实性幻觉，逻辑错误。幻觉主要有三大成因：数据质量问题，生成机制缺陷，模糊指令。幻觉通常有五种解决方案：精准提示词、示例学习、调参、RAG技术、幻觉检测方案，并让大模型学会给答案标注“参考文献”（溯源）。 […]

LLM

【有手就行】自己花20分钟从0开始训练一个“大模型”

2 comments

一、前言昨天晚上想给oddtts项目的启动命令行里加一个OddMeta的ASCII art文字的代码输出。一如既往，想让我自己写那是坚决不可能的，这种事情有大模型了，为什么还要自己来写呢。但是，（省去一万字），无奈的发现国内外的各个大模型全部翻车了，包括（一定要把它们的大名列出来，恨！！！）：为了这个ASCII码字体，浪费了我一下午，加半个晚上，整个过程只能说用”无语”一词来形容，本来想算了，但是又实在有点气不过，心中默念了 @#￥%……&O（）~！无数遍，最后决定还是将整个过程跟大家分享一下。二、悲伤历程 1. TRAE AI 平时用的比较多的TRAE AI，我就信心满满的打开平时用的TRAE，Come on baby, let’s go. 1）Round 1：信心满满我让它生成OddMeta，它这给了个啥玩意？？？ 2）Round 2：要让再次修改 3）Round 3/4/5/6/7/8 对于上面的结果，我很不满意，然后又用各种方式让它重新修改，但是没有一个结果是正确的。咒骂了TRAE无数次之后，我想TMD你不行，幸亏除了你之外，哥还有通义灵码。 2. 通义灵码 1) 给通义灵码一个示例让它改 2) 这个结果看上去比TRAE稍好一点，文字有点像了，但还是不对。不对，然后我又尝试了包括但不仅限于下面这些输入。结果还是不对！还是不对！！还是不对！！！还是不对！！！！ 3) 评价：咒骂x2，放弃通义灵码口中念念有词：~！@#￥%…………&（）￥ 3. 豆包: https://www.doubao.com/chat 豆包也是个不错的大模型，还是让它来试试吧。 1）重走TRAE的流程 2）重走通义灵码的流程 4. Deepseek 5. 文心一言 6. ChatGPT […]

LLM

AI编程笑话：国内外主流大模型的集体翻车

一、目标环境 Ubuntu 24.04，拟安装社区版gitlab。无废话流程。二、安装步骤 1. 前置步骤启用ssh 防火墙放行安装curl 添加仓库包 2. 安装gitlab-ce 3. 部署安装完成后 1）重置root密码 [root@test bin]# gitlab-rails consoleirb(main):001:0> user = User.where(id:1).firstirb(main):002:0> user.password = ‘修改的密码（必须超过八位）’irb(main):004:0> user.saveirb(main):005:0> exit 2）编辑配置文件，设置为你的urlvim /etc/gitlab/gitlab.rb external_url ‘http://172.16.237.141’ 三、可能会碰到的问题报错：there was a problem with public attribute 问题日志问题分析这个错误表明系统中仍然残留着 GitLab EE（企业版）的配置信息，导致在配置 GitLab CE（社区版）时出现冲突。可以按照以下步骤彻底清理残留配置并重新安装彻底彻底卸载残留的 GitLab 组件：清理系统缓存并重新安装 […]

Web