https://linux.do 论坛的话题更新通知频道。
AirTouch (@LUOH) 在 cpa 如何降低系统占用 中发帖
如题,我在 2c4g 的服务器上部署了 cpa 给 NihaoAPI 用,号池有 2k 左右,平常很容易把 cpu 和内存吃满,佬友们有没有优化的方案,跪求!
提供方法的我送你 NihaoAPI 的兑换码😘glenn2033 在 用 cc-connect 10秒钟把Codex和Claude Code接入微信ClawBot 中发帖
下载最新版的 cc-connect,执行 cc-connect weixin setup,扫码,然后重启下cc-connect就可以了。
[IMG_9363.PNG]
[IMG_9362.PNG]alex (@alex3) 在 这样子用claudeopus会不会被封号呀? 中发帖
佬友们,现在claude max容易封号,我在想能不能买一台美国的vps,然后在上面远程使用claude,这样子容不容易封号呀?木瓜蛋白酶Tea🎋 (@Papain233) 在 codex cli 报错 CreateProcessAsUserW failed: 5 怎么办 中发帖
如题,codex cli 报错 CreateProcessAsUserW failed: 5 怎么办?能对话但是读不了本地文件谨言慎行 (@Anano) 在 中国AI大模型调用量领跑全球:周调用量达4.69万亿Token,连续两周超越美国 中发帖
全球最大 AI 模型 API 聚合平台 OpenRouter 最新发布的数据显示,截至 3 月 15 日,中国 AI 大模型的周调用量达到 4.69 万亿 Token,连续第二周超越美国。全球调用量排名前三的位置,更是被中国模型包揽。摩根大通预测,中国的 AI 推理 Token 消耗量将从 2025 年的约 10 千万亿增长至 2030 年的约 3900 千万亿,五年间增长约 370 倍。(央视财经)
[image]
[1bc9b9f5-93c2-45bf-ab96-336662416721]
[a984f555-d274-4ee2-b045-815eab3aba14]Konglong7 在 各位大佬 现在有没有claude模型用呀,中转站什么的只要稳定正常的都行。能不能推推呜呜我真找累了 中发帖
各位大佬 现在有没有claude模型用呀,中转站什么的只要稳定正常的都行。能不能推推呜呜我真找累了Henry (@supersonicHenry) 在 minimax的周限额究竟是如何计算的 中发帖
rt 看到minimax的starter感觉还挺便宜,正好需要一个ai来解决一些破事(比如水课等等不需要太聪明但需要量大的活)个gpt还是太正直了,甚至连我自己的密钥都不愿意告诉我,非要我自己去看
正好最近minimax好像出2.7,但是查了一圈他们好像只有5h限额会展示给你,而周限额是不会展示的,所以想知道这个周限额大概是怎么个展示法呢山图 (@shantu) 在 有没有推荐的可刷机的电视盒子? 中发帖
想整个电视盒子,自己改改,给老人用。家里有个旧的小米盒子,每次开机巨慢,打开以后有很多广告,想看直播还要拿遥控器打开软件,对老人很不友好。我想把系统改成 开机以后直接到直播界面,用遥控器直接换台。各位佬友有没有推荐的电视盒子或者类似的项目?@stevessr 在 KVTC:在 LLM 推理 中 进行 KV 缓存 变换编码 以 实现 紧凑存储 | NVIDIA 中发帖
[!abstract]+
大规模服务大型语言模型(LLM)需要高效的键值(KV)缓存管理。KV 缓存可以通过共享前缀提示在对话回合中重复使用,这在迭代代码编辑和聊天中很常见。然而,陈旧的缓存会消耗稀缺的 GPU 内存,需要卸载或强制重新计算。我们介绍的 KVTC 是一种轻量级转换编码器,可压缩 KV 缓存,实现紧凑的 GPU 上和 GPU 外存储。KVTC 借鉴了经典的媒体压缩技术,结合了基于 PCA 的特征去相关性、自适应量化和熵编码。它只需要简单的初始校准,模型参数保持不变。通过利用 KV 缓存中的冗余,KVTC 在保持推理和长文本准确性的同时实现了高达 20 倍的压缩率,在特定使用情况下,压缩率可达 40 倍或更高。我们使用 Llama 3、Mistral NeMo 和 R1-Qwen 2.5 模型对 KVTC 进行了测试,测试基准包括 AIME25、GSM8K、LiveCo...@ccrr 在 大家好,潜水员终于上岸啦 中发帖
之前一直在浏览器里潜水,学习各位大佬的开源项目和教程,今天终于可以正式的和大家见面了。很高兴能加入L站这个大家庭,和大家共同进步。
写小作文的时候是写了又删,删了又写,毕竟我是纯业余玩家,和各位佬友不太一样,只是对电脑技术,Ai等比较上头,还喜欢折腾折腾服务器。而且本人是机械方向的学生,平时的学习和我的爱好差了十万八千里。平常没少因为折腾服务器vps抓耳挠腮。
对于论坛里的大佬来说,我不太专业,还在摸索当中,所以我想向论坛里的大佬们学习,交流经验,共同进步。
文笔不太好,各位佬友见谅。Clivia (@Yanyutin753) 在 [开源/推广] LambChat - 基于 FastAPI + deepagents 的生产级 AI Agent 聊天系统 中发帖
本帖使用社区开源推广,符合推广要求。我申明并遵循社区要求的以下内容:
我的帖子已经打上 开源推广 标签: 是
我的开源项目完整开源,无未开源部分: 是
我的开源项目已链接认可 LINUX DO 社区: 是
我帖子内的项目介绍,AI生成、润色内容部分已截图发出: 是
以上选择我承诺是永久有效的,接受社区和佬友监督: 是
以下为项目介绍正文内容,AI生成、润色内容已使用截图方式发出
如果你在找一款可以自部署、功能完整、开箱即用的 AI Agent 聊天系统,LambChat 可能适合你。
基于 FastAPI + deepagents 构建,支持 MCP 协议、Skill 技能系统、多 Agent 类型、会话分享、飞书集成等,前后端完整开源,MIT 协议。
📸 界面展示
主要界面
登录页面
聊天界面
[登录页面]
[聊天界面]
...