https://linux.do 论坛的话题更新通知频道。
虹连 (@user924)Qwen3.5-27B 100Token/s 单卡本地运行! 中发帖

非推广,纯分享,和下方参考视频、Github项目均无利益关系!
众所周知,Qwen3.5-27B 在多方面的能力表现惊艳,甚至能打一两年前的大模型,然而在本地部署中,其较低的速度往往让体验大打折扣,即使是 90 级别显卡也只有二三十 Token/s,远不如 Qwen3.5-35B-A3B 这种 MoE 模型来得舒畅。 
然而! 在几天前,一个工作将最近的新解码算法给出了消费级显卡的实现,其宣称能直接在本地单张3090,实现上百 Token/s 甚至更高的解码速度,他就是 lucebox-hub。 
其将最近的两个推理相关优化工作,一个是一个是 DFlash,另一个是 DDTree,真正做成了能在本地消费级显卡上跑起来的版本(24G显存级别)。 
关于这两个工作的原理,感兴趣的可以去看看原文。值得注意的是: 

lucebox-hub 是基于 Qwen3.5-27B Q4_K_M GGUF ...
你这是违法行为 (@Anano)男子闪婚被骗50万,谁在围猎大龄男性? 中发帖

之前就看到咱们佬友中有想要闪婚的,还是要注意一点。 
 [image]
@YougLin当你发现你不知道什么时候用有的会员将在几天后到期 中发帖

[image] 
不知道什么时候收获的hf会员,刚刚在测oai的新开源模型的时候,发现的,结果就是喜提3天会员 :tieba_087:
ggvis (@ggvisPro)神奇的下一代Apple TV发布时间😭 中发帖

从23年初就想买,一直传言下一代要发布,就想说再等等吧,期间价格甚至降到了810,现在下一代千呼万唤还不出来,甚至这三四年前的机型还涨价了 
 [AADCB2A5-6AF4-4881-ADE3-D839984F2629]
橘又青 (@jvyouqing)求助各位佬, openclaw 使用公益站出现502的问题 中发帖

请教各位佬有遇到过openclaw 调用公益站的时候出现502的情况吗,只有openclaw 去调用的时候会,我用cherry studio 调用就正常,是要改什么配置吗 
如图 

openclaw 的请求

[image]


cherry studio  的请求

[image]
poi (@poipoitake001)有佬知道闲鱼号没曝光了还有救吗? 中发帖

上架商品没有曝光了,买曝光也没一个咨询,检测违规二十几次,但是没有过投诉差评什么的。问客服说账号正常没有被降权,这种情况还有救吗?
@Syl不懂就问,CPA目前不可取代嘛,单用sub2或者newapi可以涵盖它的职能嘛 中发帖

不懂就问,CPA目前不可取代嘛,单用sub2或者newapi可以嘛
Luke刚花了400块开了即梦高级会员,值不值? 中发帖

谁有靠谱便宜的门道, 
谁有靠谱便宜的门道。 
谁有靠谱便宜的门道 
重要事情说3遍
比卡丘 (@yixiaochuan)deepseek V4 pro降价简直是我的及时雨。 中发帖

最近oai渠道炸了,L站公益几乎也炸完了。 
A/更别提了,我早就炸完了。 
越是这样,越是感谢deepseek。 
这几天hermes都用的flash,没想到梁文峰他pro都降价,真狠。 
直接接上pro,opencode走起review自己所有小项目, 
爽啊! 
不知道其他佬友高大上的测试, 
我自己使用感觉真有sonnet-4.6 -→ opus-4.6之间。 
反正被“根因侠”gpt-5.4好用多,因为废话套话太多。 
gpt-5.5还没用上,plus的codex好像还没资格用,我cpa反代没出。据说没废话了。 
但是不重要,这个价格,我就用deepseek-v4-pro了。 
我真是受够了各种被封号,被禁用,不接受银行卡的操作。 
PS.之前L站佬友开源的cursor2api用残废文本版本的sonnet-4.6, 
我都觉得比gpt-5.4好用稳定说重点。 
 [image] 
...
btcer.org (@BtcHank)为什么会有那么大的token需求 中发帖

看到很多佬们token需求很大,但我连年初白嫖的gemini pro都用不完。 
感觉网页版完全够用。好着急焦虑,感觉是自己不会用,总是泡论坛,问ai好像也解决不了我的疑问。 
Cherry studio不就是多了一些预设了提示词的智能体? 
在不写代码的情况下,用api的token比直接网页版有多少差距? 
怎么使用api比使用网页版更好的辅助自己学习和生活?
bugbee (@bugchief)似乎A/对新功能的风控更严?ClaudeDesign达限额后当天被封 中发帖

去年8月开始用的Pro老号,最近1个月升了Max 5x。 
偶有忘开梯子直连,频繁切ip,都相安无事。 
昨天凌晨试用Claude Design,1个小时达限额。当天晚上就收到了封禁邮件。 

买不起 Max 了,求推荐安全稳定的 Pro Plan 上车方案。
轻雪 (@snowyfox)python中的插件架构设计有什么可以参考的案例? 中发帖

python因为其缓存机制 导致插件和热重载较难实现 那么在python中实现插件机制和热重载有什么好的参考案例? 
我在实现热重载时, 发现了包括但不限于注册器, 基类等缓存问题, 以及python提供的卸载并不能完全卸载,且会导致内存泄漏等问题(pygc计数器的问题) 
请问这些问题有什么好的解决方案以及有什么可参考项目? 
(忽略py新的子解释器, 这应该算不上热重载)
别再熬夜伤身体 (@nanthen)佬友们家宽选了几十个 但是pro 反代一直是gpt 4o 中发帖

[mmexport1777219400442] 
有什么好办法和渠道吗? 
vps dmit 
家宽webshare asn 7015 
gpt 对话一直是菜的抠脚 
 [mmexport1777219542328] 
[mmexport1777219541080]
途川 (@litjohn)DS v4 强在哪里? 中发帖

V3.2 时代我就对 DS 有偏见。原因非常的直观:听不懂人话,在理解隐含意图的层面上连 qwen 3.5 都打不过。 
结果 V4 时代仍然不能很好的听懂人话,作为 T 级参数量的模型,结果连降智降成傻子的 Gemini 3 flash 都不如。 
包括做题能力。V4 pro 的做题能力感觉并不理想,CF 3200 是肯定没有的。做一些相对简单的题都感觉完全不得要领,思维链绕来绕去。Gemini 3.1 Pro 的表现就好很多。 
仍然不支持多模态。 
以上是一些吐槽。事实上,在 V4 发布之前,我也很有期待。但是实际上手之后感觉失望了。我相信这是我的使用场景和 DS 的能力方向不重叠带来的。所以,诸位,请问 DS V4 的强大到底体现在哪里呢?
ggvis (@ggvisPro)奇怪的收藏又增加了 中发帖

今突然心血来潮买了很多订书机,无广,等到手了看看如何吧 
 [9EFA2DB8-603D-47F3-8AA2-2EAE72C090D2]
zqhsqb🛡️ (@zqhsqb)参加完俺县半马志愿者了 中发帖

[Image1777219040403872] 
[Image1777219037527103] 
(我是存取衣志愿者,鬼知道我整理了多少东西) 
挺好的,还合照了,就是第一没有合上 
第一张是小杰,第二张是我们县半马140兔子 
(题外话:人类首次全马破二,nb)
@faker_pu安卓应用打包排队,自己手动打包 中发帖

前景:朋友用uniapp开发的app应用,然后抱怨云打包一直排队,大概最近ai的应用太多了,导致排队太多太久了,问我有什么方法可以手动打包的,之前没有接触过安卓打包,然后用ai搜了下可以实现,然后感觉这也是一个商机嘛,自己建一个打包的平台,然后研究了下。

整个流程

Node.js CLI工具
   ↓
调用 Capacitor
   ↓
自动生成 Android 项目
   ↓
调用 Gradle 打包 APK


安装工具

1. 安装commandlinetools
 - 安卓打包需要的环境
 - 设置环境变量在cmdline-tools上层目录设ANDROID_HOME
 - 安装组件sdkmanager "platform-tools" "platforms;android-33" "build-tools;33.0.2"
 - sdkmanager --licenses 一路...
@0xzkslrpaypal支付失败“请返回商家页面并选择其他付款方式。” 中发帖

之前用pp一直在开team试用都没问题,刚才测试突然不行了,有佬友遇到这个问题吗
changhe (@leelaotou)ultra拉家庭组,报错不在同一个地区的解决方案 中发帖

第一点:确认首先清空子号的所有支付方式。 
第二点:使用美国节点点击邀请链接,就可以成功加入,亲测可用!
onlyhugeai时代佬友有感觉自己脑雾了吗 中发帖

我写代码都点yes,yes,yes,甚至直接全给权限放着跑了吧。中间的过程就在玩手机。好像也有不少人把vibe coding当做奶头乐一样,迅速获得多巴胺的方式。我是感觉自己已经好久没动过脑了,遇到一点点难的只会让ai跑都不想自己想一下(不过我也不如ai)。时间长了确实有脑雾感,记忆力退化、越来越不愿意思考、思考能力也在退化。
Back to Top