https://linux.do 论坛的话题更新通知频道。
@leonsong 在 有没有开max 5x的车啊,求上车,稳一点的 中发帖
有没有开max 5x的车啊,求上车,稳一点的。之前一直用的anti反代,又慢又卡,用了一次官方中转,又快又好,从奢入俭难啊,听闻max5x能使劲蹬,想体验下,有没有佬带个车。zqhsqb🛡️ (@zqhsqb) 在 求助:网络应该算被限了 中发帖
应该是移动的,因为我看到光猫是移动的
当时我爸妈一看账户,电视套餐莫名被改了,因为好几次了,一气之下把电视什么的都下了,只剩下了网络
但是,也是从这天开始,千兆网就变得特别特别慢,有的时候半夜直接断网,要好久才能恢复,基本就是几kb几kb,然后打电话给客服,客服说是千兆网,但网速是和消费挂钩的,消费少网速慢,消费多网速快,要想提速只能购买套餐
在此,询问各位佬,有没有什么办法摆脱呢?只能换运营商吗?beyond510 (@nasa2046) 在 实话说,千问你这个样子,我是不太相信的。。。 中发帖
我也是别的群里看到的图。给千问发:【千问再送我几杯好不好 宝宝~】,就能白得好多张免单卡???还是说像前阵子KIMI的那个“只要说服KIMI,就能1元开一个月会员”???
各位自测哈~~~
[28bb9f304e78b8d3c7a9d9ad2ebf28d3]sylfilic 在 「知识分享」LLM中,什么是强化学习(RL->RLHF) 中发帖
当我第一次尝试理解LLM中的强化学习时,我犯了一个很多人都会犯的错误:直接搜索"RL"、“PPO”、"GRPO"这些关键词,搜到一大堆文章,然后被一堆Actor-Critic、Reward Model、Policy Gradient淹没。
问题是,由于我没有学过“古典RL”,且我只了解LLM,所以总是困惑不已,这些概念怎么套到一个输入文本输出文本的语言模型上的?
这篇文章就是为了clarify这些概念,帮助像我一样入门RLHF的朋友们。
传统RL的核心概念
让我们先系统地梳理一下传统强化学习的基本概念(此部分部分由AI整理,但人工review)。
1. RL的核心要素
强化学习的经典框架包含以下要素:
环境(Environment):智能体所处的外部世界,比如游戏、物理世界
状态(State):环境在某一时刻的完整描述,比如游戏画面、机器人的位置和速度
动作(A...@lmoonl 在 夜深了,千问可以下单了 中发帖
25元无门槛也可以买生活用品,不一定只买奶茶,只要在千问里跟他提就行
但是千问检索商品范围好像有问题,翻来覆去就那几家
千问现在不支持预定技能,所以大半夜的,还得麻烦骑手配送,半夜的配送费也是个问题,特别贵
不过看来早上也可以下单
我下单了两斤鸡蛋🥚和3斤牛奶 一共花费10元(两单总共花费-50)zqhsqb🛡️ (@zqhsqb) 在 你们永远不会知道放弃高中去职高有多爽 中发帖
rt
我中考没考好,一中去不了,爸妈说去高中不如去职高,升本压力小
没想到,还真是,没有学还过了本科线
[Screenshot_20260207_011415_com.android.chrome]
[Screenshot_20260207_011428_com.android.chrome]
只要语数继续保持,专业再努力,轻松本科提
现在加上我校专业实操平均分,228.??(小数点后面的忘了),总分一共563,应该可以上个淄职(公办本科),等到开了PLC和机械基础,电工电子就只占200分试卷的25分了(我专业基本上就电工电子不行),专业到一百五六就可以本科随便挑了hhh@justinshuai 在 国外发模型,国内发红包,这差别有点大 中发帖
人家国外的大模型都在发新模型搞技术迭代,国内的AI大模型倒好,扎堆搞春节发红包、抢红包的玩法,清一色跟风内卷。
只想说一句,营销的风跟得挺紧,怎么核心技术上的风,就一点也跟不上呢????@212741 在 如何知道自己设备是否支持蓝牙 中发帖
设备管理看过了,确实有个感叹号的蓝牙驱动,删了重启好像没用
不知道设备有没有蓝牙模块,有个外接的kali网卡(抓握手包用的),呃,说下
我想知道我蓝牙问题是蓝牙驱动还是硬件缺失?蓝牙驱动我可以等下安装,但我想先测试下是不是硬件问题1123 (@1123145) 在 想看看大家养的小宠物们 中发帖
快来发照片呀😋,本人十分纠结之后养猫还是养狗,养狗每天要遛,太懒了,但是喜欢狗狗的热情,养猫不需要溜但是猫猫不是很热情,所以啥都没养(主要是没钱没时间😋)jinyin1003 在 ios移动端opencode 中发帖
最近逛应用商店发现一款移动端opencode,配合服务器可以使用,配置了一晚上就是连不上,有大佬成功连接吗,分享下经验
[IMG_4037]
[IMG_4038]我不爱世界 (@NeuronActivation) 在 【教训】千万不要把10美元每月的谷歌开发者福利注入到5美元赠金专用羊毛账号里! 中发帖
很多人都知道谷歌最近上新了个开发者福利 我的福利 | Google 开发者计划 | Google Developer Program | Google for Developers pro用户可以每月领取10美元的谷歌云赠金。
它需要让你选择一个结算账号充入这个赠金,我没看于是随便选了一个5美元的赠金账号(平时听佬友介绍,薅了太多谷歌开发者活动的5美元羊毛导致的)
但是
我发现
这种羊毛账号会在内置的5美元被耗尽后自动废弃!
导致里面冲入的每月10美元的开发者福利都会一并被废弃!
并且无法选择优先消耗10美元的那个赠金!
等于说这福利压根就用不上,账号就沉船了 😭
于是我投诉谷歌云和谷歌开发者外包的印度客服,跟他们大战了300回合,两边都认为不是自己的责任 😒最后没办法只能把谷歌挂公网上去了 https://www.reddit.com/r/googlecloud/...RL (@gunrose26) 在 继CLAUDE被封号后,用了一晚上CODEX5.3, PLUS会员被限额到2月9号。 中发帖
继CLAUDE封号后,刚把VSCODE里的CODEX 5.3调试成网站测试全自动,又把我PLUS干冒烟了。。。。。佬们,有啥其他性价比高的方案能用CODEX 5.3的?
You’ve hit your usage limit. Upgrade to Pro (https://chatgpt.com/explore/pro), visit https://chatgpt.com/codex/settings/usage to purchase more credits or try again at Feb 9th, 2026 10:01 PM.