https://linux.do 论坛的话题更新通知频道。
香农 (@Shannon)我认为 gpt image2 的效果这么好,很大程度上是做了工程上的优化 中发帖

底模肯定是有改进的,但单从纯图片的表现力来看,还不至于甩大香蕉一大截。最近大家都用 UI界面、网页布局和中文文字来测试 image2,横平竖直做到非常好,中文也很清晰,太好了,以至于让我感觉不像是单次推理就能生出来的图。 
我大胆假设:image2 是不是可能有一套 类似于 ps 的 agent 工作流?可能生图过程不是一气呵成的,它底层会先解耦:比如先通过代码生成前端框架,再嵌入ai生成的图,最后再用ai来全局润色/重绘;中文效果这么好,也很有可能是先用文字层布局,再重绘一遍来实现融合。鉴于我对文本大模型的使用经验来看,上下文稍微长一点都可能前言不搭后语。很难理解这些图片能做到图像拓扑结构上如此完美的精确性。 
假如这些图片真的是一口气生成出来的,那会不会很快,视频生成模型的 sota 也要易主到 openai 了?
@Tred新人报道,超级开心能和各位优秀佬友们请教和学习啦 中发帖

昨晚注册的今早起来第一件事看了一下进度,没有过批准以为没戏了😭😭,然后水课早八一直在改进小作文,结果改着改着看到成功的邮件突然给我发来啦,真的超级开心🥳🥳!感谢L站!我是某双非人工智能专业大二的学生,非常感谢能加入L站,今后可以和佬友们请教和学习AI方面的问题啦,一起进步 🙏
Jedi_Pz【求助】如何让 openclaw 直接读取音视频联合输入,从而使用mimo-omni 的音视频理解能力 中发帖

我搞了 mimo 的 token plan,看到他家 mimo-omni 有音视频理解能力,想让 openclaw 直接看带音频的视频,目前没找到解决方法,求各位佬给看看 🥰 
目前我问 openclaw 如何能实现,它用 ffmpeg 隔几秒抽一帧,看字幕理解的视频,我感觉这不优雅…… 

openclaw: 通过 yt-dlp 下载视频 → ffmpeg 抽帧 → 我直接看图理解。不过音频转录这块我还没装语音识别工具(FunASR之类的),所以目前主要靠画面上的字幕来理解对话内容。
@dai求问各个IDE中,Claude模型的性价比 中发帖

之前一直用Codex + gpt 5.4 
说来惭愧之前一直没用过claude opus 4.6 
前天看了佬友的帖子 薅了Windsurf的试用羊毛 
高强度用了两天 Claude Opus 4.6 Thinking 耳目一新 
半句废话没有、思路清晰有力,有点上瘾的感觉 
我知道的 比如Windsurf、Cursor、Antigrvity甚至Qoder等等里面都有提供 
求问下哪个IDE提供的Claude模型性价比最高
喜欢这里爱你们 (@band_jim)gpt plus可以用生图了吗? 中发帖

cpa反代会不会封,有数量限制吗?每个号每天多少次啊?
丶世博 (@Shibo_Zhang)好奇大家的cli是怎么使用的 中发帖

好奇大家的cli是怎么使用的。自打开始做软件开发,从最早用net beans,后来到eclipse、myeclipse,然后用idea。 
自从llm火了起来之后,有了AI编程就一直在用cursor,中间也试用过trae、claude code这种。直到最近使用codex完成了一个小的demo的编写之后,发现cli的使用是真的不习惯,没有调试器,不能debug。 
所以想问下各位佬,cli和ide之间是怎么结合使用的,cli有哪些优势?
eros face新入手一个域名,eRMB 不知道有没有机会 中发帖

[ermb] 
期待可以有机会卖个好价
海盗船长 (@captain5258)如何高效的使用claude code或者高效coding? 中发帖

话说大佬们,平时太忙没时间细研究具体的coding工作流之类的,市面上大部门coding软件也都会用,之前用any,现在主力使用Claude code,但是如何才能高效的开发一个自己的想法,比如有一个想法,但是还没有形成完整的产品链路,如何才能让ai启发自己,如何让ai自驱动的拓展功能,如何高效的使用流程化的开发,如何多项目并行开发。求大佬们解惑。
枳萌 (@ZMGID)KIMI我服了,一个PPT我11%额度就没有了 中发帖

我买的的KIMI的199的套餐 
 [image] 
之前做PPT用的额度都是不到1%,这次突然11.57%,为啥啊,我都服了 
 [image] 
内容和提示词都是差不多的,我不知道为什么浪费我这么多,这指定不正常 
 [image]
LPK (@lpk3215)codex什么时候能再次额度翻倍啊 中发帖

过年那段时间积分翻倍,额度翻倍,用的不要太爽 
一个账号就完全够用,公益站中转站也没断过,我也没怎么用过,因为自己的一个账号就完全够用,不够用就来俩, 
到现在的除了pro账号还能抗一阵,其他的都不行了,额度太少了😓😓😓😓 
什么时候能重回巅峰啊
StaringF (@Kiraspark)有没有佬知道美国公对公的账户转账,ACH需要多久来着? 中发帖

🫪问了AI说是1-3个工作日… 
有一笔款得从中转的站点,用的平台的公账+抬头,付到另外一个平台的公账,但因为是第一次转,也不太懂美国那边的号码什么的 
现在就是又希望早点到,又希望别付丢,因为走的平台,一次公对公直接花了20美金的费用… 
然后工作日包括晚上和大半夜吗?还是只有早上到下午算正常时间?大概美国周二晚上转的,美国周三晚上能到吗?还是周四晚上?
Naruto (@gboy)GPT Image 2生成数学试卷 中发帖

[ChatGPT Image 2026年4月22日 132447] 
印刷体和手写体几乎都没有什么瑕疵,另外有没有大佬检查一下写的对不对啊 🤣
小许 (@XiaoXuRa)跪求一个Gemini中转站 中发帖

主要用来在Gemini Cli写前端用的,之前开通了Gemini AI Pro会员,昨天用着还好好的,今天就提示没权限了,站内查了一下,可能是被软封禁了(只有cli用不了) 
Claude写前端也不错,但是太贵了哇,而且还不稳定 
我也曾尝试过使用GPT5.4写前端,丑吐了哇,而且GPT写的UI总是会把页面分成许多块,然后还有很多余的小子注释,浪费页面空间(希望GPT5.5能优化好UI) 
我自己看了几个富可敌国的中转站,用了一下,一轮UI生成差不多就跑没了10块钱,我真的用不起哇,大概8¥/m Token 
所有有没有便宜点的或者公益站,能用Gemini 3.x Pro模型的
sounfuryGpt-image2 二次元测试 中发帖

闲来无事试了试gpt-image2生成二次元图片的效果,只能说远远超出了我的意料 
 [image_picker_0B61E693-2E42-462D-8181-58B63CBCDD95-46695-00000E842E63E1CC.png] 
[image_picker_CA379497-B46C-4DFD-AB4E-FF7C22C50109-46695-00000E842DD8FC65.png]
mjanddychatgpt已经修复生成明星了吗? 中发帖

[image] 
已经不能明星的图像了吗?
懒羊羊大王🕶️_King (@lpp)win11新增了测速功能,还是SPEEDTEST 中发帖

昨天家里刚刚扯了宽带,给电脑配置网络呢 ,右键网络图标出现了一个“执行速度测试”,点击网页打开一个测速页面,看着还是SPEEDTEST的。 
今天来到公司又看了下办公电脑里的虚拟机,确实也是有,一直没有注意到。 
 [图片]
@Clearelk各位佬友,求助降AI率提示词 中发帖

最近准备要写论文了,大部分都是生成的,问问佬友们有没有好用的提示词?
Devin Wu (@Judy_1)codex 手机端使用 中发帖

现在手上有一个team自用,想在手机(ios)上用codex,佬们有解决方案吗?
杨洋阳 (@ybh970817)智谱coding plan 再次被刺老用户 中发帖

[image] 
老套餐即将不存在了
xking用的中转站好像串号了 笑哭 中发帖

逗笑我了  能不能让AI去看看别人在做什么 😅 
 [image]
Back to Top