井芹仁菜 (@entr0pia) 在 虽然Gemini降智降成美国豆包了,但是多模态能力国产还是难以望其项背 中发帖
我看的一部漫画部分章节缺少汉化,于是我vibe开发了一个翻译插件,让多模态大模型翻译和嵌字。
gemini-3.1-flash-lite-preview效果就已经足够好了,刚领了Mimo的赛博鸡蛋,拿来试一试,结果完全不可用,即便是mimo-v2.5-pro。
目测Mimo的问题有:
指令遵循不够好,必须显式地传入结构化输出参数,才会输出符合要求的JSON对象;
日语不好,总是漏翻、错翻;
不知道从哪里产生的幻觉,常常根据画面脑补不存在的内容,贴一些虎狼之词;
嵌字位置精度差。
[image]
[image]
[image]
[image]