Megasoft (@zhong_little)【worker 脚本分享】LongCat-Omni 不会用?官方文档还在摸鱼让我写个丑陋脚本 中发帖

[!bug] TLDR: 慵懒的官方与丑陋的脚本 



美团的 Omni 多模态模型其实去年就出原型,不过最近听说模型升级了(2603),同时提供 LongCat API 支持了,但是好像官方没有完全兼容 OpenAI 格式,导致没法直接调用起来。对着官方文档研究了一下,发现了问题所在: 
 [image] 


Omini 是全模态聊天模型,支持文本、语音、图片、视频等多种模态的混合输入和输出,所以它的 content 只支持 array 格式,抛弃了(或者只是忘记兼容了)最简单的 string 纯文本输入类型,即使只是纯文本输入,也要封装成 text 对象。

 [image] 



另外一个差别是 openai 传图用的字段是 image_url,omni 用的是 input_image 


Omni 还有一个控制输出模态的字段(output_modalities),默认为[...
 
 
Back to Top