欣 郁 (@user1164) 在 真实场景下的Deepseek的注意力提升(可能超越哈基米) 中发帖
Deepseek的长上下文带来的注意力提升非常扎实。
我自己的真实场景测评,就是从摘要数据库(例如pubmed)获得论文摘要集合,然后让AI写文献。
这是我目前的测试文本(来自pubmed的50篇文献摘要,21k英文单词)
abstract-rheumatoid-set.txt (164.5 KB)
提示词:
我将发你一个文本,里面是一些文献的摘要。基于这个文本,帮我写一篇综述,主题是“JAK抑制剂在类风湿关节炎中的研究进展”,要求:
以学术语言组织文本
请不要使用虚拟引用;严格使用我给你的文本材料;
尽可能地利用到文本里面的所有内容
要有规范的引文格式,以尾注的形式
这就是一个典型的中长文本读取和输出能力测试。
我分别测评了网页版gemini3 pro(我自己开的gemini pro),第三方中转版的gemini2.5 pro(应该是vert...