欣 郁 (@user1164) 在 真实场景下的Deepseek的注意力评测II(可能超越哈基米) 中发帖
原贴内容太混乱了真实场景下的Deepseek的注意力提升(可能超越哈基米)
主要是很多佬友指出了我的评测的不严谨,于是我严谨地测试了一下,并重新排版
-----手动分割线----------
Deepseek的长上下文带来的注意力提升非常扎实。
我自己的真实场景测评,就是从摘要数据库(例如pubmed)获得论文摘要集合,然后让AI写文献。
这是我目前的测试文本(来自pubmed的50篇文献摘要,21k英文单词):
abstract-rheumatoid-set.txt (164.5 KB)
提示词:
我将发你一个文本,里面是一些文献的摘要。基于这个文本,帮我写一篇综述,主题是“JAK抑制剂在类风湿关节炎中的研究进展”,要求:
以学术语言组织文本
请不要使用虚拟引用;严格使用我给你的文本材料;
尽可能地利用到文本里面的所有内容
要有规范的引文格式,以尾注的形式
这就...