欣郁 (@user1164) 在真实场景下的Deepseek的注意力评测II（可能超越哈基米）中发帖原贴内容太混乱了真实场景下的Deepseek的注意力提升（可能超越哈基米）

欣郁 (@user1164) 在真实场景下的Deepseek的注意力评测II（可能超越哈基米）中发帖

原贴内容太混乱了真实场景下的Deepseek的注意力提升（可能超越哈基米） 
主要是很多佬友指出了我的评测的不严谨，于是我严谨地测试了一下，并重新排版 
-----手动分割线---------- 
Deepseek的长上下文带来的注意力提升非常扎实。 
我自己的真实场景测评，就是从摘要数据库（例如pubmed）获得论文摘要集合，然后让AI写文献。 
这是我目前的测试文本（来自pubmed的50篇文献摘要，21k英文单词）： 
abstract-rheumatoid-set.txt (164.5 KB) 
提示词： 

我将发你一个文本，里面是一些文献的摘要。基于这个文本，帮我写一篇综述，主题是“JAK抑制剂在类风湿关节炎中的研究进展”，要求： 

以学术语言组织文本
请不要使用虚拟引用；严格使用我给你的文本材料；
尽可能地利用到文本里面的所有内容
要有规范的引文格式，以尾注的形式


这就...