斯塔尔特 (@theStart) 在拿ETL测试了一下M3，结果还行啊中发帖之前做过很多数据清洗的相关工作，最近大家都在讨论mimimax新模型，我直接拿来测试对比一下，看看这个模型到底怎么样

斯塔尔特 (@theStart) 在拿ETL测试了一下M3，结果还行啊中发帖

之前做过很多数据清洗的相关工作，最近大家都在讨论mimimax新模型，我直接拿来测试对比一下，看看这个模型到底怎么样。结论在末尾。 
自己出题太难为我了，还是叫claude吧。 
题目设置
我叫Claude 老师出了一道数据清洗的算法题： 
[图片] 
测试流程
任务发下去，M3首先是阅读了示列输入表格。 
[图片] 
随即他陷入了长达十多分钟的慢思考，然后列出了计划表，可以看出，M3是想好了再做的类型。 
[图片] 
看着最终结果。 
让克劳德评价一下。 
[图片] 
问题有点大，easy难度大数据清洗没有问题，但其他难度分值异常低。克劳德老师说要重新评价一下。让我看看怎么回事。 
[图片] 
原来是裁判失手了。问题不大，让他重新判分。 
结果出来了： 
[图片] 
[图片] 
看来代码能力是有的，就是不够严谨。。。。。。吗？ 
回看一下考场： 
[图片] 
考场只有这些，如果考场没有东...