斯塔尔特 (@theStart) 在 拿ETL测试了一下M3,结果还行啊 中发帖
之前做过很多数据清洗的相关工作,最近大家都在讨论mimimax新模型,我直接拿来测试对比一下,看看这个模型到底怎么样。结论在末尾。
自己出题太难为我了,还是叫claude吧。
题目设置
我叫Claude 老师出了一道数据清洗的算法题:
[图片]
测试流程
任务发下去,M3首先是阅读了示列输入表格。
[图片]
随即他陷入了长达十多分钟的慢思考,然后列出了计划表,可以看出,M3是想好了再做的类型。
[图片]
看着最终结果。
让克劳德评价一下。
[图片]
问题有点大,easy难度大数据清洗没有问题,但其他难度分值异常低。克劳德老师说要重新评价一下。让我看看怎么回事。
[图片]
原来是裁判失手了。问题不大,让他重新判分。
结果出来了:
[图片]
[图片]
看来代码能力是有的,就是不够严谨。。。。。。吗?
回看一下考场:
[图片]
考场只有这些,如果考场没有东...