789 (@1999) 在 尝试了各种ai和ocr提取手写字小说,最后发现元宝是最好用的 中发帖
起因:朋友不知道从哪里翻出来他以前上学时写的小说,然后想让我帮他整成电子版方便发给同学看。
我把他的小说一页一页拍完照后,首先想到的是gemini,毕竟都说gemini多模态强。然而我简单测试后却发现准确率不够高,而且还有些幻觉(我觉得我朋友写的字很密和不是很好看是一大原因),总之就是不太能用。
后面我又测试了豆包、deepseek、kimi、文心、智谱清言、gpt、grok、qwen、元宝、还有扫描全能王、微信文字识别、夸克扫描、glmocr和PaddleOCR-VL-1.5。
结果是豆包、deepseek、文心、gpt、grok和qwen完全没法用,搁那输出了一半就开始胡编乱造,然后扫描全能王、微信文字识别、夸克扫描、glmocr和PaddleOCR-VL-1.5准确率不够,而且对于一些涂改和太难看、潦草的字基本没法识别,排版也不好。
kimi2.5、gemini 3 flas...