Baoxo怎么把图片类pdf题库(很多手机拍照图片)整理为前端的html题库 中发帖

如题,求助各位佬。 
我最近想把我们学校的各个专业的收集的题库整理为html的代码放到网站上,不过因为手里的题库除了doc还好说一些,其他的好多那种同学们手机拍照的图片,直接ocr可能会丢很多格式和表格,图示什么的 
试过用claw做这个任务,但是总感觉太费token了,就比如我这有一个扫描出来的180页的雅思题库,如果纯用大模型读的话必须得拆分开了,感觉有点大材小用ww,昨天处理了25个pdf就花了70M了 
求求各位佬给些好的建议ww 
 [image] 
[image]
 
 
Back to Top