@Inkovo万能的佬友们,有什么方法自动化读取Excel,pdf 中的数据呀 中发帖

最近的工作是想办法自动化批量从下载的各地的统计年鉴pdf Excel中读取想要的板块数据,然后按照要求的字段提取出来 ,尝试用codex写python脚本实现但是效果都不好,主要每个地区年鉴格式不一样,表头、单位、年份、地区行都不统一,然后字段口径容易混,基本都是AI coding 出来的 不知道怎么推进了 因为让codex改来改去都有新的bug 🥲 
 [image] 
需要提取的内容如这样 落表应该像这样 
[image]
 
 
Back to Top