你将收获

1、熟练掌握 Camelot 的具体用法,灵活运用常见参数

2、能够从各种 PDF 中提取出表格数据,提升工作效率

适用人群

有一定的 Python 基础,掌握 Pandas 的基本使用,想要学习如何从 PDF 文件中提取表格数据

课程介绍

【为什么开这门课】

有时在整理分析数据时 ,数据源是 PDF 文件,如果直接从 PDF 文件复制粘贴数据的话,会碰到格式错位、数据有误的情况,或者有很多页 PDF ,复制粘贴起来很麻烦,是个体力活。

使用 Python 的 Camelot 包来自动化解析 PDF 中的有线框和无线框表格,代码简洁高效,而且可以把数据保存到 Excel、CSV 等文件中,便于对数据进行对比分析,极大地提高了数据处理的效率。

 

【课程设计大纲】

课程目录