导入包

匹配需要提取数据的文件

利用pymupdf提取pdf文本

导入文件和方程

生成新的html

最终结果:

-index2012年年度报告.html -index2016年年度报告.html -index2017年年度报告 -index2021年年度报告