LeetCode 两个数组的交集题解
2026/5/8 16:17:04
开发一个简单的Windows GUI应用原型,使用Poppler实现以下功能:1) 选择PDF文件;2) 提取指定页面文本;3) 显示提取结果;4) 保存为TXT文件。使用Python+PyQt5实现,要求界面简洁,代码模块化,2小时内可完成开发。提供完整代码和打包说明。最近有个临时需求要批量提取PDF里的文字内容,网上工具要么收费要么有使用限制。正好发现Python有个poppler库能直接解析PDF,配合PyQt5做个图形界面,1小时就能搞出个轻量级工具。记录下开发过程,给需要快速验证想法的小伙伴参考。
poppler-utils的pdftotext命令提取文本(比PyPDF2稳定),PyQt5做界面(比Tkinter更现代),最后用pyinstaller打包成exe。pip install python-poppler pyqt5安装依赖,注意Windows系统需要单独下载poppler的bin文件并配置环境变量。QLineEdit做文件路径输入,QSpinBox选择页码,QTextEdit显示提取结果,三个按钮分别触发文件选择、提取和保存动作。QFileDialog实现,提取文本时调用subprocess执行pdftotext -f {页码} -l {页码} {文件路径} -命令捕获输出。os.path.normpath统一处理斜杠,否则可能报错。encoding='utf-8',否则输出可能是乱码。QThread防止界面卡死,进度显示可以用QProgressBar。pyinstaller --onefile --windowed生成单exe文件,记得把poppler的dll文件打包进去。整个过程在InsCode(快马)平台的在线编辑器里就能完成,不用配本地环境特别省心。他们的代码补全和实时错误提示对快速开发帮助很大,写完直接点部署按钮还能生成可分享的演示链接。
如果只是临时用用,甚至不用打包exe,直接把脚本丢到InsCode上运行更快捷。我试过上传一个15页的合同PDF,从编码到成功提取文本只用了47分钟,这种快速验证的感觉真的很爽。
开发一个简单的Windows GUI应用原型,使用Poppler实现以下功能:1) 选择PDF文件;2) 提取指定页面文本;3) 显示提取结果;4) 保存为TXT文件。使用Python+PyQt5实现,要求界面简洁,代码模块化,2小时内可完成开发。提供完整代码和打包说明。创作声明:本文部分内容由AI辅助生成(AIGC),仅供参考