Pixelle-Video:本地化AI短视频生成流水线实战指南
2026/6/16 4:30:56
word2markdown是一款优秀的 Word 转 Markdown 工具。随着人工智能技术的普及,将 Word 文档转换为 Markdown 格式供 AI 分析已成为常见需求。然而,现有工具(如 pandoc 等)在转换效果上往往不尽如人意。
为此,作者开发了这款基于 Python 的 Word 转 Markdown 工具,它能够智能识别 Word 文档中的各种格式元素(标题、加粗、列表、代码块、表格、图片、超链接等),并准确转换为对应的 Markdown 语法。经过实际测试,本工具在转换准确性和格式保持方面表现优异。
项目网址:word2markdown
如果觉得不错记得给项目标个星哦!
test_file/input/linux-manual.docx是一篇用于测试的 Word 文档。
test_file/output/linux-manual.md是转换后预期得到的 Markdown 文档。
test_file/output/linux-manual.imgs是转换后从 Word 中提取的图片的存放路径。
pip 安装依赖:
python3.11 -m pipinstall-r requirements.txt运行转换命令,测试转换效果:
python3.11 main.py test_file/input/linux-manual.docx转换生成的 Markdown 文档和图片会存放在test_file/input/目录下。
使用你转换生成的 Markdown 文档和预期得到的 Markdown 文档对比,二者除了图片链接外,内容应该是一样的。
因为转换工具每次从 Word 中提取图片时,会动态生成 UUID 作为图片名字,因此每次运行得到的图片名字是不一样的。