Python pdf2docx 轉換工具介紹。簡單把PDF轉成Word DOCX
相信大家都會跟我一樣有個困擾要怎麼樣才能修改 PDF 檔案, 但頻率又不是多到要買 Acrobat Pro. 我來跟大家分享一個 Python 小工具可以幾乎完美的把 PDF 檔轉換成 Word docx 檔的小工具。
先決要件, 你要先安裝 Python3 在你的作業系統裡。以下的例子是在我 Windows 10 上完成的。
Step 1. 安裝 pdf2docx 程式庫
pip3 install pdf2docx
安裝完後, 如果在指令列打 pdf2docx –help 後出現下面的指令就表示完裝完成了。
C:\Users\chaoman>pdf2docx --help
INFO: Showing help with the command 'pdf2docx -- --help'.
NAME
pdf2docx - Command line interface for ``pdf2docx``.
SYNOPSIS
pdf2docx COMMAND | -
DESCRIPTION
Command line interface for ``pdf2docx``.
COMMANDS
COMMAND is one of the following:
convert
Convert pdf file to docx file.
debug
Convert one PDF page and plot layout information for debugging.
table
Extract table content from pdf pages.
Step 2. 利用 pdf2docx 轉檔
假設我在 C: 槽我自己使用者的下載目錄Downloads有一個 PDF 檔叫做 emteria-android-apps-student-de.pdf。在終端機裡輸入下面的指令。
C:\Users\chaoman\Downloads>pdf2docx convert emteria-android-apps-student-de.pdf emteria-android-apps-student-de.docx
Parsing Page 1: 1/1...
Creating Page 1: 1/1...
--------------------------------------------------
Terminated in 0.25674870000000016s.
一下子就好了。打開轉好的Word檔看看,雖然排版不是那麼完美,但也不錯了。如果是單純的文字檔,這個小工具是可以勝任的。