讓PDF文件「可被搜尋」是什麼意思?


PDF在我們生活中已是個常態性的存在,但PDF文件其實也分為兩種:不可搜尋的圖片PDF,和可搜尋的文件PDF

所謂的可被搜尋其實是來自英文的「searchable」一詞,就是可以選擇到裡面的文字;而一般來自掃描器的PDF檔案,多半都只是虛有其表的「文字影像」而已,無法再進一步利用其中的內文。

所幸通常以軟體匯出或是轉換的PDF,都會保留文件其中的文字。例如您開啟一份當年的合約PDF文件,就可以透過搜尋功能迅速找到關鍵字,比起用眼球逐頁搜尋不知好了幾倍。

假如你還是和掃描件PDF狹路相逢,不要絕望!如果你有文電通專業版這類PDF軟體,就可以用OCR(光學字元識別)功能將圖片PDF轉換為文件PDF,雖然看起來一模一樣,但是裡面的內文卻突然能夠選擇、複製和修改了呢!


延伸閱讀:



[懶人包]抓取PDF文件上的文字-OCR光學字元識別


[教學影片]將掃描文件轉成PDF並直接編輯



0 意見: