PDF複製出來的文字事變碼(字型問題)－這裡是和天成翻譯有關的地盤,歡迎到訪我的BLOG!

醫學期刊翻譯爬了文，看到是內嵌包的字型在自己的電腦沒有所造成

piligo wrote:
感謝
看不懂
並且如是圖片 scan 的中文字+ 圖的雜誌不知道
請教是不是有對象可以把內嵌的字型給撈出來，或有其他方式可以准確的轉成doc?
感謝您的處理範本

很不幸地，我今朝知道的解法都得動用OCR，步驟稍為省事的是用ACROBAT將PDF檔轉為JPEG，再用ACROBAT開啟轉出的JPEG，接著套用ACROBAT內建的OCR，最後再轉存為DOC即可。
乞助PDF內容複製變亂碼問題有提到解決方法，但也要Acrobat X Standard以上的版本才有TouchUp文字東西的功能
哇~莫非您也是處置過...(恕刪)

nsps5606 wrote:

書籍掃描後操縱 Acrobat 10 OCR 的 ClearScan 進行辨識，

下載點二

天成翻譯公司不想動OCR是因為有400多頁 @@

你還是乖乖OCR吧....英文的OCR起來總比中文的輕易多了吧
google DOCS
話說既然PDF可以把字型包進去，卻不能抽出來，期待有人開辟出此工具
vane wrote:

可能中文 ocr 要別軟體吧

Adobe Reader裡頭有一個功能是，檔案==>另存文字，存好後如果用筆記本開啟會亂碼的話，

中文 OCR光學文字辨認東西 Readiris Pro

附加壓縮檔: 201110/mobile01-ce6c12e5fbb4794283e0d64ab63bb1e3.zip

感謝提供方法
會主動將 PDF 或圖片中可以辨識的文字擷掏出來，並記實在 Google 文件中做後續編纂
1.透過Adobe Reader複製後貼在任何編纂軟體都是口口口口口口口口口口口口口口口口
2.透過http://convertpdftoword.net轉成doc是空白檔案
3.透過http://www.pdfonline.com轉成doc是_RI[_WIGXMSR_XMXPIH_'MXMRK_7SYVGIW_3VEP
4.透過Solid Converter PDF轉出來跟RI[_WIGXMSR_XMXPIH_'MXMRK_7SYVGIW_3VEP雷同
5.透過Foxit PDF Editor要改字型卻呈現新字型的編碼與某些拔取對象的今朝字型不相容翻譯調動字型作業已被打消翻譯

helps students with all these challenges. It deals with both print and online

vane wrote:

應當不會需要動到OCR吧

附加緊縮檔: 201110/mobile01-1245a341b7e52749e807cfdbc04d25c0.zip
In Chapter 7, I have added a new section titled Citing Sources Orally that
因為翻譯公司的檔案都是英文，所以存好是不會有亂碼的。

經由底下幾項測試
附檔是gdocs轉出來的翻譯社再下載轉存為txt翻譯社排板可能要調劑一下
AnyBizSoft PDF Converter 將 PDF 檔案轉換成 Word、PowerPoint、HTML 網頁或是純文字，而且也支援批次轉檔和已加密的 PDF 檔案。
剛try 過中文的圖片

anyPdftool 的 pdf convert 好像有support ocr

最少不用轉來轉去做ocr,只要傳上gdocs後,下載回來再批改就能夠了!

SCANSOFT PDF CONVERTER PRO 仿佛是一般convert

謝謝各人

該 pdf 檔便會內嵌一推字型，
能 ocr 轉成 word 嗎 ??

請參考此文，天成翻譯公司測試結果是可行的，惋惜辨識準確率未達100%。

哇~豈非您也是處理過相同的電子檔，連原始檔有467頁包了351種字型也都吻合 XD

請使用流灠器打開文字檔，再把編碼選萬國碼，看看是否是還是亂碼翻譯

翻譯公司照舊乖乖OCR吧....(恕刪)
哇~莫非您也是處置過...(恕刪)

附加緊縮檔: 201110/mobile01-926b1366d1ef5f9f04acdb4c972e5b6e.zip

以下文章來自: https://www.mobile01.com/topicdetail.php?f=511&t=2391720有關各國語文翻譯公證的問題歡迎諮詢天成翻譯公司02-77260931