Pertanyaan Bagaimana cara mengubah file pdf menjadi file odt?


Saya ingin mengonversi .pdf file ke file .odt file sehingga saya selanjutnya dapat mengonversinya menjadi a .doc mengajukan. Apakah ada perangkat lunak / skrip yang dapat melakukan ini. Saya telah mencoba menyalin konten .pdf file dan paste di penulis liberoffice format tidak dilestarikan.

Dokumen tersebut bersifat rahasia jadi saya lebih memilih untuk tidak menggunakan layanan on-line untuk konversi.

Setiap bantuan sangat dihargai.


29
2018-01-11 17:09


asal


Terkait (tapi tidak duplikat!): Bagaimana cara mengubah odt menjadi pdf? - Eliah Kagan
Untuk LIBREOFFICE / pertanyaan khusus OpenOffice yang saya sarankan ask.libreoffice.org - Bucic


Jawaban:


Saya terganggu oleh kurangnya PDF PDF gratis ke ODT juga. Aku bahkan tidak butuh sesuatu yang rumit. Hanya alat yang menghasilkan file ODT yang saya dapat anotasi di LibreOffice (misalnya untuk mengisi formulir).

Saya tahu cara melakukan ini secara manual, dengan mengubah dokumen PDF menjadi file grafik dan kemudian mengimpornya ke LibreOffice, tetapi itu menjadi membosankan cukup cepat.

Jadi, akhirnya saya menulis skrip shell singkat cepat yang melakukan semua langkah yang diperlukan secara otomatis. Anda dapat menemukannya di https://github.com/gutschke/pdf2odt

Ini dapat mengambil sejumlah file PDF dan gambar sebagai input dan menghasilkan file ODT yang dapat dibuka dan diedit di LibreOffice. Gambar muncul sebagai latar belakang halaman, sehingga Anda dapat menulisnya dengan bebas. Setiap gambar dikaitkan dengan gaya halamannya sendiri. Ingatlah hal itu, saat memasukkan jeda halaman dan sesuaikan gaya halaman seperlunya.

Saya menguji skrip pada Linux dan Mac. Mengingat bahwa hanya perlu beberapa alat standar yang cukup, itu harus cukup portabel.


14
2018-04-13 23:05



Skrip ini membuat tangkapan layar dari setiap halaman dan memplotnya ke dalam format target, Terima kasih untuk skrip Gutschke - Oliver
Saya telah menggunakan pdf2oo beberapa tahun yang lalu, tetapi tampaknya sekarang menghasilkan file korup untuk LibreOffice. Skrip ini melakukan itu dan banyak lagi - terima kasih! - eacousineau
Script pdf2odt, sayangnya, mengkonversi ke format gambar yang digunakan sebagai latar belakang ODT. Jangan berharap untuk dapat "mengedit" teks asli apa pun. - Richard Elkins


Anda bisa melihatnya PDF Utilities (poppler-utils melalui Synaptic atau apt-get) yang termasuk pdftotext:

Poppler adalah pustaka render PDF berdasarkan Xpdf PDF viewer.

Paket ini berisi utilitas baris perintah (berdasarkan Poppler) untuk didapatkan   informasi dokumen PDF, mengkonversikannya ke format lain, atau memanipulasi   mereka:
   * pdfdetach - daftar atau ekstrak file yang disematkan (lampiran)
   * pdffonts - penganalisa font
   * pdfimages - pengekstrak gambar
   * pdfinfo - informasi dokumen
   * pdfseparate - alat ekstraksi halaman
   * pdftocairo - konverter PDF ke PNG / JPEG / PDF / PS / EPS / SVG menggunakan Cairo
   * pdftohtml - PDF ke HTML converter
   * pdftoppm - pengubah gambar PDF ke PPM / PNG / JPEG
   * pdftops - PDF ke PostScript (PS) konverter
   * pdftotext - ekstraksi teks
   * pdfunite - alat penggabungan dokumen

Tentu saja, Keberhasilan akan tergantung pada bagaimana file pdf dihasilkan. Jika Anda mendapatkan apa yang Anda inginkan sebagai file teks, Anda dapat menyimpannya bahwa sebagai file .odt.

Edit: Saya lupa memberikan sumber untuk kutipan itu. Ini dari tab deskripsi di Synaptic untuk PDF Utilities (based on Poppler).


12
2018-01-11 18:41



Dari daftar ini, pdftohtml harus paling sesuai untuk tugas itu, karena HTML dapat memformat. Kemudian HTML dapat dikonversi menjadi ODT atau DOC. - imz -- Ivan Zakharyaschev


LibreOffice mampu mengimpor .pdf file. Cukup buka di versi LibreOffice saat ini untuk hasil terbaik. Akan tetapi, akan membuka dokumen sebagai gambar, dan Anda hanya dapat mengonversinya menjadi salah satu format gambar yang didukung, bukan sebagai dokumen Writer.

Tentu saja, tidak semua format dipertahankan, tetapi setidaknya beberapa.


9
2018-01-11 18:10



Saya mencobanya baru-baru ini, dan itu sangat mengerikan, itu tidak menyimpan format bahkan sedikit. Terlebih lagi, itu membuat teks tidak dapat dibaca sama sekali. - Hi-Angel


Jika itu poppler-utils paket diinstal, Skrip Nautilus di bawah ini (untuk ditempatkan dalam folder ~ / .gnome2 / nautilus-scripts sebagai file yang dapat dieksekusi) akan membantu mengkonversi file PDF ke HTML (opsi "-i" dapat dihapus untuk menyertakan gambar juga), yang kemudian dapat dibuka dengan LibreOffice Writer dan disimpan sebagai ODT meskipun keberhasilan pemformatan konversi sangat tergantung pada bagaimana PDF dibuat.

http://ubuntuone.com/6xI1afyu6QdQvgdCGn0kym


3
2018-01-11 20:36



Terima kasih atas skrip yang bermanfaat ini. Hanya komentar kecil (dari man pdftohtml): -noframes : generate no frames. Not supported in complex output mode. Begitu -noframes tidak akan memiliki efek apa pun -c set. - Glutanimate
Terima kasih, saya telah menghapus opsi yang berlebihan ini dari skrip saya sekarang. Skrip bash bertenaga zenity untuk menyediakan gui karena semua opsi ini akan sangat bagus sepertinya ;-) - Sadi
#MHC, sepertinya info ini salah; jika kami tidak menyertakan -noframes kami mendapatkan file html terpisah untuk halaman pdf; jadi saya memasukkannya lagi ke naskah saya. - Sadi
Itu aneh. Pasti ada kesalahan dalam dokumentasi itu. Saya akan mengubah salinan naskah saya sesuai. Terimakasih atas peringatannya! - Glutanimate


Coba Kaliber. Ini mengkonversi ke html dan kemudian ke format lain. Itu melakukan pekerjaan yang cukup bagus pada file besar (183 halaman) yang seharusnya saya cetak.

Dalam kasus saya, saya mengubahnya menjadi sebuah epub, tetapi untuk bersenang-senang hanya mengubahnya menjadi .docx yang ternyata sangat baik.


1
2017-10-21 17:51