Pertanyaan Mendapatkan jumlah kata dari dokumen pdf di Evince


Apakah ada cara saya bisa mendapatkan jumlah kata dokumen PDF yang saya lihat di Evince, penampil pdf default Ubuntu? Saya dapat mengkonversi dokumen ke file teks dan mendapatkan jumlah kata dari terminal, tapi saya cukup ingin dapat dengan cepat mendapatkannya tanpa harus menggunakan terminal. Apakah ada plugin yang dapat melakukan ini, atau sudah ada di dalam dan saya hanya melewatkannya?

P.S. Saya lebih suka tidak mengubah penampil saya karena Evince adalah penampil PDF default di Ubuntu, dan saya cukup ingin melakukan sebanyak mungkin menggunakan aplikasi default karena banyak dari mereka, termasuk Evince, benar-benar bagus.


19
2017-11-08 19:11


asal




Jawaban:


Anda dapat melakukannya melalui baris perintah:

pdftotext filename.pdf - | tr -d '.' | wc -w

26
2017-11-08 19:22



Terima kasih, tetapi seperti yang saya katakan dalam pertanyaan, saya lebih suka tidak harus menggunakan baris perintah untuk hal semacam ini. - Chris Wilson
@Chris Cobalah untuk mengintegrasikan sistem ("<command above>") dalam kode evince. - Gödel


Tanggapan dari Olaf Leidinger pada milis Evince:

Saya pikir fitur seperti itu lebih cocok untuk editor dokumen, seperti yang mereka miliki informasi lebih lanjut tentang dokumen sebagai pemirsa biasa dan kata-kata penghitungannya adalah sepele. Ambil file PDF sebagai contoh. Apa yang Anda lihat sebagai teks mungkin sebenarnya sejenis bentuk grafik vektor. Bahkan jika teksnya terkandung seperti itu dalam file PDF, kata-kata yang Anda lihat mungkin terdiri dari beberapa "menggambar teks di posisi (y, x) "- perintah - mis. dalam kasus umlaut atau akhir baris. Jadi satu kata mungkin dihitung sebagai beberapa kata. Oleh karena itu saya pikir itu mungkin sulit diterapkan fitur seperti itu dengan andal. Silahkan lihat di pdftotext untuk melihat apa yang saya maksud.

10
2017-11-10 11:22



File apa pun yang digunakan untuk menentukan dokumen dapat dianggap "kode sumber", dan Evince adalah mesin yang mengeksekusi kode. Tidak adil (dan tidak mungkin) untuk meminta editor kode sumber (misalnya editor teks) untuk menentukan apa output dari eksekusi akan, jadi mari kita lihat output (yaitu gambar yang ditampilkan / teks di Evince / poppler). Implementasi di Evince akan berguna bagi saya karena saya "mengkodekan" dokumen saya dalam editor teks bahasa-agnostik dan menggunakan Evince (melalui Pandoc dan pdflatex) untuk "menjalankan" sumber saya. Hanya pada akhirnya kita bisa yakin apa yang berhasil. Pertimbangkan kode komentar. - user29020


Bagaimana dengan skrip bash cepat yang diperlukan zenity dan buktikan. Ketika dipanggil tanpa argumen, itu akan memberi Anda kotak dialog sehingga Anda dapat memilih file. Ketika dipanggil dengan argumen (atau setelah kata kotak dialog), itu akan membuka file dalam evince dan memberi Anda kotak dialog dengan jumlah kata.

Dengan kata lain, salin berikut ini ke dalam file teks, yang disebut evince-word-count.sh atau sesuatu, simpan di suatu tempat di jalan Anda (misalnya, ~/bin/), membuatnya dapat dieksekusi (baik melalui klik kanan dan properti Nautilus atau dengan chmod +x ~/bin/evince-word-count.sh),

#!/bin/bash
if [ "$#" -gt "0" ] ; then
    filename="$1"
else
    filename="$(zenity --file-selection)"
fi
evince "$filename" &
zenity --info --text "This PDF has $(pdftotext "$filename" - | tr -d '.' | wc -w) words"
exit 0

Sekarang, klik kanan pada beberapa pada beberapa PDF di nautilus, pilih "Buka dengan ..." dan kemudian buka dengan evince-word-count.sh. Sekarang, ketika Anda membuka PDF, itu akan terbuka di evince, dan memberi Anda jumlah kata.

alt text


9
2017-11-08 22:14



Anda bisa meletakkan file ini di /home/$USER/.local/share/nautilus/scripts/ yang membuatnya tersedia dari klik kanan di Nautilus (manilla file vanila Ubuntu). - Daniel Holm


Saya tidak percaya itu mungkin (baik secara teknis mungkin tetapi belum dilaksanakan).

Anda harus ingat Evince adalah dokumen penonton dan jumlah kata adalah fitur yang biasanya lebih dibutuhkan dalam editor (ya saya tahu ini tidak selalu benar).

Anda mungkin ingin hubungi pengembang Evince dan tanyakan apakah mereka tertarik untuk menerapkan fitur ini.


4
2017-11-08 19:16



Terima kasih. Saya sudah menghubungi mereka dan saya akan menjaga pertanyaan tetap terbuka sampai saya mendapatkan jawaban yang pasti. - Chris Wilson
Ketika Anda mendengar kembali, jangan ragu untuk menjawab pertanyaan Anda sendiri secara efektif :) - 8128
Evince tidak sepenuhnya "penampil". Membuat dan melihat dan mengedit dokumen jelas merupakan alur kerja yang lebih besar daripada hanya "edit" dan kemudian "lihat". Mengenai pertanyaan: Evince saat ini memungkinkan menyalin teks pilih. Itu bukan benar-benar peran "lihat". Evince berada dalam posisi yang bagus untuk mengetahui jumlah kata yang dihasilkan karena ini adalah "renderer" terakhir dari apa yang sebenarnya kita baca (atau kirim ke penerbit). Ini sudah memiliki cara untuk mengidentifikasi seluruh kata yang diberikan (coba klik ganda kata!). Saya ingin Evince menyediakan ini di kotak "File-> Properties". Sudah memberitahu saya jumlah halaman (berdasarkan rendering). - user29020