Paket htmllaundry berisi beberapa metode Python berguna untuk pembersihan HTML markup atau melakukan perubahan umum lainnya & nbsp;. Pembersihan ini cukup ketat untuk dapat membersihkan HTML disisipkan dari MS Word atau Apple Pages. Paket ini juga berisi kode integrasi untuk z3c.form untuk menyediakan bidang yang secara otomatis membersihkan HTML di simpan.
Pelaksanaan ini didasarkan pada kelas Cleaner dari lxml.
Cleanup rutinitas
Semua rutinitas pembersihan dapat dipanggil melalui fungsi sanitasi tunggal. Fungsi ini mengambil input string sebagai masukan dan akan kembali dibersihkan versi string. Berikut ini adalah contoh sederhana:
>>> Dari htmllaundry impor sanitasi
>>> Sanitasi ('Hello, dunia ')
'
Halo, dunia
'Metode sanitasi mengambil parameter tambahan opsional dengan lxml contoh Cleaner, yang dapat digunakan untuk menggunakan aturan penyaringan yang berbeda. htmllaundry mencakup tiga pembersih:
& Nbsp; * htmllaundry.cleaners.DocumentCleaner, yang merupakan default bersih. Bersih ini akan memungkinkan tag yang paling aman, sementara pengupasan keluar gaya inline dan markup tidak aman.
& Nbsp; * htmllaundry.cleaners.LineCleaner adalah bersih yang lebih ketat yang hanya memungkinkan elemen inline beberapa. Hal ini berguna di tempat-tempat di mana Anda hanya ingin menerima masukan single-line, misalnya dalam judul dokumen.
& Nbsp; * htmllaundry.cleaners.CommentCleaner hanya memungkinkan satu set yang sangat terbatas elemen HTML, dan dirancang untuk menjadi berguna bagi pengguna yang disediakan komentar.
Jika Anda ingin pergi semua jalan Anda juga dapat menggunakan StripMarkup untuk melucuti semua markup dari input Anda:
>>> Dari htmllaundry impor StripMarkup
>>> StripMarkup ('Hello, dunia ')
'Halo Dunia'
z3c.form integrasi
Jika Anda ingin menggunakan integrasi z3c.form Anda harus menggunakan ekstra z3cform untuk paket ini:
install_requires = [
& Nbsp; ....
& Nbsp; htmllaundry [z3cform]
& Nbsp; ...
& Nbsp;],
Selain itu Anda akan perlu memuat ZCML. Dalam configure.zcml Anda menambahkan baris seperti ini:
Anda kemudian dapat menggunakan HtmlText jenis lapangan di skema Anda. Sebagai contoh:
dari zope.interface impor Antarmuka
dari zope impor skema
dari htmllaundry.z3cform impor HtmlText
kelas iDocument (Interface):
& Nbsp; title = schema.TextLine (
& Nbsp; title = _ (u "Judul"),
& Nbsp; diperlukan = True)
& Nbsp; description = HtmlText (
& Nbsp; title = _ (u "Keterangan"),
& Nbsp; diperlukan = True)
Harap dicatat bahwa menggunakan HtmlText tidak akan secara otomatis memberikan widget WYSYWIG
Apa yang baru dalam rilis ini:.
- Tambahkan opsi untuk membersihkan untuk menentukan elemen bungkus yang berbeda atau melewatkan membungkus sepenuhnya.
Apa yang baru di versi 1.9:
- Tambahkan MANIFEST.in untuk memfasilitasi rilis tidak terbuat dari subversi.
- Perbaiki semua pembersih untuk strip javascript. Ini perbaikan masalah 1.
Apa yang baru di versi 1.8:
- Hapus link penegakan Target dari kode jalan hardcoded dari sanitasi. Hal ini memungkinkan untuk menggunakan opsi link_target bersih baru.
Apa yang baru di versi 1.7:
- Membuat memaksa target atribut pada eksternal Linke dikonfigurasi melalui baru Pilihan link_target di binatu. Hanya mengaktifkan opsi ini untuk CommentCleaner.
Apa yang baru di versi 1.6:.
- tes spasi benar untuk membungkus teks telanjang serta
Apa yang baru di versi 1.4:.
- Kecil kode pembersihan
- istirahat terkemuka Jalur .
Apa yang baru di versi 1.3:
- Jalur semua elemen-elemen tingkat br atas. Istirahat yang baik dalam elemen blocklevel, tetapi tidak boleh digunakan untuk menambah jarak vertikal antara unsur-unsur blok.
Apa yang baru di versi 1.2:.
- Perbaiki kesalahan ketik dalam dokumentasi
- Jalur tertinggal istirahat .
Persyaratan :
- Python
Komentar tidak ditemukan