Jericho HTML Parser

Software screenshot:
Jericho HTML Parser
Rincian Software:
Versi: 3.3
Tanggal Upload: 20 Feb 15
Pengembang: Martin Jericho
Lisensi: Gratis
Popularitas: 3

Rating: nan/5 (Total Votes: 0)

Jerich HTML Parser merupakan open source, sederhana, namun perpustakaan kuat seluruhnya ditulis di Jawa.
Hal ini memungkinkan programmer untuk memanipulasi dan menganalisis bagian dari dokumen HTML.
Jerich HTML Parser juga menggabungkan tingkat tinggi fungsi bentuk HTML manipulasi

Apa yang baru dalam rilis ini:.

  • Perbaikan Bug:
  • [3581664] CharacterReference.decode () tidak decode entitas yang berisi angka - & frac12; & Frac14; & Frac34; & SUP1; & Sup2; & Sup3; & There4;
  • [3311286] SourceCompactor tidak menghormati TEXTAREA
  • [3519131] Renderer keluaran yang salah ketika dibangun dengan objek Elemen.
  • [3538829] keluaran Renderer dekorasi font pada batas blok
  • salah.
  • Segment.getAllStartTags (nama) dan Segment.getFirstElement (nama) tidak bekerja jika argumen berisi karakter huruf.
  • Akhir pembatas dari tag server umum di dalam sebuah tag server yang lolos adalah palsu diakui sebagai pembatas akhir tag melarikan diri.
  • PERUBAHAN YANG DAPAT MEMPENGARUHI PERILAKU program yang ada:
  • [3427073] Segment.getStyleURISegments () sekarang termasuk gaya konten elemen serta nilai-nilai gaya atribut.
  • [3427927] Segment.getURIAttributes () sekarang termasuk atribut arsip elemen objek dan applet.
  • Komentar tidak lagi diakui di dalam elemen skrip selama mengurai sekuensial penuh. Sebelumnya mereka diakui untuk kompatibilitas dengan browser utama, tetapi perilaku browser modern telah berubah.
  • Berubah tingkat log dari semua kesalahan parsing dari INFO ke ERROR, dan tingkat log dari Source.fullSequentialParse () pesan penasehat dari WARN ke INFO. Tingkat sebelumnya memberi pesan penasehat keparahan lebih tinggi dari kesalahan parsing, mencegah sistem logging dari menyembunyikan pesan penasehat sambil menunjukkan kesalahan parsing. Peringatan pengkodean karakter tetap tidak berubah pada tingkat WARN.
  • Mengubah perilaku metode Renderer.renderHyperlinkURL (StartTag) sehingga URL relatif tidak diberikan.
  • Berubah perilaku Renderer sehingga kandungan unsur hyperlink tidak diberikan jika itu adalah sama dengan URL hyperlink, mengabaikan http setiap:. // Awalan atau / akhiran
  • EndTag.tidy () sekarang menghapus spasi sebelum kurung tutup.
  • Ditambahkan Sumber (File) konstruktor.
  • metode Ditambahkan OutputDocument.getSegment ()
  • .
  • Ditambahkan OutputDocument.remove (int mulai, int end) metode.
  • metode Ditambahkan Renderer.setHRLineLength ()
  • .
  • Ditambahkan RenderToText.jsp sampel webapp
  • .
  • metode Ditambahkan Segment.getRowColumnVector ()
  • .
  • deteksi Encoding sekarang mengabaikan pengkodean umum ditentukan dalam meta tag yang memiliki ukuran kode unit sesuai dengan encoding awal.
  • Upgrade ke API logger berikut: slf4j-api-1.7.2, log4j-1.2.17

Apa yang baru di versi 3.1:

  • Perbaikan Bug:
  • [2793556] lingkaran tak terbatas pada Segment.getAllStartTags ()
  • lingkaran tak terbatas pada Segment.getAllElements ()
  • Segment.getFirst * metode kembali segmen luar segmen melompat-lompat.

  • Metode
  • Segment.getAllElements tidak mengembalikan semua elemen tertutup dalam beberapa keadaan.
  • kesalahan dokumentasi tetap dalam metode Segment.getAllElements
  • .
  • kelas Ditambahkan StreamedSource
  • .
  • PERUBAHAN YANG DAPAT MEMPENGARUHI PERILAKU program yang ada:
  • Berubah ParseText dari kelas antarmuka.
  • Segment.getNodeIterator () sekarang kembali karakter referensi sebagai node yang terpisah.
  • metode pencarian Ditambahkan tag berdasarkan nilai atribut ekspresi reguler.
  • metode pencarian Ditambahkan tag berdasarkan kelas HTML atribut.
  • Ditambahkan statis properti Source.LegacyNodeIteratorCompatabilityMode sementara untuk mengembalikan Segment.getNodeIterator () fungsi dengan versi sebelumnya.
  • Dihapus [char] metode pencarian berbasis di ParseText.
  • Ditambahkan CharacterReference.appendCharTo (Appendable) metode.
  • Ditambahkan OutputDocument (Segmen) konstruktor.
  • contoh program Ditambahkan StreamedSourceCopy.

Apa yang baru di versi 3.0:

  • Perbaikan Bug:
  • referensi Karakter mewakili karakter tambahan unicode tidak diterjemahkan dengan benar ke unit UTF-16 kode pasang.
  • [2188446] Element.getDepth () dan Element.getParentElement () kembali hasil yang salah jika disebut di parse pada mode demand.
  • Komentar sekarang diakui dalam & lt; Script & gt; elemen.

  • PERUBAHAN
  • API YANG TIDAK SESUAI BACKWARD:
  • nama paket Berubah untuk net.htmlparser.jericho
  • Nilai Atribut harus sekarang menjadi String bukan CharSequence.
  • semua metode usang Dihapus / kelas dari versi sebelumnya.
  • Semua menemukan metode * usang dalam mendukung mendapatkan * metode untuk menerapkan konvensi penamaan yang konsisten di semua metode tag pencarian.
  • Tag, Element dan HTMLElements kelas tidak lagi menerapkan antarmuka HTMLElementName. (Menggunakan impor statis bukan)
  • Semua koleksi sekarang stongly diketik menggunakan obat generik.
  • Berubah kelas FormControlOutputStyle ke enum.
  • Berubah FormControlType kelas untuk enum.
  • Ditambahkan CharStreamSource.appendTo (Appendable) metode.
  • metode Ditambahkan Source.iterator ()
  • .
  • Sumber kini menerapkan Iterable.
  • internal menggunakan StringBuilder untuk kinerja yang lebih baik.
  • Ditambahkan Source.getNextStartTag (StartTagType) metode.
  • Ditambahkan Source.getNextEndTag (EndTagType) metode.
  • Ditambahkan Source.getPreviousStartTag (StartTagType) metode.
  • Ditambahkan Source.getPreviousEndTag (EndTagType) metode.
  • Ditambahkan Segment.getAllStartTags (StartTagType) metode.
  • Ditambahkan semua Segment.getFirst * metode.
  • Ditambahkan Renderer.renderHyperlinkURL (StartTag) metode.
  • contoh program Ditambahkan HTMLSanitiser.
  • Upgrade ke SLF4J-api-1.5.6

Persyaratan :

  • 2 Runtime Environment Standard Edition Jawa

Software yang serupa

Beautiful Soup
Beautiful Soup

14 Apr 15

Rubber
Rubber

3 Jun 15

YaHP Converter
YaHP Converter

15 Apr 15

eLML
eLML

14 Apr 15

Perangkat lunak lain dari pengembang Martin Jericho

Komentar untuk Jericho HTML Parser

Komentar tidak ditemukan
Tambahkan komentar
Aktifkan gambar!