PDFTextStream

Software screenshot:
PDFTextStream
Rincian Software:
Versi: 2.6.0
Tanggal Upload: 20 Feb 15
Lisensi: Shareware
Harga: 1900.00 $
Popularitas: 2

Rating: nan/5 (Total Votes: 0)

Proyek PDFTextStream adalah perpustakaan ekstraksi PDF teks dan metadata yang tersedia untuk Java, Python, dan NET.
Mendukung semua versi dari spesifikasi dokumen PDF, (termasuk v1.6, yang digunakan oleh Acrobat 7), ekstraksi teks dikodekan menggunakan karakter double-byte set (termasuk Cina, Jepang, dan Korea), dekripsi dari 40-bit dan 128 bit dienkripsi dokumen, dan ekstraksi semua metadata dokumen yang disediakan oleh dokumen PDF (termasuk data formulir, bookmark, dan penjelasan).
Integrasi yang mudah dengan Jakarta Lucene disertakan

Apa yang baru dalam rilis ini:.

  • Versi ini mencakup berbagai perbaikan dilakukan untuk memastikan PDFTextStream mampu mengekstrak teks dari dokumen PDF yang tidak sesuai dengan spesifikasi PDF.
  • Ini juga mencakup berbagai peningkatan kinerja.

Apa yang baru dalam versi 2.3.0:

  • Ditambahkan .isStruckThrough () metode untuk com.
  • snowtide.pdf.TextUnit, menunjukkan apakah karakter memiliki dicoret ditarik melalui itu.
  • Peningkatan dukungan PDFTextStream untuk pemetaan karakter tertanam.
  • Perhitungan spasi antara kata-kata telah diperbaiki untuk benar memperhitungkan spasi yang secara eksplisit dikodekan dalam dokumen sumber PDF.
  • Peningkatan penanganan PDFTextStream tentang pengkodean konten komposit, yang sebelumnya bisa gagal menghasilkan beberapa rentang konten PDF yang 'diabaikan' selama ekstraksi.
  • Fixed bug di mana VisualOutputTarget teks dari satu baris akan dibagi atas beberapa baris
  • Peningkatan jajaran vertikal teks diekstraksi menggunakan VisualOutputTarget
  • Improved ekstrak VisualOutputTarget diproduksi untuk menghilangkan spasi tambahan palsu antara kata-erat berdekatan

Apa yang baru dalam versi 2.2.5:

  • Rilis ini menambahkan dukungan untuk mengekstraksi XFA Data sebagai bentuk XML.
  • Ini secara signifikan meningkatkan kinerja ekstraksi teks menggunakan VisualOutputTarget. Dukungan untuk dokumen PDF lebih besar dari 2GB.
  • Sebuah memperbaiki bug dimana pengkodean dari tertanam Type1 font yang sebelumnya tidak diterapkan dengan baik dalam beberapa keadaan.
  • Sebuah memperbaiki masalah di mana konten baru dalam dokumen PDF diperbarui kadang-kadang diabaikan.
  • Sebuah memperbaiki masalah di mana penanda PDFDocEncoding-dikodekan dan metadata yang tidak diterjemahkan dengan baik.
  • A .getDestinationName () metode dalam com.snowtide.pdf.Bookmark.

Persyaratan :

  • Apache Lucene

Komentar untuk PDFTextStream

Komentar tidak ditemukan
Tambahkan komentar
Aktifkan gambar!