Banyak aplikasi yang berhubungan dengan data terstruktur memerlukan akses ke konten teks dokumen diformat atau ditandai-up. Organisasi yang mengarsipkan dokumen sering membutuhkan akses ke konten tekstual untuk membuat dokumen dicari dan memungkinkan agregasi konten, pelaporan dan pertambangan dari arsip dokumen. Cari dan aplikasi pengambilan juga perlu untuk mengambil dan tokenize teks dari berbagai format file.
Salah satu mekanisme standar untuk mengakses dan mengekstrak teks dari dokumen yang disediakan oleh IFilter plug-in interface yang digunakan dalam mesin pencari Microsoft. Ada sebuah implementasi IFilter beberapa yang dikembangkan oleh Microsoft dan vendor lainnya yang mencakup berbagai format file. Standar atau keandalan dan teks ekstraksi kualitas bervariasi di beberapa pengembang IFilter.
Opait Teks Filter adalah sebuah program utilitas kecil dengan antarmuka yang sederhana untuk iFilters yang sudah diinstal pada komputer host serta filter ekstraksi teks kustom beberapa yang bekerja secara langsung dengan format file dan memperbaiki implementasi IFilter default.
. Antarmuka untuk mengambil teks disediakan oleh perpustakaan kelas kecil yang disebut Opait.Filters yang disertakan dan dapat digunakan untuk mengintegrasikan filter teks ke dalam aplikasi .NET
Persyaratan :
.NET Framework 4.5
Komentar tidak ditemukan