Arch merupakan perpanjangan open source dari Apache Nutch (populer, sangat scalable tujuan umum mesin pencari) untuk pencarian intranet. Tidak senang dengan mesin pencari perusahaan Anda? Tidak mengherankan, sangat sedikit orang yang. Untuk yang terbaik dari pengetahuan kita, tidak ada mesin intranet yang bekerja serta pencarian Web global Google tidak. Ada alasan mendasar untuk ini: algoritma yang digunakan oleh Google pada Web global (atau serupa) tidak bekerja hampir sama juga pada intranet karena kurangnya data statistik. Arch (akhirnya!) Memecahkan masalah ini. Menggunakan metode baru untuk memberikan presisi hasil pencarian tinggi yang bekerja bagus. Jangan percaya? alat evaluasi uji buta disertakan. Anda dapat menyebarkan Arch dan membandingkan kinerja untuk mesin Anda saat ini pencarian dan / atau Google (pada bagian umum dari situs Anda) menggunakan metodologi tes buta.
Selain kualitas pencarian yang sangat baik, Arch memiliki banyak fitur penting untuk lingkungan perusahaan:
- Tingkat keamanan Dokumen. Pengguna dapat menemukan hanya dokumen yang mereka berwenang untuk melihat.
- Update index Murah. Arch mampu menjaga indeks up to date dan menghindari rutin situs lengkap Perayapan ulang.
- 24/7 availabilty. Selalu ada indeks kerja yang tersedia, bahkan jika merangkak gagal.- Dukungan untuk pengindeksan simultan dan mencari beberapa situs web, dengan kemampuan untuk mencari dan mengelola situs apapun secara terpisah, jika diperlukan. Dinamis menambahkan dan penghapusan situs web mudah.
- Sebuah direktori situs secara otomatis.
- Dukungan biaya rendah sekali dikerahkan.
- Ganda antarmuka (PHP dan Java) untuk penyebaran yang mudah dan kustomisasi.
- Faceted mencari "di luar kotak".
- Sebuah set yang luas dan extensible parser untuk parsing berbagai format file: HTML, PHP, PDF, MS Office, Open Office, dll
- Sebuah modular, arsitektur berbasis plugin yang dapat dengan mudah disesuaikan dan diperpanjang.
- Kode sumber disertakan.
- Kinerja tinggi dan skalabilitas. Arch dapat berjalan di cluster komputer untuk indeks set data yang sangat besar
Apa yang baru dalam rilis ini:.
Versi 1.9.2: perbaikan parsing dokumen, porting pada Nutch 1,9 .
Apa yang baru di versi 1.7:.
Ditambahkan keamanan pemindaian, porting dari Nutch 1,7
Persyaratan :
Java 1.7, Cygwin
Komentar tidak ditemukan