LanguageTool

Software screenshot:
LanguageTool
Rincian Software:
Versi: 2.9 Diperbarui
Tanggal Upload: 14 Apr 15
Pengembang: Daniel Naber
Lisensi: Gratis
Popularitas: 18

Rating: nan/5 (Total Votes: 0)

LanguageTool adalah sebuah program sumber terbuka proofreading dirancang untuk menemukan kesalahan bahwa alat spell checker biasa tidak bisa mendeteksi. Ini adalah gaya dan tata bahasa checker yang akan menemukan kesalahan yang aturan didefinisikan dalam file konfigurasi XML, seperti mencampur & ldquo berbasis aturan; mereka & rdquo; dengan & ldquo;. & rdquo ada;


Mendeteksi berbagai masalah tata bahasa

Program ini juga dapat mendeteksi berbagai masalah tata bahasa dan dilengkapi dengan dukungan untuk lebih dari 20 bahasa, termasuk Inggris, Jerman, Polandia, Perancis, Spanyol, Swedia, Yunani, Cina, Denmark, Jepang, Islandia, Portugis dan Brasil Portugis.
Selain itu, ia menawarkan antarmuka pengguna grafis yang mudah digunakan, sederhana dan mudah yang memungkinkan orang untuk menyisipkan teks yang perlu mantra diperiksa. Hal ini dapat memeriksa teks dalam clipboard, tag teks, cut / copy / paste teks, dan berada di daerah system tray.


Mendeteksi berbagai masalah

Dari dialog Options, Anda dapat mengaktifkan jenis masalah aplikasi dapat mendeteksi, termasuk gaya yang buruk, kesalahan tata bahasa, bahasa gaul, kesalahan tanda baca, mungkin kesalahan ketik, frase berlebihan, biasanya kata-kata bingung, kolokasi, kapitalisasi, semantik, juga yang sebagai frase non-standar.


LanguageTool untuk LibreOffice dan OpenOffice

Selain menjadi aplikasi mandiri, LanguageTool juga tersedia sebagai ekstensi untuk dua suite kantor open source yang paling populer dan kuat, LibreOffice dan Apache OpenOffice.org, yang memungkinkan pengguna untuk mengoreksi teks-teks mereka dengan mengklik kanan pada frasa yang dipilih atau paragraf.


LanguageTool untuk Mozilla Firefox

Selain itu, aplikasi ini juga tersedia untuk di-download sebagai add-on untuk dunia & rsquo; s paling populer open-source browser web di dunia, Mozilla Firefox. Hal ini tidak memerlukan restart dan menempatkan tombol kecil pada toolbar utama, yang memungkinkan Anda untuk mengoreksi teks yang disorot dari website atau bentuk.


Di bawah kap mesin dan ketersediaan

Aplikasi ini seluruhnya ditulis dalam bahasa pemrograman Java, yang berarti bahwa itu & rsquo; s software cross-platform, dirancang untuk bekerja dengan distribusi GNU / Linux, serta BSD, Solaris, Microsoft Windows dan Mac OS X operasi sistem, di mana Java Runtime Environment diinstal.

Apa yang baru dalam rilis ini:

  • Catalan:
  • POS diperbarui tag kamus
  • menambahkan aturan baru
  • tetap alarm palsu
  • English:
  • Ditambahkan beberapa aturan dan tetap beberapa alarm palsu
  • Ditambahkan banyak aturan gaya baru disumbangkan oleh Heikki Lehvaslaiho. Karena ini dapat menyebabkan alarm palsu, mereka tidak diaktifkan secara default. Anda dapat mengaktifkan mereka dengan menyalakan semua aturan dalam kategori baru 'Plain English'.
  • Esperanto:
  • menambahkan aturan baru beberapa
  • Perancis
  • POS diperbarui tag kamus dan Hunspell kamus Dicollecte-5.3
  • Jerman:
  • menambahkan aturan baru sedikit dan tetap alarm palsu
  • Ditambahkan aturan baru yang memeriksa perjanjian kerja subjek. Untuk saat ini, hanya kasus dengan 'ist', 'sind', 'perang', dan 'Waren' didukung. Misalnya untuk kesalahan yang terdeteksi: '. Der Hund sind Scha & para; n', 'Die Autos ist schnell.' Untuk membuat karya aturan ini, frasa sekarang bersatu dalam disambiguation.xml: misalnya, 'Mann' dalam kalimat 'ein Mann' hanya akan mempertahankan membaca nya nominatif (SUB: NOM: SIN: MAS), sedangkan yang digunakan untuk memiliki juga akusatif dan datif bacaan (SUB: AKK: SIN: MAS, SUB: DAT: SIN: MAS). (Https://github.com/languagetool-org/languagetool/issues/233)
  • Italia:
  • meningkat beberapa aturan
  • Polandia:
  • menambahkan beberapa aturan baru
  • Portugis:
  • menambahkan / perbaikan beberapa aturan
  • 3695 kata majemuk (pra-reformasi) - database gratis terbesar
  • Rusia:
  • tambah dan aturan ditingkatkan
  • Ukraina:
  • pembaruan kamus besar
  • aturan tata bahasa baru
  • sederhana baru menggantikan aturan untuk saran lunak
  • perbaikan disambiguator
  • penandaan senyawa dan ejaan perbaikan

  • Perbaikan
  • inisial tagging
  • kalimat dan kata perbaikan tokenizing
  • ditingkatkan penanganan stres simbol dan tanda hubung lunak
  • aturan Bitext:
  • menambahkan aturan sederhana untuk memeriksa apakah terjemahan berakhir dengan tanda baca yang sama seperti aslinya (ini hanya mencakup.?! Karakter).
  • sekarang mungkin untuk menambahkan file aturan bitext eksternal pada baris perintah, dengan menggunakan
  • option -bitextrule. Path file harus mutlak. Catatan:. Ini memungkinkan menggunakan aturan bitext juga untuk bahasa yang tidak memiliki aturan bitext disertakan secara default
  • Spelling:
  • File-file baru di /hunspell/spelling.txt dapat digunakan untuk menambahkan kata-kata diterima dengan pemeriksa ejaan yang juga dipertimbangkan ketika membuat saran untuk kata-kata yang salah eja. Hal ini mirip dengan file /hunspell/ignore.txt, yang daftar menerima kata-kata yang tidak * * digunakan saat membuat saran untuk kata-kata yang salah eja.
  • API:
  • JLanguageTool.activateDefaultPatternRules () dan JLanguageTool.activateDefaultFalseFriendRules () telah dihapus - semua aturan pola dan aturan teman palsu (jika bahasa kedua ditentukan) sekarang diaktifkan secara otomatis ketika konstruktor dari JLanguageTool disebut. Jika Anda membutuhkan checker tanpa aturan pola berbasis XML, memperpanjang bahasa kelas Anda (misalnya 'Inggris') dengan yang menimpa getPatternRules () metode dan mengembalikan sebuah daftar kosong di sana.
  • ManualTagger.lookup () telah digantikan oleh ManualTagger.tag () setelah ditinggalkan sejak rilis terbaru
  • Semua metode statis dan bidang dari kelas 'Bahasa' telah dipindahkan ke kelas baru 'Bahasa'. Untuk saat ini, metode / bidang di kelas Bahasa masih ada tetapi telah usang.
  • LanguageIdentifierTools telah dihapus. Gunakan LanguageIdentifier sebagai gantinya.
  • Dihapus (Default) ResourceDataBroker.setResourceDir () dan setRulesDir () karena ini dapat diatur dengan konstruktor
  • Dibersihkan up up kelas Kontributor, misalnya menghapus getRemark ()
  • Category.setDefaultOff () telah dihapus, ini dapat diatur melalui konstruktor sekarang
  • kelas Berganti nama: o.lt.rules.patterns.Element = & gt; o.lt.rules.patterns.PatternToken o.lt.rules.patterns.ElementMatcher = & gt; o.lt.rules.patterns.PatternTokenMatcher
  • pembersihan API kecil lainnya yang seharusnya tidak mempengaruhi kasus penggunaan umum, misalnya IncorrectExample.getCorrections () kembali dan daftar unmodifiable sekarang, penghapusan metode usang.
  • Server Tertanam:
  • XML melarikan diri telah diperbaiki, ini bisa menyebabkan dokumen XML tidak valid dikembalikan
  • option file konfigurasi baru 'maxWorkQueueSize' yang memungkinkan Anda mengatur ukuran maksimum antrian permintaan - jika mendapat lebih besar dari ini, permintaan akan ditolak (503 Layanan tidak tersedia)
  • Server sekarang merespon dengan lebih spesifik kode status HTTP dengan kondisi kesalahan: 413 Permintaan Entity Too Large - jika teks melebihi ukuran teks maksimal 503 Service Unavailable - jika cek melebihi waktu check maksimum
  • GUI:
  • GUI berdiri sendiri sekarang dapat mengambil file teks biasa sebagai argumen, file ini kemudian akan dimuat pada startup (Github masalah # 232).
  • Command-line:
  • Sekarang mungkin untuk menambahkan file aturan eksternal saat memanggil LanguageTool dari baris perintah. Gunakan --rulefile untuk menambahkan file. Jika nama file memiliki format yang berisi nama bahasa, akan digunakan bersama aturan lain; jika tidak, itu akan menggantikan aturan. Anda juga dapat memuat file eksternal dengan teman-teman palsu dengan menggunakan --falsefriends pilihan. Nama file harus menjadi path file absolut, dan file teman palsu selalu ditambahkan ke orang-orang yang dimuat untuk bahasa. (Github masalah # 192)
  • sintaks Rule:
  • Sebuah aturan sekarang mungkin memiliki contoh kalimat asalkan memiliki 'koreksi' atribut - ini dapat menghemat redundansi jika satu-satunya kalimat yang benar adalah sama seperti kalimat yang salah dengan koreksi diterapkan. Sebelum, aturan diperlukan setidaknya dua contoh kalimat.
  • 'contoh' elemen: type = "tidak benar" sekarang opsional jika ada 'koreksi' atribut. The 'koreksi' atribut menyiratkan bahwa kalimat tersebut tidak benar.
  • 'contoh' elemen: type = "benar" sekarang opsional. Tidak ada atribut 'jenis' dan tidak ada 'koreksi' atribut menyiratkan bahwa kalimat tersebut benar.
  • internal:
  • Kami telah beralih dari Apache Tika bahasa-detektor (https://github.com/optimaize/language-detector) untuk secara otomatis mengidentifikasi bahasa teks. Ini harus lebih cepat dan hasilnya harus lebih dapat diandalkan. Deteksi Asturian dan Galicia harus dinonaktifkan karena kualitas pendeteksian terlalu rendah dan juga mempengaruhi deteksi Spanyol.
  • Fixed regresi yang membuat mustahil untuk memuat file aturan eksternal di GUI.

Apa yang baru di versi 2.8:

  • Asturian:
  • dihapus ketergantungan pada Hunspell, sekarang menggunakan Morfologik untuk pemeriksaan ejaan
  • Breton:
  • ditambahkan dan diperbaiki beberapa aturan
  • Catalan:
  • diperbarui kamus
  • tambah dan aturan ditingkatkan
  • tetap alarm palsu
  • Belanda:
  • tambah dan meningkatkan banyak aturan
  • English:
  • beberapa aturan baru (berkat Nick Hough)
  • diperbarui tagger dan synthesizer kamus, memperbaiki masalah # 202
  • filter baru yang akan digunakan untuk mencocokkan partofspeech bagian dari kata-kata, misalnya:. Di * ini hanya akan membuat pertandingan untuk kata-kata yang dimulai dengan 'dalam' dan mana bagian setelah 'dalam' adalah kata sifat (tag POS 'JJ'). The 'no: 1' adalah posisi tanda, yaitu sini pertama (dan hanya) cocok disebut
  • .
  • Perancis:
  • ditambahkan dan diperbaiki beberapa aturan
  • Jerman:
  • ditambahkan dan diperbaiki beberapa aturan
  • Polandia:
  • tambah dan meningkatkan beberapa aturan
  • tambah dan ditingkatkan teman palsu dengan bahasa Inggris
  • Portugis:
  • menambahkan / perbaikan beberapa aturan
  • Spanyol:
  • dihapus ketergantungan pada Hunspell, sekarang menggunakan Morfologik untuk pemeriksaan ejaan
  • Reformat file aturan
  • Ditambahkan lebih aturan
  • Tagalog:
  • dihapus ketergantungan pada Hunspell, sekarang menggunakan Morfologik untuk pemeriksaan ejaan
  • karakter dasbor ("") adalah pembatas sekarang ketika tokenizing teks
  • Rusia:
  • tambah dan aturan ditingkatkan
  • menambahkan beberapa aturan teman palsu (Rusia / Inggris)
  • Ukraina:
  • banyak aturan baru (termasuk perjanjian dengan kata benda, ekspresi waktu dll)
  • peningkatan cakupan aturan
  • pembaruan kamus (perbaikan besar untuk kata benda dan kasus vokatif)
  • tag baru dan memerintah untuk memperingatkan tentang ejaan alternatif
  • menambahkan informasi frekuensi kata untuk meningkatkan saran ejaan
  • beberapa aturan disambiguator baru
  • Peraturan Sintaks:
  • ... sekarang dapat ditambahkan ke rulegroup untuk mempengaruhi semua aturan kelompok yang
  • Jika Anda mengembangkan aturan sendiri yang bukan merupakan bagian dari LT Anda sekarang dapat menambahkan eksternal = "yes" untuk kategori Anda untuk mencegah link aturan untuk community.languagetool.org muncul di mandiri GUI kami (link tidak akan bekerja aturan yang bukan merupakan bagian dari distribusi utama LT). (Github masalah # 223)
  • Jika sekelompok aturan menentukan default = "off", aturan dalam kelompok aturan tidak mungkin juga menentukan default = "on" / "off".
  • API:
  • kelas Dihapus dan metode yang telah usang sejak 2,7 atau lebih
  • Server Tertanam:
  • Pilihan file konfigurasi 'requestLimit' dan 'requestLimitPeriodInSeconds' sekarang juga dapat digunakan untuk server HTTP (bukan hanya untuk server HTTPS)
  • New pilihan file config 'trustXForwardForHeader': set ini untuk 'benar' jika Anda menjalankan server di belakang reverse proxy dan ingin batas permintaan untuk bekerja pada alamat IP asli yang disediakan oleh 'Xforwardedfor' HTTP header, biasanya ditetapkan oleh proxy. Jika Anda berjalan di belakang proxy tapi tidak mengatur properti ini ke true, satu pengguna dapat menggunakan semua permintaan sehingga pengguna lain juga akan mendapatkan pesan error karena batas permintaan.
  • respon Fix dari Setelah modus Batas waktu: ... kadang-kadang kosong, membingungkan cek teks dalam WordPress
  • aturan Bitext tidak dinonaktifkan dengan benar, bahkan jika mereka ditentukan dengan parameter yang tepat untuk server; sekarang itu tetap
  • Tetap masalah dengan posisi yang tidak tepat untuk beberapa aturan bitext (edisi # 218)
  • GUI:
  • Pengaturan 'errorColors' baru telah ditambahkan ke file konfigurasi languagetool.cfg. Hal ini dapat digunakan untuk mengatur warna latar belakang dari kesalahan. Misalnya, errorColors = ketik: # b8b8ff, gaya: # ffb8b8 akan menunjukkan 'tipografi' kesalahan dengan latar belakang biru dan 'gaya' kesalahan dengan latar belakang merah di bagian atas jendela LT. 'Tipografi' dan 'gaya' adalah jenis yang diatur dalam grammar.xml sebagai "type = ...". Tidak ada user interface belum mengkonfigurasi warna-warna ini. Catatan bahwa Anda hanya harus mengedit file languagetool.cfg ketika LT tidak berjalan.
  • internal:
  • Bugfix: aturan dalam kelompok aturan belum diaktifkan jika aturan sebelumnya dari rulegroup yang sama digunakan default = "off"
  • Kata-kata tidak diabaikan lagi oleh pemeriksa ejaan hanya karena mereka terjadi pada saran aturan itu. Jika Anda ingin pemeriksa ejaan untuk mengabaikan kata-kata global, menambahkannya ke Hunspell / ignore.txt. Untuk mengabaikan mereka tergantung pada konteks, menambahkan 'ignore_spelling' aturan untuk disambiguation.xml.
  • Sebuah file 'Hunspell / prohibit.txt' sekarang dapat digunakan untuk menandai kata-kata sebagai kesalahan ejaan bahkan jika spell checker biasanya akan menerima mereka. Hal ini berguna untuk meningkatkan LanguageTool spell checker tanpa menunggu checker hulu diperbarui. File 'prohibit.txt' adalah kebalikan dari 'ignore.txt', yang menyebabkan pemeriksa ejaan untuk mengabaikan kata-kata.
  • partofspeech tagger untuk kebanyakan bahasa sekarang dapat diperpanjang dengan menambahkan entri ke file org / languagetool / resource / XX / added.txt (XX menjadi kode bahasa). Formatnya adalah "fullform baseform postag", tiga kolom yang dipisahkan oleh tab. Hal ini membuat lebih mudah bagi pengguna (dan pengembang) untuk memperpanjang tagger POS, karena mereka tidak perlu ekspor, memodifikasi, dan menciptakan kamus biner untuk setiap perubahan.

Apa yang baru di versi 2.7:

  • Breton:
  • tambah dan aturan ditingkatkan
  • Aturan Baru yang memeriksa apakah hari kerja sesuai tanggal, misalnya mendeteksi "Gwener 28 a yaitu Eost 2014", sebagai tanggal yang tidak Jumat.
  • Catalan:
  • tambah dan aturan ditingkatkan
  • tetap alarm palsu
  • Belanda:
  • tambah dan meningkatkan banyak aturan
  • beralih ke Morfologik berbasis spell checker
  • -Inggris:
  • Apakah Anda ingin menjadi bagian dari tim yang mengembangkan alat proofreading Open Source yang paling kuat di dunia? Kami sedang mencari pengelola untuk aturan bahasa Inggris di LanguageTool. Lihat http://wiki.languagetool.org/tasks-for-language-maintainers untuk rincian.
  • Semua kamus bahasa Inggris telah diperpanjang mengandung kelas frekuensi kata untuk meningkatkan saran ejaan (data frekuensi diambil dari https://github.com/mozilla-b2g/gaia/tree/master/apps/keyboard/js / imes / latin / kamus, seperti untuk bahasa lain yang sudah menggunakan fitur ini).
  • saran yang lebih baik untuk pelajar bahasa Inggris: kata kerja tidak teratur, kata benda, kata sifat dan sekarang biasanya memiliki saran yang lebih baik. Misalnya, 'thinked' menunjukkan 'berpikir', 'anal' menunjukkan 'perempuan'.
  • salah eja Lebih memberikan saran sekarang, misalnya 'Garentee' (jaminan), 'berterima kasih' (bersyukur). Hal ini dapat menyebabkan penurunan kinerja ~ 10% (lebih untuk teks dengan banyak kata-kata yang tidak diketahui).
  • Aturan Baru yang memeriksa apakah hari kerja sesuai tanggal, misalnya mendeteksi "Senin, 7 Oktober, 2014", sebagai tanggal yang tidak hari Senin. Aturan ini hanya akan bekerja jika mendeteksi format tanggal yang digunakan. Sejauh ini, format ini didukung: * "Senin, 7 Oktober, 2014" * "Senin, 7 Oktober, 2014" * "Senin, 7 Oktober, 2014" * "Senin, 7 Oktober, 2014" (ini juga bekerja dengan minggu disingkat hari seperti Mo atau Mon Senin)
  • Esperanto:
  • Aturan Baru yang memeriksa apakah hari kerja sesuai tanggal, misalnya mendeteksi "Vendredon la 28-an de AAgusto 2014", sebagai tanggal yang tidak Jumat.
  • Perancis:
  • POS diperbarui tag kamus dan Hunspell kamus Dicollecte-5.2
  • menambahkan synthesizer - aturan perjanjian sekarang dapat membuat saran untuk beberapa kesalahan
  • menambahkan / perbaikan beberapa aturan
  • Aturan Baru yang memeriksa apakah hari kerja sesuai tanggal, misalnya mendeteksi "vendredi 28/08/2014", sebagai tanggal yang tidak Jumat.
  • Jerman:
  • Fixed NullPointerException langka dan ArrayIndexOutOfBoundsException
  • Tetap beberapa alarm palsu
  • Ditambahkan dan aturan ditingkatkan
  • aturan baru yang memeriksa kalimat tanpa kata kerja (dimatikan secara default karena risiko alarm palsu)
  • Aturan Baru yang memeriksa apakah hari kerja sesuai tanggal, misalnya mendeteksi "Dienstag, 2014/09/29", sebagai tanggal yang tidak hari Selasa.
  • perbaikan kinerja untuk saran spell check
  • Persia:
  • menambahkan dukungan awal untuk Persia (Farsi)
  • Polandia:
  • ditambahkan dan diperbaiki beberapa aturan
  • aturan baru yang memeriksa apakah hari kerja sesuai tanggal
  • Portugis:
  • menambahkan / perbaikan beberapa aturan
  • menambahkan banyak puluhan kata majemuk
  • Rusia:
  • menambahkan aturan baru
  • memperbaiki SourceForge permintaan fitur # 38 (memeriksa tanda kutip berbeda)
  • menambahkan beberapa aturan teman palsu (Rusia / Inggris)
  • aturan baru yang memeriksa apakah hari kerja sesuai tanggal, misalnya mendeteksi "ÐонеÐ'еÐ"NŒÐ½Ð¸Ðº, 30 N ?? & ETH; & mikro; & ETH; & frac12; N & sbquo; N ?? & ETH; & plusmn; N & euro; N ?? 2014 & ETH; & sup3 ;. ", sebagai tanggal yang tidak hari Senin
  • .
  • diperluas aturan senyawa Rusia dengan kata-kata baru dari postag kamus
  • Spanyol:
  • Ditambahkan kategori POS baru Z (untuk nomor dieja, misalnya 'uno', 'dos', ...)
  • nomor Terbilang sekarang dapat dideteksi dan dikelola baik dalam disambiguasi dan aturan.
  • Tetap beberapa lemmas salah dalam POS kamus.
  • Ditambahkan Hybrid chunker-disambiguator.
  • Tamil:
  • Ditambahkan dukungan awal untuk Tamil. Jika font untuk Tamil tidak ditampilkan dengan benar pada komputer Anda dan Anda menggunakan Windows, Anda mungkin perlu untuk menerapkan pekerjaan sekitar dijelaskan di sini: https://bugs.openjdk.java.net/browse/JDK-8008572
  • Ukraina:
  • update besar untuk POS kamus (perbaikan dan kata-kata baru)
  • beberapa tag POS berganti nama untuk konsistensi; tag baru untuk singkatan dan kata-kata yang jarang
  • banyak aturan baru dan perbaikan untuk aturan yang ada
  • aturan baru yang memeriksa apakah hari kerja sesuai tanggal, misalnya mendeteksi "& ETH; & ETH; & frac34; & ETH; & frac12; & ETH; & mikro; & ETH; 'N & ETH;" & ETH; & frac34; & ETH; & ordm ;, 7 & ETH; & para; & ETH; & frac34; & ETH; & sup2; 2014 ", sebagai tanggal yang tidak hari Senin
  • tanda peningkatan kinerja normalisasi
  • integrasi LibreOffice:
  • Jangan bingung dengan catatan kaki di LibreOffice 4.3 dan kemudian (sekarang memberikan kita dengan posisi catatan kaki sebagai meta data, sehingga kita dapat mengabaikan mereka).
  • API:
  • perbaikan kinerja utama untuk kasus penggunaan multi-thread, di mana JLanguageTool akan dibuat per benang, tetapi objek bahasa (misalnya 'Jerman') akan dibuat hanya sekali. Overhead untuk menciptakan JLanguageTool sekarang harus jauh lebih rendah.
  • Dihapus beberapa kelas dan metode yang telah ditinggalkan sejak versi 2.6
  • Dihapus DutchSpellerRule - menggunakan MorfologikDutchSpellerRule bukan
  • Tanda tangan dari Language.getRelevantRules () telah berubah
  • JLanguageTool dan MultiThreadedJLanguageTool konstruktor tidak menyatakan untuk membuang IOException lagi
  • WhitespaceRule telah diubah namanya menjadi MultipleWhitespaceRule (WhitespaceRule masih ada tapi sudah usang)
  • Usang beberapa metode yang visibilitas akan menurun (misalnya dari publik untuk dilindungi)
  • MorfologikSpellerRule.getRuleMatch (String, int) telah diubah namanya menjadi MorfologikSpellerRule.getRuleMatches (String, int)
  • RuleMatch konstruktor sekarang melempar pengecualian jika toPosition tidak lebih besar dari fromPosition
  • Memperkenalkan abstrak TextLevelRule kelas baru yang memanjang Peraturan dan yang dapat digunakan untuk aturan yang mencakup lebih dari kalimat tunggal.
  • Command line:
  • Mengaktifkan dan menonaktifkan aturan khusus pada saat yang sama sekarang diperbolehkan. Untuk menguji hanya beberapa aturan (menonaktifkan semua sisa), yang sebelumnya dilakukan dengan "LIST_OF_RULES enable", sekarang menggunakan "LIST_OF_RULES --enabledonly enable" (atau "-eo -e LIST_OF_RULES").
  • Server Tertanam:
  • Dua pilihan baru dapat diatur dalam properti file untuk membuat LanguageTool kembali format XML sama Setelah Batas waktu (ATD). Dengan cara ini dapat digunakan sebagai drop-in pengganti ATD: * modus - 'LanguageTool' atau 'AfterTheDeadline' * afterTheDeadlineLanguage - kode bahasa default jika modus diatur ke 'AfterTheDeadline' CATATAN: mode 'AfterTheDeadline' harus dipertimbangkan eksperimental untuk saat ini.
  • Pilihan baru 'maxCheckThreads' memungkinkan pengaturan jumlah maksimum benang bekerja pada permintaan secara paralel. Standarnya adalah 10, karena dulu.
  • Internal:
  • New abstrak aturan AbstractDateCheckFilter yang memungkinkan untuk memeriksa apakah seminggu hari dan tanggal pertandingan. Misalnya "Selasa, September 29, 2014" dapat dideteksi, seperti September 29, 2014 adalah tidak benar-benar hari Selasa. Ini menggunakan antarmuka RuleFilter eksperimental baru yang dapat dipanggil dari XML dengan baru 'filter' elemen. 'Filter' mengambil atribut ini: 'kelas': nama lengkap berkualitas kelas Java yang mengimplementasikan RuleFilter, misalnya "Org.languagetool.rules.de.DateCheckFilter" 'args': string seperti "Tahun: 1 bulan: 2 hari: 3 hari kerja: 4", yaitu daftar ruang yang dipisahkan dari kunci / nilai pasangan, di mana x akan diselesaikan untuk nilai pola token (seperti dalam 'pesan' elemen)
  • Aturan senyawa sekarang mengabaikan bukti yang telah diimunisasi di disambiguation.xml yang
  • "filter" tindakan dalam disambiguator kini diterapkan hanya untuk POS tag yang sesuai dengan tag POS diberikan. Jika mereka tidak cocok, aturan tersebut tidak diterapkan.
  • Jika Anda memperluas aturan XML seperti yang dijelaskan di http://wiki.languagetool.org/tips-and-tricks#toc2, aturan dan disambiguasi file eksternal sekarang dapat host pada server yang dilindungi sandi dengan menetapkan URL seperti ini: http: // pengguna: password@example.org/path/user-rules.xml
  • em dasbor ("a & euro;" ") sekarang menjadi karakter tokenizing untuk semua bahasa
  • Fitur baru:
  • Penggunaan model bahasa
  • LanguageTool sekarang dapat menggunakan data ngram. Data ngram adalah informasi tentang seberapa sering frase terjadi dalam suatu bahasa. Saat ini, ini menggunakan frase panjang 3.
  • Data ini digunakan oleh aturan bahasa Inggris untuk menemukan kesalahan homophone, seperti mencampur kasar / kursus atau bakat / flare. LanguageTool memiliki beberapa aturan semacam ini sebelumnya, tapi aturan baru sekarang mendukung sekitar 900 dari seperti kata pasang / set.
  • Data yang dibutuhkan untuk ini sangat besar (7GB untuk bahasa Inggris) dan dengan demikian tidak sebagian atau LanguageTool.
  • Data (bahasa Inggris hanya untuk saat ini) dan dokumentasi lebih tersedia di http://wiki.languagetool.org/finding-errors-using-big-data
  • Menggunakan ngrams membuat LanguageTool sedikit lebih lambat ketika data disimpan pada SSD.
  • Jika tidak disimpan pada SSD, kinerja mungkin drastis menurun.
  • Gunakan opsi --languagemodel baru dengan klien baris perintah untuk mengaktifkan aturan yang menggunakan data. Pilihan yang belum tersedia untuk GUI berdiri sendiri.

Apa yang baru di versi 2.4.1:

  • Diperbarui Morfologik perpustakaan untuk 1.8.3 untuk memperbaiki saran lambat di spell checker, yang mempengaruhi setidaknya en-US

Apa yang baru di versi 2.4:

  • Breton:
  • SRX kalimat tokenization
  • menambahkan / diperbaiki beberapa aturan
  • tetap beberapa alarm palsu
  • saran yang salah berkat tetap untuk tes ditambahkan pada koreksi
  • Catalan:
  • menambahkan / perbaikan beberapa aturan
  • tetap alarm palsu
  • membuat penambahan dan perbaikan untuk kamus tagger
  • dihapus beberapa kata dari kamus sintesis (lihat filterarchaic.txt)
  • menambahkan frekuensi data ke kamus tagger; wordlist frekuensi berasal dari proyek Gaia, dengan Apache License, versi 2.0 (https://github.com/mozillab2g/gaia/tree/master/keyboard/dictionaries).
  • English:
  • menambahkan / diperbaiki beberapa aturan
  • tetap beberapa alarm palsu
  • Perancis:
  • menambahkan / perbaikan beberapa aturan
  • tetap beberapa alarm palsu
  • Jerman:
  • menambahkan / perbaikan beberapa aturan
  • menambahkan synthesizer aturan perjanjian sekarang dapat membuat saran untuk beberapa kesalahan (tidak semua saran yang benar, meskipun)
  • Polandia:
  • menambahkan / perbaikan beberapa aturan, terutama untuk tanda hubung dan penggunaan dasbor
  • menambahkan informasi frekuensi untuk pemeriksaan ejaan kamus; wordlist frekuensi berasal dari proyek Gaia, dengan Apache License, versi 2.0 (https://github.com/mozillab2g/gaia/tree/master/keyboard/dictionaries).
  • tetap beberapa alarm palsu
  • Portugis:
  • menambahkan / perbaikan beberapa aturan (sekarang termasuk aturan jender "a" / "o")
  • sekarang memiliki 3400+ kata majemuk
  • file JAR telah diubah namanya menjadi languagetool.jar, dari sebelumnya languagetoolstandalone.jar untuk menghindari kebingungan tentang apa yang 'mandiri' berarti dalam konteks ini (github masalah # 29)
  • untuk bahasa dengan banyak aturan (seperti Perancis atau Jerman) kinerja pada teks panjang telah meningkat sekitar 2.030%
  • untuk memperbaiki threadsafety (bisa menyebabkan menggantung di MultiWordChunker)
  • tetap bug di mana penjelasan potongan tidak diuji dalam kelompok
  • fix: 1 dan belum dievaluasi dalam ...
  • tetap bug dalam mekanisme penyatuan yang dibuang beberapa interpretasi yang cocok prematur
  • menambahkan dukungan untuk penjelasan potongan di disambiguator, dan tetap satu bug di token penyaringan dengan penjelasan sepotong
  • diperbarui Morfologik perpustakaan untuk 1.8.2 (perbaikan bug, ketat masukan kewarasan memeriksa, menambahkan data frekuensi kamus)
  • menambahkan opsi termasuk data frekuensi taggging atau ejaan kamus. Format yang diharapkan dari daftar kata frekuensi adalah satu dalam proyek Gaia, dengan Apache License, versi 2.0 (https://github.com/mozillab2g/gaia/tree/master/keyboard/dictionaries)
  • baru alat baris perintah untuk ekspor dan menciptakan kamus biner:
  • org.languagetool.dev.DictionaryExporter
  • org.languagetool.dev.POSDictionaryBuilder
  • LibreOffice / OpenOffice integrasi:
  • menambahkan solusi untuk deteksi salah kalimat untuk kasus yang catatan kaki muncul setelah kalimat penuh berhenti (Sourceforge bug # 191)
  • mandiri GUI:
  • Dialog dibuka oleh "Lebih ..." item dalam menu konteks kesalahan sekarang akan juga menampilkan yang benar dan salah contoh kalimat
  • API:
  • SentenceTokenizer sekarang interface, implementasi telah dipindahkan ke RegexSentenceTokenizer, tapi ini sudah ditinggalkan dan SRXSentenceTokenizer harus digunakan sebagai pengganti
  • Beberapa metode dari org.languagetool.tools.StringTools telah dipindahkan ke kelas org.languagetool.gui.Tools dalam proyek languagetoolguicommons
  • LanguageToolListener.languageToolEventOccured () telah diubah namanya menjadi LanguageToolListener.languageToolEventOccurred ()
  • org.languagetool.tools.SymbolLocator tidak umum lagi (seharusnya tidak mempengaruhi siapa pun)
  • dihapus DanishSentenceTokenizer yang telah usang selama tiga tahun
  • Rule.getCorrectExamples () dan Rule.getIncorrectExamples () tidak kembali nol lagi tapi daftar kosong jika tidak ada contoh. Akibatnya, setCorrectExamples () dan setIncorrectExamples () tidak menerima nol lagi.
  • Rule.getId () dapat kembali string apapun sekarang, bukan hanya ASCIIonly string (sebenarnya ini telah terjadi sebelumnya, seperti pembatasan ASCIIonly tidak pernah dipaksakan dan hanya disebutkan dalam javadoc)
  • languagetoolwikipedia: opsi baris perintah untuk memeriksa dump Wikipedia telah disederhanakan. Perintah sekarang bisa disebut seperti ini: java jar languagetoolwikipedia.jar checkdata l en f enwiki20130621pagesarticles.xml Sebut saja "java jar languagetoolwikipedia.jar checkdata" untuk mendapatkan pesan penggunaan. Lebih dari satu file dapat ditentukan dengan opsi f. Selain untuk Wikipedia pembuangan XML, file CSV dari Tatoeba (http://tatoeba.org) sekarang juga didukung, mereka harus disaring pertama yang hanya berisi bahasa yang relevan.

Apa yang baru di versi 2.3:

  • Breton:
  • menambahkan / diperbaiki beberapa aturan
  • tetap alarm palsu
  • POS diperbarui kamus dari Apertium (svn r47282)
  • Catalan:
  • menambahkan dukungan untuk kode bahasa ca-ES-valencia (Catalan Valencia), yang akan digunakan dalam LibreOffice 4.2.0
  • menambahkan menggantikan aturan sederhana dengan ratusan saran pengganti
  • menambahkan / perbaikan beberapa aturan
  • tetap alarm palsu
  • Cina:
  • menambahkan solusi untuk StringIndexOutOfBoundsException (http://sourceforge.net/p/languagetool/bugs/186/)
  • English:
  • menambahkan pola pengganti pemeriksa ejaan untuk membuat saran yang lebih baik (sekarang menawarkan 'diajarkan' untuk 'diajarkan')
  • menambahkan / diperbaiki beberapa aturan
  • Perancis:
  • menambahkan / diperbaiki beberapa aturan
  • tetap alarm palsu
  • POS diperbarui tag kamus dan Hunspell kamus Dicollecte-4.12
  • Jerman:
  • menambahkan / perbaikan beberapa aturan
  • Portugis:
  • menambahkan / diperbaiki beberapa aturan
  • sekarang memiliki 3300+ kata majemuk
  • Ukraina:
  • menambahkan / perbaikan beberapa aturan
  • kode sumber telah dipindahkan ke github: https://github.com/languagetool-org/languagetool
  • LanguageTool membutuhkan Java 7 sekarang
  • LanguageTool memanfaatkan beberapa benang sekarang ke teks memeriksa hardware modern, meningkatkan kinerja (ini mempengaruhi versi berdiri sendiri, versi baris perintah dan ekstensi LibreOffice / OpenOffice)
  • sintaks Rule:
  • dukungan awal untuk atribut min / max baru yang memungkinkan untuk mencocokkan elemen yang muncul jumlah tertentu kali. Sebagai contoh: foo akan cocok apa-apa atau "foo", yaitu "foo" adalah foo opsional akan cocok "foo" atau "foo foo" foo akan cocok apa-apa, "foo", atau "foo foo" Gunakan max = "- 1" untuk memungkinkan kejadian tak terbatas. Untuk min, hanya 0 atau 1 didukung (1 adalah default).
  • dukungan untuk OR-laporan. Sebagai contoh: a internal dan di run-time, aturan yang mengandung OR-pernyataan diubah menjadi beberapa aturan tanpa OR-laporan
  • .
  • Inggris sekarang memiliki chunker untuk mendeteksi, antara lain, tunggal dan jamak potongan benda. Hal ini didokumentasikan di http://wiki.languagetool.org/using-chunks
  • versi mandiri:
  • Versi mandiri sekarang menggarisbawahi kesalahan dengan merah (kesalahan ejaan) atau biru (kesalahan lainnya) baris (Panagiotis Minos)
  • Ingat pilihan bahasa untuk memulai berikutnya
  • Peningkatan jendela dan penempatan dialog di setup multi-monitor
  • Server tertanam: menggunakan port default (8081) lagi jika mulai tanpa argumen
  • diperbarui morfologik-berasal perpustakaan untuk versi 1.7.1 untuk memungkinkan saran yang lebih baik, termasuk penanganan yang tepat dari diakritik dan pola penggantian (setara MAP dan REP fitur dalam kamus Hunspell)
  • OpenOffice integrasi / LibreOffice:
  • fix: "Tentang" dialog tidak bekerja di Apache OpenOffice 4.0
  • fix: aturan khusus negara (seperti untuk British English) tidak bekerja
  • API:
  • Di kelas Bahasa, getCountryVariants () telah diubah namanya menjadi getCountries (), dan metode getVariant baru telah ditambahkan.
  • Beberapa metode telah ditinggalkan
  • Beberapa metode telah dipindahkan dari Alat kelas (languagetool-core) untuk kelas CommandLineTools baru (languagetool-commandline)










Apa yang baru di versi 2.2:



Apa yang baru di versi 2.1:





Apa yang baru di versi 2.0:







Persyaratan :

  • Java Runtime Environment 2 Standard Edition

Perangkat lunak lain dari pengembang Daniel Naber

LanguageTool
LanguageTool

21 Jan 15

Jwordsplitter
Jwordsplitter

21 Jan 15

Komentar untuk LanguageTool

Komentar tidak ditemukan
Tambahkan komentar
Aktifkan gambar!