DSTK - Data Science Toolkit 3 adalah satu set perangkat lunak penambangan data dan teks, mengikuti model CRISP DM. DSTK menawarkan pemahaman data menggunakan analisis statistik dan teks, persiapan data menggunakan normalisasi dan pemrosesan teks, pemodelan dan evaluasi untuk pembelajaran mesin dan algoritma pembelajaran statistik.
DSTK 3 akan menawarkan fitur-fitur menarik seperti Deep Neural Network (Deep Learning), Analisis Text Link dengan Visualisasi, KMeans Clustering. Beberapa fitur ini dapat disajikan dalam versi yang lebih lama, tetapi karena algoritme ditulis ulang untuk mengurangi penggunaan pustaka eksternal seperti Weka untuk mengurangi ukuran file, kami memerlukan lebih banyak waktu untuk mengembangkannya. DSTK Engine masih dalam tahap beta, karena itu, mungkin ada beberapa bug dan ketidakakuratan.
DSTK 3 terdiri dari DSTK Engine, DSTK ScriptWriter, DSTK Studio dan DSTK Text Explorer. DSTK Engine R disederhanakan, berfokus pada Data Mining. DSTK ScriptWriter menawarkan GUI untuk menulis skrip untuk DSTK Engine. DSTK Studio menawarkan Statistik SPSS seperti GUI untuk penambangan data, dan DSTK Text Explorer menawarkan GUI untuk Penambangan Teks.
Persyaratan :
Java Runtime Environment, Microsoft. Kerangka Neto
Batasan :
percobaan 10-penggunaan
Komentar tidak ditemukan