Weka містить в собі універсальний і дуже популярний широкий набір алгоритмів ML, реалізованих на Java і розроблених спеціально для DM [Weka]. Це продукт Університету Вайкато, Нова Зеландія, випущений під ліцензією GNU GPLv3 для некомерційних цілей.
Weka має систему пакетів, яка розширює її функціональність, з доступними як офіційними, так і неофіційними пакетами, що збільшує кількість реалізованих методів DM. Вона пропонує чотири опції для DM: інтерфейс командного рядка (CLI), Explorer, Experimenter і Knowledge flow. Хоча Weka не призначена спеціально для користувачів Hadoop і обробки великих даних, її можна використовувати з Hadoop завдяки набору обгорток, створених для найостанніших версій Weka3. На даний момент вона все ще не підтримує Apache Spark, а тільки MapReduce. Користувачі Clojure [Clojure] також можуть використовувати Weka завдяки бібліотеці Clj-ml library [Clj-ml]. У зв’язку з Weka, Massive Online Analysis (MOA) також є найпопулярнішою платформою з відкритим вихідним кодом, написаної на Java для інтелектуального аналізу потоків даних, в той же час з можливістю розширення для вирішення більш складних і масштабних завдань.
Сильні сторони:
- Загального призначення, гарно підтримується, з використанням широкого набору алгоритмів зі схемами навчання, моделями і алгоритмами.
- Поставляється з GUI і є API-орієнтованою.
- Підтримує стандартні задачі DM, включаючи вибір ознак, кластеризацію, класифікацію, регресію і візуалізацію.
- Дуже популярний інструмент ML в академічній спільноті.
Слабкі сторони:
- Обмежена для великих даних, інтелектуального аналізу тексту та навчання під наглядом.
- Слабка для моделювання послідовностей, наприклад часових послідовністей.