RapidMiner – це універсальна програмна платформа для обробки і підготовки даних, ML, DL, інтелектуального аналізу тексту і прогнозної аналітики [Mierswa 2003] [Rapid]. Його архітектура заснована на моделі клієнт/сервер з сервером, який надається як в локальній, так і в публічній або приватній хмарній інфраструктурі (Amazon AWS і Microsoft Azure).
RapidMiner (раніше YALE, Yet Another Learning Environment) був розроблений в 2001 році Ральфом Клінкенбергом, Інго Міерсвоєм і Саймоном Фішером з відділу штучного інтелекту Технічного університету Дортмунда. Він розроблений на open core моделі, написаний мовою програмування Java і є кросплатформним фреймворком. RapidMiner підтримує інтерактивний режим (GUI), інтерфейс командного рядка (CLI) і API Java. RapidMiner в основному є пропрієтарним комерційним продуктом починаючи з версії 6.0. Однак він пропонує безкоштовну версію, обмежену одним логічним процесором і 10000 рядків даних, яка доступна за ліцензією AGPL.
Для великомасштабного аналізу даних RapidMiner підтримує спонтанне навчання в Hadoop [Radoop], кероване навчання в пам’яті з оцінкою в кластері (SparkRM), а також кероване навчання і оцінку за допомогою власних алгоритмів в кластері. В цьому випадку покриття алгоритму звужується до наївного баєсу, ітеративного наївного баєсу, лінійної регресії, логістичної регресії, SVM, дерева рішень і випадкового лісу, кластеризації з використанням k-means і нечітких k-means.
Сильні сторони:
- Загального призначення, має широкий набір алгоритмів зі схемами навчання, моделями і алгоритмами з Weka і R скриптів.
- Підтримка доповнень до обраних алгоритмів для великомасштабних даних.
- Сильна спільнота, хороша підтримка, кросплатформена структура.
Слабкі сторони:
- Патентований продукт для вирішення масштабних проблем.