Scikit-Learn широко відомий як добре підтримуваний, відкритий і популярний інструмент Python ML, який містить велику бібліотеку алгоритмів, включаючи інкрементальне навчання [Scikit]. Він розширює функціональність пакетів NumPy і SciPy за допомогою численних DM алгоритмів. Він також використовує пакет Matplotlib для побудови графіків.
Проект Scikit-Learn почався як проект Google Summer of Code Девіда Курнапо. З 2015 року він активно розвивається за підтримки INRIA, Telecom ParisTech, а іноді і Google, завдяки Google Summer of Code. З квітня 2016 року Scikit-Learn надається в спільно розробленій Anaconda [Anaconda] для проекту Cloudera на кластерах Hadoop [AnaCloudera]. На додаток до Scikit-Learn, Anaconda включає ряд популярних пакетів для математики, науки і техніки для екосистеми Python, таких як NumPy, SciPy і Pandas. Scikit-Learn надає доступ до наступної функціональності: класифікації, регресії, кластеризації, зменшення розмірності, вибору моделі і попередньої обробки.
Сильні сторони:
- Універсальний, загальнодоступний, комерційно придатний, добре підтримуваний і популярний інструмент Python ML.
- Має підтримку з боку великих ІТ-компаній (Google) і установ (INRIA).
- Добре оновлюваний і вичерпний набір алгоритмів і реалізацій.
- Є частиною багатьох екосистем; тісно пов’язаний зі статистичними та науковими пакетами Python.
Слабкі сторони:
- Невеликі набори даних, тільки API-орієнтований, інтерфейс командного рядка вимагає навичок програмування на Python.
- Бібліотека не підтримує GPU і має тільки базові інструменти для нейронних мереж.