Scikit—learn (Sklearn) – это библиотека с реализацией целого ряда алгоритмов для обучения с учителем (Supervised Learning) и обучения без учителя (Unsupervised Learning) через интерфейс для языка программирования Python.
Scikit-learn построена на основе SciPy (Scientific Python). Кроме того Sklearn имеет следующие зависимости:
- NumPy: расширение языка Python, добавляющее поддержку больших многомерных массивов и матриц, вместе с большой библиотекой высокоуровневых математических функций для операций с этими массивами;
- SciPy: открытая библиотека высококачественных научных инструментов для языка программирования Python;
- Matplotlib: библиотека на языке программирования Python для визуализации данных 2D и 3D графики;
- IPython: интерактивная оболочка для языка программирования Python, которая предоставляет расширенную интроспекцию, дополнительный командный синтаксис, подсветку кода и автоматическое дополнение;
- Sympy: библиотека для символьных вычислений;
- Pandas: различные структуры данных и анализ.
Pandas – высокоуровневая библиотека на языке Python для обработки и анализа данных. Pandas работает с данными поверх библиотеки NumPy.