Аналітика та візуалізація даних

Інструменти в цій категорії використовуються для відображення результатів аналітики в інтерактивному режимі, тому вони можуть полегшити розуміння складних концепцій і прийняття рішень для дослідників і науковців. Існує багато пакетів візуалізації даних на різних рівнях в R та Python, наприклад Matplotlib, Plotly, Seaborn, ggplot, Bokeh та інші.

В останні роки популярність веб ноутбуків/додатків зростає. Вони інтегровані із середовищами аналізу даних для створення і обміну документами, та містять в собі залежний від даних “живий” код, рівняння, візуалізації і описовий текст. Найбільш відомими є ноутбуки Jupyter (раніше iPython notebook) і Zeppelin.

Jupyter notebook [Jupyter] – це додаток з відкритим вихідним кодом, що підтримує створення і спільне використання документів (“notebooks”), коду, рівнянь, візуалізації і текстових описів для перетворення даних, чисельного моделювання, статистичного моделювання, візуалізації даних і ML.

Zeppelin – це інтерактивний “notebook”, призначений для обробки, аналізу і візуалізації великих наборів даних [Zeppelin], що забезпечує вбудовану підтримку розподілених обчислень Apache Spark. Zeppelin дозволяє розширити їх функціональність за допомогою різних інтерпретаторів, таких як Spark, SparkSQL, Scala, Python, оболонка з аналітики Apache Spark.

Вказані далі популярні інструменти належать до платформ аналізу даних з відкритим вихідним кодом, платформ звітності та інтеграції, такі як Kibana, Grafana і Tableau.

Kibana – це інтерфейс візуалізації даних для Elastic Stack, що доповнює іншу частину стека, в яку входять Beats, Logstash і Elasticsearch [Kibana]. У версії 5.x Elastic Stack Kibana включає Timelion для інтерактивних діаграм часових рядів.

Grafana – це обраний інструмент DevOps для багатьох панелей моніторингу в реальному часі метрик часових рядів [Grafana]. Він має потужну візуалізацію і підтримує кілька внутрішніх джерел даних, включаючи InfluxDB, Graphite, Elasticsearch і багато інших, які можна додавати через плагіни.

Tableau – це універсальний аналітичний інструмент, який може отримувати дані з різних невеликих джерел даних, таких як CSV, Excel і SQL, а також з корпоративних ресурсів або підключати платформи великих даних і хмарні джерела [Tableau].