ML platforms with MapReduce

Нещодавно з’явилися нові розподілені платформи для вирішення завдань масштабованості алгоритмів для аналітики Bigdata з використанням моделі програмування MapReduce. Це Apache Hadoop і Apache Spark, дві найбільш популярні реалізації. Основними перевагами цих розподілених систем є їх еластичність, надійність і прозора масштабованість в зручній для користувача формі. Вони призначені для надання користувачам простого і автоматичного відмовостійкого розподілу робочого навантаження без незручностей, пов’язаних з певними деталями базової апаратної архітектури кластера. Ці популярні розподілені обчислювальні середовища і графічні процесори не є взаємовиключними технологіями, хоча вони націлені на різні цілі масштабування [Cano 2017]. Ці технології можуть доповнювати один одного і призначатися для додаткових обчислювальних сфер, таких як ML і DL [Skymind 2017], однак тут все ще багато обмежень і проблем.

M	T	W	T	F	S	S
1	2	3	4	5	6	7
8	9	10	11	12	13	14
15	16	17	18	19	20	21
22	23	24	25	26	27	28
29	30	31