Les données volumineuses ne peuvent pas être analysées et traitées par un seul ordinateur et une architecture distribuée doit être utilisée. Son besoin réside dans l'exploration distribuée de données volumineuses. Mais il doit prendre en charge les technologies de traitement distribué, de bases de données distribuées, de stockage en nuage et de virtualisation du cloud computing.