Garantir un hébergement performant et évolutif des projets Big Data
budgetbox aide les acteurs de la grande distribution à améliorer l’expérience d’achat des consommateurs et à augmenter leur engagement, en e-commerce comme en magasin. Pour y parvenir, l’entreprise a développé deux solutions logicielles, une application de self scanning et un outil de gestion de campagne de recommandations produits associés à des bons de réduction. budgetbox est aujourd’hui composé d’une équipe de 50 personnes réparties sur deux sites en France. Entretien avec Hugo Martineau et Florian Ferreira, respectivement responsable du pôle Infrastructure et développeur chez budgetbox.
Contexte
Pour garantir la pertinence des recommandations de produits adaptées aux besoins des marques pour lesquelles travaille budgetbox et personnalisées pour les consommateurs finaux, la récolte et le traitement des données sont des éléments stratégiques. Notamment pour aider les équipes marketing à préparer ces campagnes.
« Nous avons besoin de données pour cibler des clients et des besoins spécifiques dans les magasins. C’est central dans la préparation d’une campagne, mais aussi pendant, pour l’ajuster rapidement, et aussi à la fin pour générer des reportings. »
Pour parvenir à de tels résultats, budgetbox ne lésine pas sur les quantités de données à récolter.
« Nous enregistrons des millions d’activités chaque jour (ajout au panier, suppression du panier, produits sélectionnés) avec plusieurs Go de données compressées par mois issues des passages en caisse. En trois ans, nous avons récolté plusieurs To de données des parcours clients. »
Mais le travail ne s’arrête pas là puisqu’il ne suffit pas de récolter la data, il faut aussi la traiter.
« Comme nos solutions sont multicanales, nous avons beaucoup de données à croiser. Toutes les nuits, ces données sont automatiquement pré-qualifiées et un minimum structurées pour accélérer les temps de requête de l’équipe marketing. »
Pour répondre à ces impératifs métiers et business, budgetbox se devait d’avoir une plateforme Big Data à l’épreuve des balles.
« Pour le hardware et le stockage nous avons opté pour Cloudera et la technologie Flashblade de Pure Storage sur les conseils d’Oxeva. Pour la partie calcul et gestion des clusters, une société de conseil spécialisée en Big Data nous a orientés vers Spark et se chargeait de l’administrer. »
L'expérience Oxeva
Pour garantir la meilleure exploitation possible de sa plateforme Big Data, budgetbox a fait le choix de s’entourer de deux partenaires aux expertises complémentaires.
« Nous avions déjà des VM hébergées chez Oxeva pour un autre projet. C’est pour ça que nous leur avons confié l’hébergement de notre plateforme Big Data. En revanche, c’était un autre partenaire qui la pilotait. »
Mais tout ne s’est pas passé comme prévu.
« Nous nous sommes rendus compte que cela faisait trop d’acteurs autour de la table. Cela nous prenait beaucoup trop de temps pour identifier les problèmes. »
Technologies utilisées
C’est la raison pour laquelle budgetbox a choisi de ne garder qu’un seul interlocuteur et de mettre Oxeva au défi d’élargir leur périmètre d’intervention.
« Après nous avoir assuré qu’ils pouvaient le faire, ils ont mis en place un POC dans lequel ils ont reproduit notre plateforme quasiment à l’identique. Pendant quelques mois, celui-ci a tourné en parallèle de notre plateforme historique. C’était comme avoir une double prod, c’était pratique pour comparer. »
En termes de comparaison, tout a été passé au crible : temps de traitement, robustesse, résilience et réactivité en cas de crash, coûts des plateformes, etc. Si les deux plateformes étaient au coude-à-coude, un élément a définitivement fait pencher la balance.
« L’offre d’Oxeva nous permet de décorréler le calcul et le stockage. C’est-à-dire qu’on peut ajouter du stockage en plus sans toucher au calcul et inversement. C’est très pratique pour l’évolutivité de la plateforme, surtout dans un contexte Big Data. Ça a fait la différence. »
Résultats
Pour budgetbox, l’objectif consistait à maintenir l’excellence des performances de l’ancienne plateforme. Il n’y avait donc pas d’enjeu d’amélioration des temps de réponse ou d’exécution des jobs.
« On ne voit pas la différence avec l’ancienne plateforme. La migration en elle-même nous a un peu impacté puisqu’elle nous a demandé du temps et de la ressource en interne. »
Une étape qui a néanmoins été facilitée par les équipes Oxeva.
« J’ai eu un interlocuteur très réactif et disponible. Le suivi était vraiment bon. »
Quant à l’enjeu de réduire le nombre d’interlocuteurs pour faciliter la gestion quotidienne de la plateforme, objectif atteint pour Florian.
« Ils sont très réactifs et surtout non réfractaires aux changements, ils sont toujours enclins à tester de nouvelles choses. C’est un gros plus dans un projet Big Data. »
Même son de cloche pour Hugo.
« Ils sont proactifs sur les conseils et analysent la moindre de nos demandes pour nous accompagner, même sur des technos spécifiques. Ils prennent le temps d’analyser la question pour nous fournir une réponse détaillée. »
Avant de conclure.
« Ils savent respecter et travailler avec les contraintes qu’on leur impose. Ils sont autant ouverts aux projets qu’aux clients. »