Prestons gratuitement quand cela se doit !

31 Août 2016

NEHOOV est certes une SAS (il faudra sûrement revoir cela bientôt), mais notre philosophie d’entreprise a pour objet l’amélioration de la communauté, de toutes communautés. Donc chez NEHOOV, nous avons décidé d’offrir GRATUITEMENT une partie de notre temps à des entités en difficultés, ou naissantes, ou encore issues de pays en voie de développement.

Toutes les entreprises ou associations françaises par exemple qui sont en difficultés de quelque façon qu’il soit mais qui souhaitent améliorer leurs ‘performances’ par des techniques analytiques peuvent nous contacter, et nous essayerons de les aider gratuitement. C’est un sujet que nous prenons très au sérieux chez NEHOOV.

Aussi, nous essayons donc d’aider à l’étranger : pour exemple, à une entreprise vietnamienne de conseils nous venons de fournir gracieusement des prédicteurs de la consommation électrique horaire dans une région du pays, ceci pour améliorer la gestion des équilibrages par les gestionnaires de réseaux et réduire le coût global du système, ce qui profitera à tous dans cette région ! Développons un peu dans les détails cette étude.

Au Vietnam la qualité des mesures de la demande n’est pas optimale, et il a fallu commencer à nettoyer la base de données des mesures, comportant des trous de mesures et des valeurs aberrantes. Le sujet est intéressant, car la base de données est petite (cela change !) : un petit peu moins de mille enregistrements, mais avec des dizaines de variables, disons N=30 variables par jour.

Sur les données manquantes, l’approche par Machine Learning est plastique, car il est possible de tenter plusieurs approches.

Premièrement, pour M<N variables renseignées (on devra user de plusieurs valeurs de M), on peut construire un modèle neuronal qui à partir des M variables reconstruit les N-M variables restantes : on prend en compte ces M variables d’un jour J et l’apprentissage permet de tenter une reconstruction des N-M variables restantes. Cet apprentissage s’effectue sur les jours qui ont toutes les valeurs disponibles, bien évidemment.  Ce ‘prédicteur’ permet alors de combler les trous pour les jours où les mesures horaires ont été déficientes. Les résultats furent excellents sur la base d’apprentissage. Ci-dessous un exemple de reconstruction sur 6 variables avec en objectif 24 variables (on montre la seconde variable reconstruite) :

 

Alternativement, on peut construire des cartes de Kohonen dynamiques sur l’ensemble des données, pour ‘inclure’ les jours imparfaits dans des clusters de journées parfaitement renseignées. Nombre d’algorithmes permettent alors de produire les valeurs manquantes des jours d’un cluster à partir des jours bien renseignés (moyennes, médoïdes, ou bien encore un second réseau de neurones en aval, etc fois 1000).

Pour illustration, la carte ci-dessous montre des clusters contenant les jours bien renseignés (en bleu) et les autres (les couleurs indiquent le nombre de données manquantes).

Les clusters contenant des couleurs non bleus ‘inclues’ dans du bleu permettent de bien reconstruire les jours imparfaits. Par contre, les clusters non bleus, tel celui en orange au centre de la carte, montre des jours difficilement reconstructibles. L’avantage d’user de carte auto-organisatrices permet de voir de suite les enregistrements où la reconstruction sera difficile, contrairement à la première approche.

Ici l’avantage premier de notre technologie chez NEHOOV est de pouvoir travailler directement sur des valeurs multi-variées (construire un prédicteur d’un vecteur à plusieurs dimensions se fait directement en un clic, notre leitmotiv chez NEHOOV !!).

Sûrement quelque lecteur aura en tête des idées bien meilleures pour améliorer notre approche (qu’il nous rejoigne !!). Mais notre but, humblement, aura été d’offrir les résultats d’une technologie de pointe, à une entité qui pourra opérationnellement l’utiliser : nous avons livré un code C complètement utilisable de suite !

Alain FUSER, CEO de NEHOOV

Share