Fonctionnalités
- Fusion de N fichiers en un seul,
- Identification des données manquantes ou de mauvais formats, algorithme évolué de cleaning (exemple : unification des différents formats de dates),
- Management des colonnes (supp, déplacement, désactivation, etc),
- Markov : Création de colonnes par décalages temporels,
- Création de colonne par classification (transformation des valeurs en un nombre finis de valeurs possibles, par exemple tranches de 10%),
- Conversion de colonne textuelle en colonne numérique
- 6 algorithmes de sampling,
- Sharpening (création d’une sous-base en ne conservant que les colonnes intègres) ,
- Différents algorithmes de troncatures ou de simplification des valeurs,
- Rapport statistique (nœud de rapport),
- Affichage de la base partielle ou complète, mais PAS de MAJ manuelle autorisée,
- Graphe XY (nœud graphique) avec colorisation des points avec une 3e colonne Z, graphe Y,
- Projection 2D d’un nœud par algorithme t-SNE (nœud graphique créé),
- Ajout dans le nœud BD de 2 colonnes donnant les coordonnées des points 2D de cette t-SNE,
- Rapport statistique F-inverse : à partir d’une colonne C choisie, créer des paquets de lignes en fonction des valeurs de C, et calculer les diamètres et les inter-distances entre ces paquets,
- Rapport de binnage N-dimensionnel, contenant la matrice d’interdistance et les graphes de représentation associés
- Possibilité d’appeler un modèle de forecast ou une carte auto-organisatrice créée par PREDICT,
- Visualisation intelligente de l’univers des nœuds par représentation en graphes,
- Exports,
- Identification de valeurs extrêmes, proposition d’application d’algorithmess de remplacements de ces valeurs,
- Statistiques par blocs ou par sampling pour obtenir des distributions de probabilités.
Même sur des gros calculs ou des gros volumes, DEXTER “s’ajuste” à la RAM et à la puissance de la machine pour ne pas “bloquer” la machine de l’utilisateur : ça prendra plus de temps, mais l’analyse se terminera tout de même.
Idée : pouvoir travailler “en off the grid”, laisser tourner sa machine la nuit ou le week-end, et revenir après.
Presque toutes les fonctionnalités de DEXTER s’exécutent en tâche de fond (une zone “background info” permet de savoir où en est le traitement, et permet de visualiser directement le calcul terminé).