Automatisation

Salford Predictive Modeler

SPM® 8 comporte plus de 70 scénarios (autrement dit, expériences) inspirés par la manière dont les plus grands analystes de modèles organisent leur travail. Nous les appelons "automates". Ces "automates", ou expériences, créent plusieurs modèles automatiquement de sorte que l'analyste puisse facilement voir les choix qui s'offrent à lui.

 

Exemple 1 : secteur bancaire

Automate d'élimination

L'automate d'élimination permet d'identifier des sous-ensembles de données informatives au sein de grands ensembles de données de compte contenant des variables corrélées. Grâce à l'automatisation, vous pouvez considérablement réduire vos modèles avec une perte de précision minimale (voire nulle). Par exemple, vous pouvez partir d'une liste complète de variables, puis lancer une élimination automatique par le haut pour écarter les variables qui semblent prometteuses sur l'échantillon d'apprentissage, mais qui ne se généralisent pas. Plus tard, vous pourrez effectuer une élimination par le bas pour écarter automatiquement un bloc de prédicteurs redondants et inutiles. Vous pouvez ensuite utiliser la commande d'erreur pour rapidement identifier le sous-ensemble de caractéristiques le plus informatif.

Contrairement aux outils d'exploration de données standard, Automate Shaving vous offre bien plus qu'une liste d'importance des variables standard. L'analyste dispose en outre d'un panel complet de sous-ensembles/variations d'importance des variables lui permettant d'optimiser ou de sélectionner rapidement la liste de variables finale et de s'épargner la répétition des tests. Si les experts en modélisation consacrent énormément de temps et d'efforts à l'optimisation de la liste d'importance des variables, l'automate d'élimination automatise tous le processus.
 

Exemple 2 : détection des actes frauduleux

Automate des probabilités a priori

Dans la plupart des applications de détection des fraudes standard, l'analyste doit identifier différents ensembles de règles jusqu'à obtenir une probabilité de fraude variable. Les arbres de décision et la technologie de boosting de gradient de TreeNet® servent généralement à élaborer des règles de classification pour la détection des actes frauduleux. La construction de tout arbre de classification est fondée sur un ensemble spécifique de probabilités a priori fourni par l'utilisateur.

Un ensemble de probabilités a priori forcera les arbres à chercher des règles ayant des taux élevés d'actes frauduleux, tandis que d'autres produiront des arbres avec des hypothèses plus souples. Pour tirer le meilleur parti des approches de recherche de règles fondées sur des arbres, les analystes devront tester un grand nombre de configurations de probabilités a priori. Ce processus est entièrement automatisé dans l'automate des probabilités a priori Vous obtenez ainsi une vaste collection de règles allant de segments réduits présentant une probabilité de fraude extrêmement élevée à des segments beaucoup plus larges présentant une probabilité de fraude modérée. Par exemple, vous pouvez identifier de petits segments présentant une probabilité d'activités frauduleuses de 100 % ou trouver un grand segment avec une probabilité plus faible, ainsi que toutes les catégories comprises entre les deux.
 

Exemple 3 : étude de marché - Sondages

Automate MVI (indicateurs de valeurs manquantes)

Dans un sondage, il est possible qu'un large pan d'informations fasse défaut. Bien souvent, la personne interrogée ne souhaitera ou ne saura pas répondre à certaines questions. Combinée à l'expertise de Salford Systems en matière de gestion des valeurs manquantes, notre nouvelle fonctionnalité d'automatisation permet à l'analyste de générer plusieurs modèles automatiquement, à savoir : 1) un modèle qui prévoit la réponse uniquement en fonction du schéma des valeurs manquantes, 2) un modèle qui crée automatiquement des indicateurs de valeurs manquantes factices, qui sont ajoutés à l'ensemble de prédicteurs d'origine, et/ou 3) un modèle reposant sur la gestion interne, propre au moteur, des valeurs manquantes.
 

Exemple 4 : ingénierie

Automate de cible

Dans les procédés d'ingénierie modernes, un plan d'expériences peu impliquer la collecte d'un vaste ensemble de valeurs d'échantillon obtenues sous différentes conditions d'exploitation. Il peut alors être difficile d'identifier les dépendances mutuelles entre les différents paramètres. Par exemple, les températures pourraient parfaitement être dépendantes les unes des autres ou constituer des fonctions inconnues d'autres conditions d'exploitation telles que la pression et/ou les vitesses de rotation. L'automate de cible offres des outils avancés pour examiner et extraire automatiquement toutes les dépendances mutuelles entre prédicteurs. Par "dépendances", nous entendons une relation multivariée potentiellement non linéaire bien plus complexe que les corrélations conventionnelles. L'automate fournit en outre des options générales pour l'imputation des valeurs manquantes, ce qui est extrêmement utile avec les moteurs de modélisation qui ne gèrent pas directement les valeurs manquantes.
 

Exemple 5 : publicité en ligne

Automate d'échantillonnage

Dans le domaine du placement publicitaire, il est impératif de trouver le bon équilibre entre le volume de données utilisées et le temps nécessaire à la construction du modèle. En théorie, la publicité en ligne peut offrir un volume de données illimité. Si, dans l'idéal, vous devriez utiliser l'intégralité des données disponibles, les impératifs de déploiement en temps réel vous oblige toujours à limiter le volume de données à utiliser. L'automate d'échantillonnage permet à l'analyste d'étudier automatiquement l'impact de l'effectif d'échantillon d'apprentissage sur la précision du modèle. Par exemple, vous pourriez découvrir que l'utilisation de 200 millions de transactions n'apporte aucune précision supplémentaire au modèle par rapport à 100 millions de transactions.
 

Exemple 6 : microréseaux d'ADN

Automate TARGETSHUFFLE

Les ensembles de données issus de la recherche sur les microréseaux d'ADN se caractérisent par un nombre de prédicteurs extrêmement élevé (les gènes) et un nombre très limité de dossiers (les patients). Il en découle une vaste zone d'ambiguïté issue du fait que même un sous-ensemble de prédicteurs aléatoire peut produire un modèle apparemment adéquat. L'automate TARGETSHUFFLE vous permet de déterminer si le modèle est aussi précis qu'il le semble. L'automate TARGETSHUFFLE crée automatiquement un grand nombre de modèles auxiliaires fondés sur des variables cibles mélangées aléatoirement. En comparant les performances réelles du modèle à la distribution de référence (aucun modèle de dépendance), vous pouvez alors prendre une décision finale concernant les performances du modèle. Cette technologie pourrait remettre en question certains des articles actuellement publiés dans le domaine de la recherche par microréseaux d'ADN. Si un ensemble de données où la dépendance cible est délibérément éliminer peut vous fournir un modèle suffisamment précis, vous pouvez douter de la fiabilité du modèle d'origine.

QUE FAISONS-NOUS ?

Minitab aide les entreprises à améliorer l'efficacité et la qualité via une analyse intelligente des données.

Salford Predictive Modeler® 8
La suite intégrée de logiciels d'auto-apprentissage par la machine de Minitab

Cart Logo

CART®

Le moteur de modélisation CART® de SPM est l'arbre de classification qui a révolutionné le domaine de l'analyse avancée, ouvrant une nouvelle ère dans le domaine de la science des données.

Random Forest Logo

Random Forests®

Random Forests® est un moteur de modélisation qui s'appuie sur plusieurs analyses alternatives, sur des stratégies de randomisation et sur l'apprentissage ensembliste.

Mars Logo

MARS®

Le moteur de modélisation MARS® est idéal pour les utilisateurs qui préfèrent que leurs résultats se présentent comme dans une régression traditionnelle tout en mettant en évidence les interactions et les non-linéarités essentielles.

Treenet Logo

TreeNet®

Le boosting de gradient de TreeNet® est l'outil d'exploration de données le plus flexible et puissant de SPM, capable de générer en permanence des modèles extrêmement précis.

Pricing Icon

Tarifs

Pour plus d'informations sur les tarifs, contactez-nous.

University Icon

Programme Université

Notre programme Université met les moteurs de modélisation SPM®, CART®, MARS®, TreeNet® et Random Forests® à disposition de la communauté universitaire avec d'importantes remises sur les droits de licences.

Automation Icon

Automatisation

Plus de 70 scénarios (autrement dit, expériences) intégrés, inspirés par la manière dont les plus grands analystes de modèles organisent leur travail.