Menu

RANDOM FORESTS, UN OUTIL CREE PAR LEO BREIMAN ET ADELE CUTLER

Random Forests®

Grâce à une collection d'arbres de classification et de régression (CART®), le moteur de modélisation Random Forests® calcule la somme des prévisions issues de chaque arbre CART afin de déterminer la prévision globale réalisée par la forêt, tout en veillant à ce que les arbres de décision ne s'influencent pas les uns les autres.

Pour ceux qui ne connaissent pas Random Forests, il s'agit d'une technique puissante mise au point par Leo Breiman et Adele Cutler de l'Université de Californie, Berkeley, plébiscitée par bon nombre d'utilisateurs d'outils de modélisation prédictive. A première vue très simple, l'algorithme est pourtant capable de générer des centaines d'arbres indépendants et utilise des échantillonnages tirés d'observations et de variables.

Grâce à sa capacité unique d'évaluation des performances non biaisées du modèle à partir de données prêtes à l'emploi, plus besoin d'échantillon de test ou de validation distinct. Ce qui fait de Random Forests l'outil de modélisation prédictive le plus efficace pour les applications de données à grande échelle, où le nombre de variables dépasse souvent largement le total des observations disponibles.

Responsabilité

Random Forests est le seul outil capable de tirer parti de chaque enregistrement de votre ensemble de données sans risque de surajustement. Il s'agit d'un point particulièrement important pour les ensembles de données limités, en matière d'observations, où chaque enregistrement a son importance. Random Forests s'assure de la prise en compte de tous les enregistrements dans vos modèles afin d'éviter toute perte d'information.

Importance des variables robustes

Random Forests mise sur des techniques novatrices pour classer les prédicteurs par ordre d'importance. Cette stratégie s'avère particulièrement utile lorsque les données comportent des milliers, des dizaines de milliers, voire même des centaines de milliers de variables ou de prédicteurs, ce qui dépasse largement la portée des outils de classification et de régression traditionnels. Random Forests est en mesure de gérer ce type de situation extrême et de déterminer quelles variables utiliser lors des recherches associées. Plus les étapes d'échantillonnage se multiplieront, plus les informations qui en découleront seront fiables et pertinentes.

Vous aimeriez tester le moteur de modélisation 
le plus populaire, Random Forests ?

Méthodes fondées sur les arbres de Minitab

Que vous débutiez ou que vous cherchiez à perfectionner votre analyse prédictive, les moteurs de modélisation fondés sur les arbres de Minitab sont faits pour vous. 

En savoir plus sur les solutions d'analyse prédictive de Minitab

CART

CART®

L'arbre de classification qui a révolutionné le domaine de l'analyse avancée, ouvrant une nouvelle ère dans le domaine de la science des données.

Random Forest

Random Forests®

Le moteur qui s'appuie sur plusieurs analyses alternatives, sur des stratégies de randomisation et sur l'apprentissage ensembliste, le tout dans une plate-forme unique. 

TreeNet

TreeNet®

L'outil d'auto-apprentissage par la machine le plus flexible et puissant capable de générer des modèles ultra précis.

Êtes-vous prêt à découvrir les solutions d'analyse prédictive de Minitab ?

clear