Automatización

Salford Predictive Modeler

SPM^® 8 viene con más de 70 escenarios pre-empacados, que son básicamente experimentos inspirados en la manera en que los mejores analistas de modelos estructuran su trabajo. Los llamamos "Automates" (automatizaciones). Estos "Automates" o experimentos crean múltiples modelos de forma automática para que el analista pueda ver las opciones fácilmente.

Ejemplo 1: Aplicaciones bancarias

Automate Shaving

Automate Shaving ayuda a identificar subconjuntos de datos informativos dentro de grandes conjuntos de datos que contienen variables correlacionadas dentro de los datos de las cuentas. Con la automatización, puede lograr una reducción significativa del modelo con mínimo sacrificio (si es que hay alguno) en cuanto a la exactitud del modelo. Por ejemplo, comience con una lista completa de variables y ejecute el recorte automático desde la parte superior para eliminar las variables que parecen prometedoras en la muestra de aprendizaje pero no permiten generalizar. Más adelante puede ejecutar el recorte desde la parte inferior para eliminar automáticamente un grupo importante de predictores redundantes e innecesarios. Después, dé seguimiento con el "error de recorte" para centrarse rápidamente en el subconjunto más informativo de características.

A diferencia de las herramientas comunes de minería de datos, Automate Shaving ofrece más que la lista típica de variables importantes. Adicionalmente, el analista obtiene un conjunto completo de subconjuntos o variaciones de las variables importantes que le permite optimizar o seleccionar rápidamente la lista final de variables y eliminar la carga de pruebas repetitivas. Los modeladores expertos suelen dedicar mucho tiempo y esfuerzo a la optimización de su lista de variables importantes; Automate Shaving automatiza este proceso.

Ejemplo 2: Detección de fraude

Automate Priors

En las aplicaciones típicas de detección de fraude, el analista trata de identificar diferentes conjuntos de reglas que conducen a una diversa probabilidad de fraude. Normalmente se emplean árboles de decisión y la tecnología de potenciación de gradientes TreeNet® para crear las reglas de clasificación para detectar el fraude. Todo árbol de clasificación se construye sobre la base de un conjunto específico de probabilidades previas suministrado por el usuario.

Un conjunto de probabilidades previas hará que los árboles busquen reglas con altos niveles de fraude, mientras que otros conjuntos producirán árboles con supuestos relativamente flexibles. Para sacar el mayor provecho de los enfoques de búsqueda basados en árboles, los analistas probarán un gran número de diferentes configuraciones de probabilidades previas. Este proceso es completamente automático en Automate Priors. El resultado es un amplio conjunto de reglas que van desde segmentos de fraude de confianza muy alta con bajo respaldo hasta una moderada indicación de segmentos de fraude con respaldo muy amplio. Por ejemplo, puede identificar pequeños segmentos con 100% de fraude o puede encontrar un segmento grande con una menor probabilidad de fraude, y todas las posibilidades intermedias.

Ejemplo 3: Investigación de mercados - Encuestas

Automate MVI (Indicadores de valores faltantes)

En cualquier encuesta, puede faltar una gran parte de la información. Con frecuencia, el encuestado no responde a las preguntas porque no quiere o porque no puede hacerlo. Además de la experiencia de Salford Systems en el tratamiento de los valores faltantes, una nueva característica de automatización permite al analista generar automáticamente múltiples modelos, incluyendo: 1) un modelo que predice la respuesta basándose únicamente en el patrón de valores faltantes; 2) un modelo que crea automáticamente indicadores simulados de valores faltantes además del conjunto original de predictores; y/o 3) un modelo que se basa en el tratamiento interno de los valores faltantes específico del motor.

Ejemplo 4: Aplicación en ingeniería

Automate Target

En una aplicación de ingeniería moderna, como parte del diseño experimental, es posible que se recopile un enorme conjunto de puntos muestreados bajo diferentes condiciones de operación. Puede ser difícil identificar las dependencias mutuas entre los diferentes parámetros. Por ejemplo, las temperaturas podrían ser perfectamente dependientes unas de otras, o podrían ser funciones desconocidas de otras condiciones operativas como la presión y/o las revoluciones. Automate Target le ofrece una manera efectiva de explorar y extraer automáticamente todas las dependencias mutuas entre los predictores. Con la palabra "dependencias", nos referimos a una relación multivariable potencialmente no lineal que va mucho más allá de la simplicidad de las correlaciones convencionales. Además, como un poderoso efecto secundario, esta automatización proporciona los medios generales para la imputación de valores faltantes, lo que resulta muy útil para trabajar con motores de modelado que no tratan directamente los valores faltantes.

Ejemplo 5: Publicidad en Internet

Automate Sample

En una aplicación de colocación de anuncios en línea hay que equilibrar la cantidad de datos utilizados y el tiempo que toma completar la creación del modelo. En la publicidad en Internet puede haber virtualmente una cantidad ilimitada de datos. Por lo tanto, aunque lo ideal sería utilizar todos los datos disponibles, siempre hay un límite en cuánto a la cantidad de datos que puede utilizarse para la implementación en tiempo real. Automate Sample permite al analista explorar automáticamente el efecto del tamaño de la muestra de aprendizaje sobre la exactitud del modelo. Por ejemplo, usted podría descubrir que usar 200,000,000 de transacciones no proporciona ningún beneficio adicional en términos de exactitud del modelo en comparación con 100,000,000 de transacciones.

Ejemplo 6: Aplicación en micromatrices

Automate TARGETSHUFFLE

Los conjuntos de datos de la investigación con micromatrices se caracterizan por un gran número de predictores (genes) y un número muy limitado de registros (pacientes). Esto abre una amplia zona de ambigüedad que resulta del hecho de que incluso un subconjunto aleatorio de predictores puede producir un modelo aparentemente prometedor. Automate TARGETSHUFFLE le permite determinar si el desempeño del modelo es tan exacto como parece ser. Automate TARGETSHUFFLE construye automáticamente un gran número de modelos auxiliares basados en variables objetivo combinadas de manera aleatoria. Al comparar el desempeño real del modelo con la distribución de referencia (modelos sin dependencia), se puede tomar una decisión final sobre el desempeño del modelo. Esta tecnología podría conducir al cuestionamiento de algunos de los trabajos producidos actualmente en la investigación con micromatrices. Si un conjunto de datos con la dependencia de objetivos destruida deliberadamente puede producir un modelo con buena precisión, entonces confiar en el modelo original sería relativamente dudoso.

LO QUE HACEMOS

Los productos de Minitab ayudan a las empresas a aumentar la eficiencia y mejorar la calidad mediante el uso del análisis inteligente de datos.

Hable con Minitab

Salford Predictive Modeler^® 8
La suite integrada de software de aprendizaje de máquina de Minitab

CART®

El motor de modelado CART® es el árbol de clasificación más sofisticado que ha revolucionado el campo del análisis avanzado y dio inicio a la era actual de la ciencia de los datos.

Más Información

Random Forests®

Random Forests® es un motor de modelado que aprovecha el poder de múltiples análisis alternativos, estrategias de aleatorización y aprendizaje por ensambles.

Más Información

MARS®

El motor de modelado MARS® es ideal para los usuarios que prefieren los resultados en una forma similar a la regresión tradicional, pero sin dejar de detectar las no linealidades y las interacciones esenciales.

Más Información

TreeNet®

La potenciación de gradientes TreeNet® es la herramienta de minería de datos más flexible y poderosa de SPM, capaz de generar de manera consistente modelos extremadamente exactos.

Más Información

Precios

Comuníquese con nosotros para obtener información sobre precios.

Comuníquese Con Nosotros

University Program

Nuestro University Program ofrece los motores de modelado SPM^®, CART^®, MARS^®, TreeNet^® y Random Forests^® a la comunidad educativa a precios de licenciamiento significativamente reducidos.

Comuníquese Con Nosotros