¿Qué es la Minería de Datos?

La minería de datos o "data mining" es un proceso de clasificación de grandes bancos de información para identificar patrones y establecer relaciones para la resolución de problemas a través del análisis de datos. Intuitivamente, podría pensar que la minería de datos se refiere a la extracción de datos nuevos, pero este no es el caso. En su lugar, la extracción de datos consiste en extrapolar patrones y nuevos conocimientos a partir de los datos que ya ha recopilado.

Evidence Technology - ¿Qué es la Minería de Datos?

Técnicas de minería de datos.

La minería de datos puede ser altamente efectiva, siempre y cuando esté basada en una o más de estas técnicas:

Proceso de un proyecto de minería de datos.

  1. Seleccionar un conjunto de datos

    El primer paso será elegir el grupo de datos que se van a analizar en función a la información que se busca adquirir o el problema planteado. Por ejemplo: existen las variables por objeto que se usan para predecir, inferir o calcular, también existen las llamadas variables independientes cuya función es realizar cálculos de procesos.

  2. Extraer, transformar y cargar los datos

    El siguiente paso es reunir datos críticos y relevantes de la compañía, dichos datos son transaccionales y tratan con operaciones de ventas, inventarios, costos y otras operaciones que se realizan diariamente en la empresa. Los patrones y las relaciones entre los elementos de datos representan información relevante para los empresarios. Por ejemplo: si se trata de una empresa con fuerte enfoque en el consumidor, los datos sobre los productos más vendidos, la demografía de los clientes y la competencia pueden generar patrones sobre los hábitos de compra que permitirán mejorar las técnicas de venta y aumentar los ingresos de la empresa.

  3. Seleccionar un algoritmo adecuado

    El funcionamiento general del algoritmo implica identificar tendencias en el conjunto de datos y mediante esto definir parámetros. Los algoritmos más utilizados en minería de datos son los de clasificación y regresión. Los principales proveedores de bases de datos, como Oracle y SQL, incorporan algoritmos de minería de datos, como la agrupación en clústeres y la regresión, para satisfacer la demanda de minería de datos.

  4. Interpretar y evaluar los datos

    Es importante realizar una validación para ver si los datos obtenidos son confiables. Si los resultados son los deseables se puede continuar trabajando con el modelo desarrollado, de lo contrario habría que hacer modificaciones en las partes anteriores del proceso hasta que se obtenga en resultado requerido.

Usos y beneficios de la minería de datos

La minería de datos se puede utilizar en diferentes situaciones, por ejemplo: