data mining

Definimos la minería de datos como aquel conjunto de técnicas, encaminadas al descubrimiento de la información existente en grandes conjuntos de datos.

¿En qué contexto surge la minería de datos?

En la actualidad, consideramos nuestro contexto histórico, como la sociedad de la información, donde las tecnologías (TIC) que ayudan a la creación, distribución y manipulación de información, facilitan las actividades sociales, culturales y económicas.

La minería de datos surge de la necesidad de manejar con eficacia, la información que se registra. Se encarga así: de preparar, sondear y explorar los datos para sacar la información oculta y útil en ellos. (Datos entendidos como agregados, como conjunto/s de datos)

Si los datos son leídos y analizados, pueden proporcionar, en conjunto, un verdadero conocimiento (futuras tendencias y comportamientos) que ayude en la toma de decisiones, ya que para el responsable de un sistema, los datos en sí no son lo más relevante, sino la información que se encierra en sus relaciones, fluctuaciones y dependencias.

Origenes de la minería de datos

La idea de Minería de Datos (Data Mining) no es nueva, solo que en los últimos 20 años ha sufrido una revolución por la cantidad de datos que se generan y almacenan, por la potencia que han alcanzado tanto los software de proceso y análisis de datos, como los hardware capaces de soportar esos software.
Ya desde los años sesenta los estadísticos manejaban términos como Data Fishing, Data Mining (DM) o Data Archaeology con la idea de encontrar correlaciones sin una hipótesis previa en bases de datos con ruido.

A principios de los años ochenta, Rakesh Agrawal, GioWiederhold, Robert Blum y Gregory Piatetsky-Shapiro entre otros, empezaron a consolidar los términos de Minería de Datos y KDD.
Las técnicas de Minería de Datos son el resultado de un largo proceso de investigación y desarrollo de productos. Esta evolución comenzó cuando los datos de negocios fueron almacenados por primera vez en computadoras y continuó con mejoras en el acceso a los datos, más recientemente con tecnologías generadas para permitir a los usuarios navegar a través de los datos en tiempo real.

¿Qué es la minería de datos?

Podemos definir la minería de datos como un conjunto de técnicas encaminadas al descubrimiento de la información contenida en grandes conjuntos de datos. Se trata de analizar comportamientos, patrones, tendencias, asociaciones y otras características del conocimiento inmerso en los datos.
En la actualidad, se dispone de grandes cantidades de datos y es más necesario que nunca poder analizarlos ordenadamente, para extraer de un modo automatizado la inteligencia contenida en ellos, utilizando técnicas especializadas y apoyadas en herramientas informáticas.

El intenso desarrollo de las herramientas de tratamiento automatizado de la información, ha llevado aparejado el uso de las técnicas estadísticas de análisis multivariante de datos de una forma sencilla. Al crecer los medios informáticos la complejidad técnica ha disminuido, estos recursos han facilitado sobremanera la manejabilidad de los algoritmos estadísticos.

Fases en minería de datos

1- Definir un problema (objetivo)

2- Preparar los datos

3- Explorar los datos

4- Crear modelos

5- Explorar y validar modelos

6- Implementar y actualizar los modelos

Algunas de las tareas más comunes en minería de datos:

1- Asociación de registros o creación/descubrimiento de grupos de registros.

2- Estimación de datos (despejando incógnitas)

3- Predicción a futuro mediante datos registrados en el pasado.

4- Determinación de grupos (Clustering) por diferentes características y atributos.

5- Reglas de asociación, que permiten identificar elementos afines.

6- Descripción y visualización de los datos estadísticos en indicadores numéricos y gráficos.

7- Machine Learning e inteligencia artificial, aprendizaje automatizado.

Descarga el .pdf de clase sobre minería de datos:

Contenido de clase sobre Minería de datos

Autor: ignacio

Profesor de Sistemas de Gestión de Información

Deja una respuesta

Tu dirección de correo electrónico no será publicada. Los campos obligatorios están marcados con *