Fundamentos de analisis de datos

Miguel Alejandro Salgado Zapien

2021-05-06

Unidad 1 - Tema 3 - Fundamentos de análisis análisis de datos

¿Que es el análisis de datos?

es un proceso que consiste en inspeccionar, limpiar y transformar datos con el objetivo de resaltar información útil…

Wikipedia

¿Que hacemos para Analizar Datos?

En general para cuando analizaremos datos realizando búsquedas sobre los datos, cálculos, o relacionando datos de distintos orígenes, estructuras, o valores, para encontrar patrones que puedan ser de relevancia.

Ejemplos

Las siguientes pueden considerarse análisis de datos:

Y realizamos un análisis final de Obesidad por región.

Por región

Lo importarte es entender los datos

Una vez que entiendes los datos con los que estas trabajando, realizar operaciones de análisis se vuelve sencillo si son pocos datos, como los ejemplos anteriores.

Entender el tipo de datos que tenemos nos ayudara a realizar análisis mas eficiente, ya que podremos realizar preguntas o buscar relaciones entre los datos mas especificas, y de esa manera inferir cosas de mayor utilidad o relevancia.

Aplicándolo

Este ejemplo respecto a el indice de masa corporal y la regiones en el mapa, puede sonar un problema sencillo, pero observen la complejidad de pasos que se deben de realizar (conceptualmente).

En una organización si tenemos datos digitales, podemos intentar analizarlos, para analizarlos de manera efectivas no tenemos que entender los datos en su totalidad.

Rara vez es el caso en que entendemos los datos en su totalidad.

Lo importante es técnicas y herramientas apropiadas para analizarlo, y tener maneras de inferir cosas respecto a los datos, ya sea por exploración y análisis de los datos mismos, o teniendo cerca a un experto en el dominio de origen de los datos.

Una de las primeras cosas que buscamos hacer desde que obtenemos conjuntos de datos o acceso a ellos, es tratar de obtener resúmenes de los datos.

En caso de tener acceso a una base de datos tipo SQL buscamos

En general tenemos datos de manera tabular buscamos, (csv, una tabla de base de datos, xls, etc…).

Cuando tenemos un objeto, (json, yaml, toml, xml, etc…)

Cuando tengo un archivo de media, (imagen, audio, vídeo) generalmente se busca:

Hay que estar preparado para recibir cualquier tipo de dato, y lograr realizar un análisis mínimo apartar de la información que inferimos de manera correcta al realizar inspecciones como las previamente mencionadas.

Un siguiente paso seria analizar los datos como conjuntos, y empezar a expresar información respecto a los datos que se esta trabajando, mediante el uso de gráficos o mediante interpretaciones distintos conjuntos de datos.

El análisis de datos nos va a resultar en información útil para la toma de decisiones.

Ademas el análisis de datos nos va ayudar a entender los problemas y las situaciones que originan los datos mismos que estamos analizando.

Tipos de análisis de datos

Análisis descriptivo

Este tipo de análisis se enfoca en describir datos, se utiliza para analizar datos de eventos pasados o cúmulos de datos no necesariamente dependientes del tiempo,

Análisis predictivo

Es el tipo de análisis que se enfoca en predecir sucesos o ubicar relaciones, donde a partir de un conjunto de datos pasados se produce un valor de pronostico, o si se tiene datos y se busca relacionarlos, un análisis predictivo seria una propuesta de relación significativa y para datos que desconocemos.

Para este tipo de análisis tenemos que tener información para apartar de esta intentar predecir

Actividad

Producir un diagrama de organización de datos donde se especifique tipos de datos en la fuente, (formatos, estructuras, dominio de originen, fuente de origen).

Presentar una propuesta de como proceder a realizar una obtención de los datos considerando las fuentes mencionadas.

Proponer agrupamientos de datos para analizar dichos agrupamiento.

Deberán presentar el código e imagen del diagrama, y un documento donde se detalle lo previamente especificado.

Método de entrega

Pendiente