Ciencia de Datos

++++++++++++++++++

Enlaces

++++++++++++++++++

Documentos

++++++++++++++++++

Institucional

FCAG
UNLP

Contenido

El presente curso se encuentra orientado a que los estudiantes desarrollen destrezas para utilizar apropiadamente las diversas técnicas existentes en cada una de las fases de la extracción de conocimiento a partir de diferentes tipos de datos. Dentro de los retos buscados, los estudiantes deben ser capaces de reconocer las metodologías y técnicas apropiadas para resolver distintos problemas, conociendo tanto sus alcances como sus limitaciones.

++++++++++++++++++

El curso se ha distribuido en ocho capítulos, contemplando los tópicos de ciencia de datos de mayor interés para los estudiantes de nuestra Facultad.

En el Capítulo I se presentan los conceptos y herramientas básicas. El Capítulo II aborda los distintos tipos de datos y su adquisición/recopilación a través de diversas fuentes.
Tanto el análisis inicial como el análisis exploratorio de los datos se presentan en el Capítulo III. En la etapa inicial se trata de comprender los datos antes de realizar un análisis más detallado, identificando errores y problemas que puedan afectar la calidad de los resultados del análisis posterior. En el análisis exploratorio de los datos se investigan y resumen sus características principales. Esto permite tomar decisiones informadas sobre cómo proceder con el análisis y modelado subsiguiente. El Capítulo III se complementa con la etapa del proceso en la que se combinan y unifican diferentes fuentes de datos para crear un conjunto de datos coherente y completo. Además, se analiza la selección de los atributos a ser considerados para el análisis.
Luego, en los Capítulos IV y V, se aborda el aprendizaje automático, enfocado en el desarrollo de modelos que permitan a las computadoras aprender a partir de los datos y realizar tareas específicas sin ser programadas explícitamente. Se presenta el aprendizaje no supervisado, en el que un modelo busca patrones y relaciones en un conjunto de datos sin la ayuda de etiquetas o respuestas previas, y el aprendizaje supervisado, en el que un modelo es entrenado utilizando un conjunto de datos previamente etiquetados o clasificados para predecir la variable objetivo para nuevas entradas.
En los dos capítulos siguientes, se abordan dos tópicos específicos de interés. Por un lado, en el Capítulo VI se detalla el aprendizaje profundo a través de las redes neuronales. Siendo éste una rama del aprendizaje automático que se caracteriza por procesar datos complejos con una precisión y velocidad mucho mayor que los métodos tradicionales. Por el otro, en el Capítulo VII se analiza el caso particular de las series temporales en el contexto de la ciencia de datos. Se presentan diversos modelos específicos.
Finalmente, debido a la dinámica que representan los contenidos de la asignatura, el Capítulo VIII se deja sin especificar. El mismo abarca diferentes tópicos particulares y/o relevantes que se irán actualizando según la oferta o demanda. Cabe señalar que, cada uno de los temas a desarrollar, cuenta con un soporte adecuado de visualización y con una práctica orientada a los temas de interés de un astrónomo/a, un geofísico/a y/o un meteorólogo/a.