El presente curso se encuentra orientado a que los estudiantes desarrollen destrezas para
utilizar apropiadamente las diversas técnicas existentes en cada una de las fases de la
extracción de conocimiento a partir de diferentes tipos de datos. Dentro de los retos
buscados, los estudiantes deben ser capaces de reconocer las metodologías y técnicas
apropiadas para resolver distintos problemas, conociendo tanto sus alcances como sus
limitaciones.
++++++++++++++++++
El curso se ha distribuido en ocho capítulos, contemplando los tópicos de
ciencia de datos de mayor interés para los estudiantes de nuestra Facultad.
-
En el Capítulo I se presentan los conceptos y herramientas básicas. El Capítulo II aborda los distintos tipos
de datos y su adquisición/recopilación a través de diversas fuentes.
-
Tanto el análisis inicial como el análisis exploratorio de los datos se presentan en el Capítulo III.
En la etapa inicial se trata de comprender los datos antes de realizar un análisis más detallado,
identificando errores y problemas que puedan afectar la calidad de los resultados del análisis posterior.
En el análisis exploratorio de los datos se investigan y resumen sus características principales. Esto
permite tomar decisiones informadas sobre cómo proceder con el análisis y modelado subsiguiente.
El Capítulo III se complementa con la etapa del proceso en la que se combinan y unifican diferentes
fuentes de datos para crear un conjunto de datos coherente y completo. Además, se analiza la selección
de los atributos a ser considerados para el análisis.
-
Luego, en los Capítulos IV y V, se aborda el aprendizaje automático, enfocado en el desarrollo de modelos
que permitan a las computadoras aprender a partir de los datos y realizar tareas específicas sin ser
programadas explícitamente. Se presenta el aprendizaje no supervisado, en el que un modelo busca patrones
y relaciones en un conjunto de datos sin la ayuda de etiquetas o respuestas previas, y el aprendizaje
supervisado, en el que un modelo es entrenado utilizando un conjunto de datos previamente etiquetados o
clasificados para predecir la variable objetivo para nuevas entradas.
-
En los dos capítulos siguientes, se abordan dos tópicos específicos de interés. Por un lado, en el Capítulo VI
se detalla el aprendizaje profundo a través de las redes neuronales. Siendo éste una rama del aprendizaje
automático que se caracteriza por procesar datos complejos con una precisión y velocidad mucho mayor que los
métodos tradicionales. Por el otro, en el Capítulo VII se analiza el caso particular de las series temporales
en el contexto de la ciencia de datos. Se presentan diversos modelos específicos.
-
Finalmente, debido a la dinámica que representan los contenidos de la asignatura, el Capítulo VIII se deja sin
especificar. El mismo abarca diferentes tópicos particulares y/o relevantes que se irán actualizando según la
oferta o demanda. Cabe señalar que, cada uno de los temas a desarrollar, cuenta con un soporte adecuado de
visualización y con una práctica orientada a los temas de interés de un astrónomo/a, un geofísico/a y/o un
meteorólogo/a.
|