Data Science

Diplomatura Universitaria

APRENDÉ CON

LOS QUE HACEN

Mundos E y la UNC te invitan a aprender de la mano de los expertos.

DATA SCIENCE es una disciplina emergente en los nuevos escenarios comerciales e institucionales que plantea el desafío de transformar grandes volúmenes de datos en decisiones estratégicas. Nos enfrenta a la tarea de sistematizar, visualizar, procesar y analizar datos de manera precisa y eficaz. 
En este programa conocerás el ciclo de vida completo de los datos: desde la obtención y limpieza, hasta su visualización y análisis. Aprenderemos sobre las habilidades y conocimientos indispensables para comenzar a trabajar en los distintos roles de un proyecto de ciencia de datos: Data Engineering, Data Analyst, Data Scientist.
Duración

Duración

7 meses

Inicio

Inicio

Miércoles 23 OCT

Horario

Horario

20h a 22h | ARG 18h a 20h | PER 18h a 20h | EC 18h a 20h | COL 17h a 19h | MEX 17h a 19h | CRI 17h a 19h | GTM

Modalidad

Modalidad

ONLINE

OBJETIVOS DEL PROGRAMA

Imagen Objetivo

HABILIDADES PROFESIONALES

Desarrollá habilidades profesionales para desempeñarte como cientista de datos.

Imagen Objetivo

CREÁ TU PROYECTO

Entrenar habilidades para la creación de un proyecto de ciencia de datos.

Imagen Objetivo

CREÁ COMUNIDAD

Construí una comunidad de práctica profesional para quienes se están formando como científicas/os de datos.

Imagen Objetivo

APLICÁ HERRAMIENTAS

Aplicarás herramientas específicas y concretas para llevar adelante los diferentes roles de la persona científica de datos: analista, ingeniera y científica.

Imagen Objetivo

PRACTICÁ

Desarrollarás prácticas que integren conocimientos de diferentes campos (matemática, programación, comunicación y estadística).

Imagen Objetivo

BUENAS PRÁCTICAS

Fomentaremos buenas prácticas desde el rol de cientista de datos.

DIPLOMATURA UNC

Mundos E y la UNC te ofrecen el programa más completo.

Creamos un mundo digital para impulsar la transformación del aprendizaje.

Todos nuestros programas cuentan aval y sello de calidad certificado por la Universidad Nacional de Córdoba y la Facultad de Ciencias Exactas, Físicas y Naturales.

¡Potencia tu aprendizaje!

Imagen Certificación

QUÉ INCLUYE ESTE PROGRAMA

CONTENIDOS

INTRODUCCIÓN A LA CIENCIA DE DATOS

  • La sociedad de la información. Datos, información, conocimiento.
  • ¿Qué es un dato? Ciclo de vida de los datos. Gobernanza sobre los datos.
  • ¿Qué es la ciencia de datos? Diseño de un proyecto de ciencia de datos. Roles.

PROGRAMACIÓN PARA LA CIENCIA DE DATOS I

  • Conceptos básicos de programación: comandos, funciones y objetos 
  • Objetos en R: Vectores, Matrices y Data Frames
  • Estructuras de Control

MANIPULACIÓN DE DATOS EN R

  • El proceso ETL (extracción, transformación y limpieza de datos)
  • Importar y exportar datos desde diferentes formatos en R
  • Manejo de fechas en R (Date, POSIXlt, POSIXct)
  • Manipulación de datos con R

ANÁLISIS DE DATOS I

  • Población y muestra. Parámetros y estimadores.
  • Estadísticos descriptivos para el análisis exploratorio de datos.
  • Variables aleatorias y distribuciones de probabilidad.

ANÁLISIS DE DATOS II

  • Contrastes de hipótesis. Errores Tipo I y Tipo II
  • P-valor y el test de hipótesis para la media
  • Contraste de hipótesis para la varianza

CORRELACIÓN Y CAUSALIDAD DE DATOS

  • Correlación simple: paramétrica y no paramétrica
  • Pruebas de hipótesis de correlación
  • Diferencias entre la correlación y la causalidad

VISUALIZACIÓN DE DATOS I

  • Tipos de gráficos y su correcto uso
  • Creación de gráficos unidimensionales y bidimensionales con R
  • Creación de gráficos con ggplot

VISUALIZACIÓN DE DATOS II

  • Construcción de un tablero de visualización
  • Buenas prácticas para la confección de visualizaciones
  • Storytelling: Contar historias con datos

BASES DE DATOS I

  • Datos estructurados vs no estructurados. Gestores de base de datos
  • Modelo relacional y estructura de una base de datos
  • SQL y Data Definition Languaje (DDL)

BASES DE DATOS II

  • SQL y Data Manipulation Languaje (DML).
  • Agregación en SQL.
  • Operaciones SQL sobre varias tablas simultáneas.

BIG DATA Y ARQUITECTURA EN LA NUBE

  • Big Data y el trabajo con grandes volúmenes de datos.
  • Servicios de infraestructura en la nube.
  • Lenguajes, algoritmos y técnicas para trabajar con Big Data.

PROGRAMACIÓN PARA LA CIENCIA DE DATOS II

  • Conceptos básicos de programación aplicados en Python
  • Objetos de Python: listas, tuplas y diccionarios 
  • Estructuras de control en Python
  • Librería Pandas y Data Frames

ANÁLISIS PREDICTIVO Y LA REGRESIÓN LINEAL – AVANCES PIN

  • ¿Qué es el análisis predictivo? Interpolación y extrapolación
  • Modelos. Problemas de regresión, clustering y clasificación
  • Fundamentos de la regresión lineal: mínimos cuadrados, supuestos y estimación de parámetros

Encuentro 15

MODELO DE REGRESIÓN LINEAL MÚLTIPLE

  • Fundamentos de un modelo de regresión lineal múltiple
  • Sistemas de selección de variables

INTRODUCCIÓN AL MACHINE LEARNING

  • Machine Learning. Aprendizaje supervisado vs no supervisado
  • Ciclo de trabajo para el desarrollo de un modelo de ML
  • Armado de un Dataset en Python para entrenamiento y testeo de un modelo de ML

MODELOS DE REGRESIÓN CON ML

  • Modelos de regresión con ML (Random Forest, eXtreme Gradient Boosting, SVM)
  • ¿Qué es un algoritmo de optimización?
  • Ajuste y sobreajuste
  • Técnicas y métricas de evaluación de modelos de regresión

MODELOS DE CLUSTERING

  • Definición de cluster. Similitud y segmentación.
  • Medidas de distancia
  • Evaluación de clusters

MODELOS DE CLASIFICACIÓN DE MACHINE LEARNING

  • Modelos de clasificación con ML (Logistic Regression, k-NN, Árboles de decisión, SVM, Naive Bayes)
  • Dificultades en el entrenamiento: overfitting y underfitting
  • Métricas de evaluación de modelos de clasificación

INTRODUCCIÓN A LAS REDES NEURONALES

  • El Perceptrón simple
  • Perceptrones multicapa: capacidad de generalización
  • Entrenamiento de una Red Neuronal. Cálculo de gradientes usando propagación inversa
  • Mapeo de características

APRENDIZAJE PROFUNDO (DEEP LEARNING)

  • Redes neuronales recurrentes y convolucional
  • Transfer learning con modelos pre entrenados

MODELOS DE DETECCIÓN DE OBJETOS

  • ¿Qué es la detección de objetos?
  • Aplicación de YOLO v5 en un caso de estudio 
  • Métricas para evaluar un modelo de detección

MODELOS DE PROCESAMIENTO DEL LENGUAJE NATURAL (NLP)

  • Tratamiento de textos. Modelización del lenguaje y vectores de palabras
  • Procesamiento de lenguaje natural con GPT-3 de OpenAI

INTRODUCCIÓN A GIT

  • Control de versiones. Colaborar utilizando GitHub.
  • Repositorios locales y remotos, directorio de trabajo y commit
  • Comandos básicos (clone, branch, add, commit, push, pull)

HACKATÓN

Aprendé con los que saben

NUESTROS ENTRENADORES

Nuestro equipo de entrenadores son seleccionados a través de un riguroso proceso en el que se evalúa el éxito real en el área en la cual van a transmitir sus conocimientos. A demás nuestro staff de anfitriones te acompañara de principio a fin en cada paso para construir juntos la mejor experiencia de aprendizaje y potenciar tu futuro.

Imagen Profesor
Andrés Díaz Pace
  • Investigador, docente, y consultor.
  • Doctor en Cs. de la Computación.
  • Certificaciones en Big Data y Cloud ComputingDirector de la Diplomatura Universitaria en IA (UNICEN, 2020-2021)
Imagen Profesor
Myrian Aguilar
  • Profesional Adjunto- CPA y  Data Analyst en CIM-UNLP-CONICET
  • Coordinadora de Programa “Ambiente y Salud Comunitaria” Secretaría de Extensión UNLP
  • Prof. Jefa Dpto. Química EEST 8  Fundadora de  Campus Arrayanes
Puntos Puntos

Consultá ahora