CONTENIDO
MODULO 1: INTRODUCCIÓN A R
Importancia de R
Breve descripción de R
Instalación de R y RStudio
Descarga e instalación de R
Introducción a RStudio y RStudio Cloud
MODULO 2: ANÁLISIS DE DATOS EMPRESARIALES CON R
- Introducción al análisis multivariado
¿Qué son los datos multivariados y como los empleamos?
Covarianzas y correlaciones de datos
Distribución Normal y covarianza de datos multivariados
Ejemplo de aplicación de análisis de covarianzas y Normal multivariable
- Análisis visual de Datos Multivariados
Leyendo datos de un archivo externo y acondicionando el data frame
Técnicas de Graficación para el análisis multivariado de datos
Analizando patrones de datos mediante librerías de graficación
Predicción de tendencias usando parámetros estadísticos
- Análisis de clusters
Analizando datos mediante clústeres
Introducción
Métodos jerárquicos
Métodos de agrupamiento no jerárquicos
Técnicas de k-medias
- Análisis de componentes principales
Cálculo de los componentes principales
Variabilidad explicada por los componentes
Criterios para determinar el número de componentes principales
Aplicación de los componentes principales
- Análisis discriminante
Etapas para realizar un análisis discriminante
Análisis discriminante múltiple
Interpretación de resultados y mapa territorial
MODULO 3: APLICACIONES DE CIENCIAS DE DATOS EN LOS NEGOCIOS ACTUALES
Desarrollo de sistema de recomendación de producto
Desarrollo de un sistema para la detección de fraudes
Desarrollo de modelo de puntaje crediticio
CIENCIA DE DATOS CON R
La ciencia de datos está transformando la manera en cómo las organizaciones trabajan con sus datos, ya que permite generar información más precisa, confiable, en tiempo real y que sustenta además de una toma de decisiones histórica, una estrategia proactiva. Con estas herramientas, las empresas modernas están automatizando procesos capaces de tomar decisiones autónomas lo que se convierte en una ventaja competitiva en el mercado actual.
En este curso aprenderás no solo como funcionan las herramientas de la ciencia de datos (Data Science) sino aplicarlas de forma sencilla con uno de los ambientes de análisis mayormente aceptados como lo es “R”. El lenguaje R es un lenguaje de programación comúnmente usado.