
Licenciatura en Estudios Internacionales
Taller de Estadística: Introducción a R
Prof. René Canales
Asistente de Investigación FONDECYT 1250518
Bremen International Graduate School of Social Sciences (BIGSSS)
Universität Bremen
Asistente de Investigación FONDECYT 1250518
R es un lenguaje de programación estadística de código abierto, diseñado para:
Nota
R es gratuito, multiplataforma y tiene una comunidad académica muy activa.
Creado por: Ross Ihaka y Robert Gentleman (1993)
Versión actual: R 4.x
RStudio es un entorno de desarrollo integrado (IDE) que hace R más fácil de usar.
R es el motor 🔧
RStudio es el tablero de control 🖥️
Puedes usar R sin RStudio, pero RStudio no funciona sin R.
Ventajas de RStudio:
La interfaz de RStudio tiene 4 paneles principales:
① Script / Editor
Donde escribes y guardas tu código R.
② Consola (Console)
Donde se ejecuta el código y ves los resultados.
③ Entorno (Environment)
Muestra los objetos y variables activos.
④ Panel Inferior Derecho
Archivos, Gráficos, Paquetes y Ayuda.

R puede usarse como una calculadora directamente en la consola:
Tip
Todo lo que va después de # es un comentario y R lo ignora. ¡Úsalos para documentar tu código!
En R, todo es un objeto. Los objetos almacenan información y tienen un tipo.
Importante
El operador <- se usa para asignar valores a objetos (también puedes usar =).
| Tipo | Descripción | Ejemplo |
|---|---|---|
numeric |
Números reales | 3.14, 100 |
integer |
Números enteros | 1L, 42L |
character |
Texto | "hola", "Bremen" |
logical |
Verdadero/Falso | TRUE, FALSE |
factor |
Niveles | factor("alto", "bajo") |
NA |
Valor faltante | NA |
Una variable es un nombre que apunta a un objeto almacenado en memoria.
Tip
Usa nombres descriptivos: edad_promedio es mejor que ep o var1.
El vector es la estructura de datos más básica en R: una secuencia de elementos del mismo tipo.
# Crear vectores con c()
edades <- c(23, 31, 28, 25, 19)
nombres <- c("Ana", "Luis", "María", "Pedro", "Carla")
activos <- c(TRUE, FALSE, TRUE, TRUE, FALSE)
# Acceder a elementos (índice desde 1)
edades[1] # 23 (primer elemento)
edades[2:4] # 31 28 25 (elementos 2 al 4)
nombres[c(1,3)] # "Ana" "María"
# Operaciones sobre vectores
mean(edades) # Promedio → 25.2
sum(edades) # Suma → 126
length(edades) # Cantidad de elementos → 5Un data frame es una tabla de datos donde cada columna es una variable y cada fila es una observación.
# Crear un data frame
estudiantes <- data.frame(
nombre = c("Ana", "Luis", "María", "Pedro"),
edad = c(23, 31, 28, 25),
nota = c(6.5, 5.8, 6.9, 6.1),
activo = c(TRUE, FALSE, TRUE, TRUE)
)
# Explorar el data frame
head(estudiantes) # Primeras 6 filas
str(estudiantes) # Estructura
dim(estudiantes) # Dimensiones (filas, columnas)
nrow(estudiantes) # N° filas → 4
ncol(estudiantes) # N° columnas → 4# Por nombre de columna (con $)
estudiantes$nombre # Vector de nombres
estudiantes$edad # Vector de edades
# Por posición [fila, columna]
estudiantes[1, ] # Primera fila completa
estudiantes[, 2] # Segunda columna completa
estudiantes[2, 3] # Fila 2, Columna 3 → 5.8
# Filtrar filas con condiciones
estudiantes[estudiantes$activo == TRUE, ]
estudiantes[estudiantes$nota >= 6.5, ]
# Estadísticas por columna
mean(estudiantes$nota) # Promedio de notas
summary(estudiantes) # Resumen estadísticoEn la práctica, cargaremos datos desde archivos externos:
# CSV (comma-separated values)
datos <- read.csv("mi_archivo.csv")
# Con separador punto y coma (común en Europa/LatAm)
datos <- read.csv2("mi_archivo.csv")
# Excel (requiere paquete readxl)
# install.packages("readxl")
library(readxl)
datos <- read_excel("mi_archivo.xlsx")
# Ver los primeros registros
head(datos)
summary(datos)Tip
Usa Proyectos de RStudio para mantener organizados tus archivos y rutas de trabajo.
Los paquetes son colecciones de funciones que extienden las capacidades de R.
# Instalar un paquete (solo una vez)
install.packages("tidyverse")
# Cargar un paquete (cada sesión)
library(tidyverse)
# Paquetes esenciales para comenzar:
install.packages(c(
"tidyverse", # Manipulación y visualización de datos
"readxl", # Leer archivos Excel
"janitor", # Limpieza de datos
"skimr" # Resúmenes estadísticos
))dplyrRecodificar significa cambiar los valores de una variable: renombrar categorías, colapsar grupos o crear nuevas etiquetas.
Nota
¿Cuándo usar recode()?
case_when()Cuando la recodificación depende de condiciones lógicas, case_when() es más flexible que recode().
Tip
case_when() trabaja con rangos y condiciones, no solo valores exactos. Ideal para variables numéricas continuas.
¿Preguntas?
René Canales
rene.canales@usach.cl