Calcular Media, Mediana y Moda en R: Guía Completa

Calcular Media, Mediana y Moda en R: Guía Completa

R es un lenguaje de programación estadístico ampliamente utilizado para el análisis de datos. Una de las tareas más comunes en el análisis de datos es calcular medidas de tendencia central, como la media, la mediana y la moda. Este artículo proporciona una guía detallada sobre cómo calcular estas medidas en R, incluyendo ejemplos y explicaciones para cada función.

Media en R

La media es la suma de todos los valores en un conjunto de datos dividido por el número total de valores. En R, la función mean() se utiliza para calcular la media.

Sintaxis de la Función mean()

r
mean(x, trim = 0, na.rm = FALSE)

Donde:

  • x: Es el vector o matriz que contiene los datos.
  • trim: Es un valor entre 0 y 0.5 que especifica la proporción de valores que se deben eliminar de cada extremo del conjunto de datos antes de calcular la media. Un valor de 0 significa que no se eliminan valores.
  • na.rm: Es un valor lógico que especifica si los valores NA (no disponibles) deben ser eliminados del conjunto de datos antes de calcular la media. Un valor de TRUE indica que los valores NA deben ser eliminados.

Ejemplos de mean()

«`r

Crear un vector de datos

datos <- c(1, 2, 3, 4, 5)

Calcular la media de los datos

mean(datos)

[1] 3

Calcular la media de los datos eliminando el 10% de los valores de cada extremo

mean(datos, trim = 0.1)

[1] 3

Calcular la media de los datos ignorando los valores NA

datosna <- c(1, 2, NA, 4, 5)
mean(datos
na, na.rm = TRUE)

LEER:  Guía Completa: Personaliza tus Formularios con Checkboxes y Radios en Bootstrap

[1] 3

«`

Mediana en R

La mediana es el valor central de un conjunto de datos ordenado. En R, la función median() se utiliza para calcular la mediana.

Sintaxis de la Función median()

r
median(x, na.rm = FALSE)

Donde:

  • x: Es el vector o matriz que contiene los datos.
  • na.rm: Es un valor lógico que especifica si los valores NA deben ser eliminados del conjunto de datos antes de calcular la mediana. Un valor de TRUE indica que los valores NA deben ser eliminados.

Ejemplo de median()

«`r

Crear un vector de datos

datos <- c(1, 2, 3, 4, 5)

Calcular la mediana de los datos

median(datos)

[1] 3

«`

Moda en R

La moda es el valor que aparece con mayor frecuencia en un conjunto de datos. R no tiene una función integrada para calcular la moda. Sin embargo, se puede crear una función personalizada para calcular la moda.

Función getmode() para Calcular la Moda

r
getmode <- function(v) {
uniqv <- unique(v)
uniqv[which.max(tabulate(match(v, uniqv)))]
}

Ejemplos de getmode()

«`r

Calcular la moda de datos numéricos

datos <- c(1, 2, 2, 3, 3, 3, 4, 4, 5)
getmode(datos)

[1] 3

Calcular la moda de datos de carácter

datos <- c(«A», «B», «B», «C», «C», «C», «D», «D», «E»)
getmode(datos)

[1] «C»

«`

Conclusión

Este artículo ha proporcionado una guía detallada sobre cómo calcular la media, la mediana y la moda en R. Se han presentado las funciones mean(), median() y getmode(), junto con ejemplos y explicaciones para cada función. Con estos conocimientos, puedes analizar y entender mejor tus conjuntos de datos en R.