Un data frame es una estructura bidimentional puede almacenar datos mixtos. Un data frame es un caso particular de lista. Es una lista de vectores de la misma longitud.
Crear un data frame
Podemos crear un data frame usando la función data.frame().
En general no vamos a crear el data frame desde cero, sino que lo crearemos al importar datos desde un fichero (txt, excel, csv, tsv, etc..). Por ejemplo vamos a importar el dataset palmerpenguins desde un archivo csv, usando la función read.csv(), algunas funciones similares son read.table(), read.delim(). El paquete readxl permite extraer datos directamente de archivos xlsx.
Seleccionar elementos de un data frame funciona de manera similar a seleccionar los elementos de un vector, pero hay que tener en cuenta que el data frame tiene dos dimensiones. En este caso se debe de indicar la fila y la columna ([fila, columna]). Si se deja en blanco alguna posición, indica que se seleccionan todos los valores, es decir df es equivalente a df[ , ].
Seleccionar columnas.
Al seleccionar una columna se tiene como resultado un vector con todos los valores. Hay 3 maneras de seleccionar una columna. Usando la posición, el nombre o usando el método con $.
head(df$bill_length_mm)
[1] 39.1 39.5 40.3 36.7 39.3 38.9
head(df[, 3])
[1] 39.1 39.5 40.3 36.7 39.3 38.9
head(df[, c('bill_length_mm')])
[1] 39.1 39.5 40.3 36.7 39.3 38.9
Seleccionar filas
En general usaremos un vector indice para selecionar las filas. En este caso el resultado es un data frame con las filas seleccionadas.