read.table("/path/dataset.csv", header = TRUE, delim = ",")
read.table("/path/dataset.tsv", header = TRUE, delim = "\t")
read.table("/path/dataset.", header = TRUE, delim = ",")
Formato de archivos
Importar datos en R
Existen distintos tipos de formatos de datos que podemos ingresar a R para su análisis. Los principales son:
A) Datos separados por un valor
Por ejemplo por comas (.csv), tab (.tsv) o espacios. Aunque la siguiente función puede leer por cualquier separador.
El parámetro header nos dice si considerar la primera fila como nombre de las variables.
También podemos leer un archivo .csv directamente:
read.csv("/path/dataset.csv")
Datos en formato CSV
Archivos separados por comas.
Este ejemplo fue obtenido del repositorio de Github de Cosmoduende.
Datos en formato TSV
Archivo separado por tabuladores.
Este ejemplo proviene de la base de datos de Arabidopsis thaliana, la planta modelo en el estudio de la genómica. Este archivo indica el tipo o característica del gen anotado en Araport11.
B) Archivos tipo RData
Usualmente cargan todo el ambiente o varias variables
load("/path/ambiente.RData")
C) Archivos tipo RDS
Se usan para cargar variables, usualmente muy pesadas
<- readRDS("/path/variable.RData") variable
D) Archivos de Excel
El paquete que vamos a emplear se llama readxl
se encuentra integrado en tidyverse
.
library(readxl)
# El archivo, hoja 1
<- read_excel("Costs_of_Res.xlsx") costs_of_res
Podemos cargar una hoja en especifico:
# por el nombre
read_excel(xlsx_example, sheet = "chickwts")
# por el numero de la hoja
read_excel("Costs_of_Res.xlsx", sheet = 4)