Logo
  • Source Code
  1. Revisión de temas
  2. Formato de archivos
  • Introducción
    • Sobre nosotras
    • Resumen
    • Sobre los datos
    • Glosario
  • Revisión de temas
    • Buenas prácticas en la bioinformática
    • Formato de archivos
    • ggplot2
  • Acerca de las funciones y figuras del artículo
    • Documentación de funciones
    • Reproducción de figuras
    • Retos y problemas con el código
    • Figura 1
    • Figura 2
    • Figura 3
    • Figura 4
    • Figura 5

On this page

  • Importar datos en R
    • A) Datos separados por un valor
  • Datos en formato CSV
  • Datos en formato TSV
    • B) Archivos tipo RData
    • C) Archivos tipo RDS
    • D) Archivos de Excel

Formato de archivos

Importar datos en R

Existen distintos tipos de formatos de datos que podemos ingresar a R para su análisis. Los principales son:

A) Datos separados por un valor

Por ejemplo por comas (.csv), tab (.tsv) o espacios. Aunque la siguiente función puede leer por cualquier separador.

read.table("/path/dataset.csv", header = TRUE, delim = ",")
read.table("/path/dataset.tsv", header = TRUE, delim = "\t")
read.table("/path/dataset.", header = TRUE, delim = ",")

El parámetro header nos dice si considerar la primera fila como nombre de las variables.

También podemos leer un archivo .csv directamente:

read.csv("/path/dataset.csv")

Datos en formato CSV

Archivos separados por comas.

Este ejemplo fue obtenido del repositorio de Github de Cosmoduende.

Datos en formato TSV

Archivo separado por tabuladores.

Este ejemplo proviene de la base de datos de Arabidopsis thaliana, la planta modelo en el estudio de la genómica. Este archivo indica el tipo o característica del gen anotado en Araport11.

B) Archivos tipo RData

Usualmente cargan todo el ambiente o varias variables

load("/path/ambiente.RData")

C) Archivos tipo RDS

Se usan para cargar variables, usualmente muy pesadas

variable <- readRDS("/path/variable.RData")

D) Archivos de Excel

El paquete que vamos a emplear se llama readxl se encuentra integrado en tidyverse.

library(readxl)
# El archivo, hoja 1
costs_of_res <- read_excel("Costs_of_Res.xlsx")

Podemos cargar una hoja en especifico:

# por el nombre
read_excel(xlsx_example, sheet = "chickwts")
# por el numero de la hoja
read_excel("Costs_of_Res.xlsx", sheet = 4)