2016-10-15

Contar elementos únicos de una cadena de texto en R

Title

Problema

Dada una cadena de texto queremos contar el número de veces que aparecen los elmentos 'A', 'C', 'G', y 'T'.

v <- c("AGCTTTTCATTCTGACTGCAACGGGCAATATGTCTCTGTGTGGATTAAAAAAAGAGTGTCTGATAGCAGC")
# Si importamos un fichero que contiene la cadena de texto
v <- readLines("rosalind_dna.txt")

Solución

  • Paquete base
  • table(strsplit(v, NULL)[[1]])
    
    A  C  G  T 
    20 12 17 21 
    
  • Paquete stringr para la manipulación de cadenas de texto
  • library(stringr)
    # 1 - Elementos codificados a mano
    str_count(v, c("A", "C", "G", "T")) 
    # 2 - Extrae alfabéticamente elementos únicos
    str_count(v, sort(unique(strsplit(v, NULL)[[1]]))) 
    
    [1] 20 12 17 21
    

Referencias

No hay comentarios:

Publicar un comentario

Nube de datos