R
[R] 문자열을 토큰으로 나누기 (strsplit)
'김용환'
2016. 1. 6. 14:01
R에서 strsplit()으로 문자열을 토큰으로 나눌 수 있다.
strsplit()이 벡터도 처리할 수 있어서 list로 리턴한다. 이를 unlist() 호출해서 배열로 바꾸고, index로 접근한다.
> string <- "I like starwars"
> splat <- strsplit(string, " ")
> splat
[[1]]
[1] "I" "like" "starwars"
> typeof(splat)
[1] "list"
> data <- unlist(splat)
> data
[1] "I" "like" "starwars"
> data[0]
character(0)
> data[1]
[1] "I"
> data[2]
[1] "like"
>
>
>
> strings <- c("2015:starwars", "2014:rings")
> splats <- strsplit(strings, ":")
> splats
[[1]]
[1] "2015" "starwars"
[[2]]
[1] "2014" "rings"
> data <- unlist(splat)
> data
[1] "I" "like" "starwars"
> data[0]
character(0)
> data[1]
[1] "I"
> data[2]
[1] "like"
>