하나의 파일 안에 똑같은 내용의 string(또는 토큰)이 얼마나 있는지 빈도수를 알고 싶을 때 다음과 같이 awk를 이용하면 편하다.

 

$ cat output1.txt
US
TH
x
x
x
TH
x
x
TH
x
x
x

 

 

$ awk '{ arr[$0]++ }END{for ( i in arr ) { print i, arr[i] } }' output1.txt
TH 3
x 8
US 1
Posted by '김용환'
,