2014년 11월 19일 수요일

에러 로그 word cloud III

 
## alert log file 분석
## 공백은 '_' 언더바로 변경


rm(list=ls(all=T))


## 0. load library

        library(KoNLP)
        library(wordcloud)
        library(RColorBrewer)
        getwd()

## 1. read data
        txt = readLines("data/Part_1/LEVEL_1/alert_log.txt")
        head(txt, 30)

## 2. 공백 => 하이픈 변경
        txt = gsub(" ","_",txt)
        head(txt,30)

## 3. extract Nouns
        txt_nouns = unlist(txt)
        str(txt_nouns)
        txt_nouns = Filter(function(x){ nchar >=15 },txt_nouns) ## 15글자 이상만 필터링
        head(txt_nouns,30)

## 4. save
        write(unlist(txt_nouns),"alert_2.txt")

       
## 5. read table
        rev = read.table("alert_2.txt")
        nrow(rev)
        wordcount = table(rev)
        head(sort(wordcount, decreasing=T),10)

## 6. wordcloud
        windows()
        palete = brewer.pal(9,"Set1")
       
        wordcloud(names(wordcount), feq = wordcount, scale = c(5,0,5), rot.per = 0.25, min.freq = 3, random.order = F, random.color = T, colors = palete) ## 3회 이상만 출력


## 7. savePlot
        savePlot("alert_2.jpg",type="jpg")

결과)

댓글 없음 :

댓글 쓰기