Созданиe WordCloud

Опубликовано Опубликовано в рубрике Рецепты

Как я рассказывал ранее — свой путь я начал с желания создавать красивые графики. Обчитавшись и насмотревшись на всякие примеры инфографики — я понял, что один из графиков которые мне совершенно необходимо иметь в своих умениях — это WordCloud (Облако слов) и т.д. Грубо говоря — это возможность масштабом показать слова согласно их весу. В практическом применении это могут быть пары, например «Магазин-отгрузка», «Статья расхода — сумма», «Город — удаление» и прочая-прочая…
Я был готов к тому, что это будет трудная и долгая работа. Каково же было мое удивление, что это в R на самом деле делается всего двумя строчками. Подключить библиотеку (перед этим ее надо будет установить один раз) и вывести график.
Для примера, я взял Конституцию РФ, сделал из нее BagOfWords (грубо говоря — весь текст разбил на отдельные слова) и после посчитал количество упоминаний этого слова в тексте. То есть у меня получились следующие пары: «Слово-количество». Эти данные я выложил тут, и теперь могу показать короткий код:

newdat <- read.csv(file = 'http://ru-datascience.ru/wp-content/uploads/2015/08/data.csv')

library(RColorBrewer)

pal <- brewer.pal(9,"Set1")

library(wordcloud)

wordcloud(newdat$word, newdat$qty,scale=c(5,0.3),1,2400,FALSE,TRUE,0,pal)

То есть — загружаем файл, загружаем две библиотеки (для красивых цветов и для самого графика) и выводим картинку.
Получилась такая красота:
WordCloud Конституции РФ

Теперь вы понимаете, что при такой простоте (кажущейся на самом деле, но для меня тогда это казалось очень просто) — останавливаться только на графиках в R было бы не разумно. Если сложное так просто делать…
Кто такое просто сделает в Excel ???

Созданиe WordCloud: 1 комментарий

Добавить комментарий