Рецепты

SQL запросы к DataFrame

Опубликовано

Как я рассказывал – начинал я со стандартной описательной аналитики в связке Data-WareHouse (на SQL) + Excel. Так вот, придя в R мне концепция DataFrame-ов первое время очень сильно напоминала понятие таблицы из реляционной базы данных. И неперестроенные мозги первое время при работе с данными мыслили в терминах SQL-запросов. А реальные задачи уже надо было […]

Рецепты

Широкие или длинные данные

Опубликовано

Один из страшных снов аналитика это система отчетов на Excel, укоренившаяся в компании, которую на самом деле надо перевести на современные рельсы. Пример – много отчетов, которые рассылаются по е-мейлу, представляющие из себя сводные таблицы Excel, причем исходные данные для построения стерты. Отчеты эти иной раз бывают ну очень широкие, очень много показателей, отделов отражено […]

Рецепты

Созданиe WordCloud

Опубликовано

Как я рассказывал ранее — свой путь я начал с желания создавать красивые графики. Обчитавшись и насмотревшись на всякие примеры инфографики — я понял, что один из графиков которые мне совершенно необходимо иметь в своих умениях — это WordCloud (Облако слов) и т.д. Грубо говоря — это возможность масштабом показать слова согласно их весу. В […]

Рецепты

Как работать через прокси

Опубликовано

Ну и сразу, не откладывая в долгий ящик. Допустим вы сидите через корпоративный прокси. И в книге, по которой вы учитесь сказано, что файл данных взять по адресу в Интернете напрямую. Можно конечно, если не получается сделать это так как говорится в книге сначала скачать файл локально, а уж затем загрузить его в R из […]