Рецепты

Подключение к базам данных

Опубликовано

Читая книжки про DataScience или визуализацию, периодически мне приходили идеи, как использовать тот или иной рецепт в реальной работе. Но проблема заключалась в том, что во всех книжках примерами выступают либо csv-файлы, либо сайты, либо вообще встроенные наборы данных. Рабочие же данные у меня хранятся в основном на Oracle. Конечно, можно было бы писать скрипт […]

Рецепты

SQL запросы к DataFrame

Опубликовано

Как я рассказывал – начинал я со стандартной описательной аналитики в связке Data-WareHouse (на SQL) + Excel. Так вот, придя в R мне концепция DataFrame-ов первое время очень сильно напоминала понятие таблицы из реляционной базы данных. И неперестроенные мозги первое время при работе с данными мыслили в терминах SQL-запросов. А реальные задачи уже надо было […]

Рецепты

Широкие или длинные данные

Опубликовано

Один из страшных снов аналитика это система отчетов на Excel, укоренившаяся в компании, которую на самом деле надо перевести на современные рельсы. Пример – много отчетов, которые рассылаются по е-мейлу, представляющие из себя сводные таблицы Excel, причем исходные данные для построения стерты. Отчеты эти иной раз бывают ну очень широкие, очень много показателей, отделов отражено […]

Рецепты

Созданиe WordCloud

Опубликовано

Как я рассказывал ранее — свой путь я начал с желания создавать красивые графики. Обчитавшись и насмотревшись на всякие примеры инфографики — я понял, что один из графиков которые мне совершенно необходимо иметь в своих умениях — это WordCloud (Облако слов) и т.д. Грубо говоря — это возможность масштабом показать слова согласно их весу. В […]

Рецепты

Как работать через прокси

Опубликовано

Ну и сразу, не откладывая в долгий ящик. Допустим вы сидите через корпоративный прокси. И в книге, по которой вы учитесь сказано, что файл данных взять по адресу в Интернете напрямую. Можно конечно, если не получается сделать это так как говорится в книге сначала скачать файл локально, а уж затем загрузить его в R из […]

Основная

Мой путь в Data Science

Опубликовано

Как обещал – рассказываю свою историю, как я пришел к изучению Data Science. Итак Казалось бы, ничего не предвещало… Работаю давно и упорно в области бизнес-аналитики в крупной коммерческой компании (реально крупной). SQL, Excel, VBA, BusinessObject, PowerPoint, созданная собственная DataWareHouse. Тысячи отчетов, много унаследованных от времен динозавров. Отчеты периодические и разовые, сложные и простые, ручные […]

Основная

Еще один блог. Зачем?

Опубликовано

Всем привет. Это первая запись в блоге. В ней я хочу поделиться некоторыми соображениями, которые подвигли меня на создание этого блога. Свою историю я расскажу подробней чуть позже– а пока хочу сказать, что когда я познакомился с языком R, идеей Data Science – несмотря на то, что на русском языке уже были некоторые материалы, но […]