Що нового?

Придбаний [Нетологія] Python для роботи з даними. 2020 (Олег Булигін, Костянтин Башевий)

Інформація про покупку
Тип покупки: Складчина
Ціна: 13603 ГРН
Учасників: 0 з 100
Організатор: Відсутній
Статус: Набір учасників
Внесок: 141.5 ГРН
0%
Основний список
Резервний список

Gadzhi

Модератор

Завдання по роботі з даними затребувані у всіх областях:від банківської сфери та ІТ до важкої промисловості і сільського господарства.

Python
— простий і універсальний інструмент для вирішення будь-яких аналітичних задач.
  1. Автоматизуйте свою рутину за допомогою Python
  2. Обробляйте великі обсяги інформації без адміністрування та баз даних
  3. Опануйте ключовий інструмент у світі аналітики та машинного навчання
можливості після навчання
1. Більше автономності

Перестанете залежати від розробників в роботі з даними і навчитеся розуміти програмістів.
2. Автоматизація рутинних завдань
З Python ви відчуєте смак до оптимізації процесів і звільните час для нових завдань.
3. Широкий доступ до даних
Уміння швидко парсити сайти-безцінне. Ви почнете бачити і отримувати дані там, де раніше не помічали їх
4. Легкий перехід до data science
Python для аналітики-чудова база та можливість розпочати кар'єру в data science.
5. Готувати дані для алгоритмів
Уміння використовувати готові рішення для додання сенсу сирої інформації.
6. Пошук нових інсайтів
Знаходження нових взаємозв'язків в даних і їх інтерпретація для поліпшення показників бізнесу.

навички після навчання
Досягнуті результати

  1. Робота з реальними дата-сетами
  2. Робота з логами та рекомендаційними системами
  3. Отримання мінімального портфоліо для старту в професії
ключові навички
  1. Робота з сирими даними та їх підготовка для аналізу
  2. Робота з аналітичними бібліотеками numpy, scipy і pandas
  3. Візуалізація даних за допомогою бібліотек seaborn, plotly, matplotlib
  4. Статистичний аналіз даних
  5. Застосування математичних моделей
  6. Вибір і створення фіч
  7. Застосування основних алгоритмів для обробки даних
  8. Парсинг даних з сайтів і зовнішніх джерел
  9. Автоматизація процесів отримання даних для звітів
Модуль 1 - Основи Python для роботи з даними
Ви навчитеся користуватися базовими інструментами Python. Для студентів без досвіду в програмуванні модуль передбачає інтенсивну самостійну роботу. По ходу заняття викладач дасть багато корисних додаткових бібліотек і методів, які прискорять роботу з кодом, залишивши більше часу на аналітичні завдання.
  1. Вступні відеоуроки з встановлення, синтаксису та функцій Python
  2. Основи Python та Git
  3. Базові типи даних і цикли
  4. Функції та класи
  5. Просунуті типи даних: масиви, множини, словники
навички, які ви отримаєте
  1. Навчіться працювати в Jupyter-ноутбуці
  2. Освоїте читання файлів і запис даних у файли
  3. Зможете робити первинну перевірку даних на коректність і обробку помилок
  4. Навчіться працювати з датами з бібліотекою DateTime
  5. Освоїте роботу з JSON-форматом
  6. Навчіться імпортувати дані в Excel
  7. Познайомитеся з бібліотекою DateTime
Модуль 2 знайомство з основними бібліотеками для аналізу даних
Ви навчитеся працювати з головними аналітичними бібліотеками, а візуалізації допоможуть швидко знаходити залежності і кореляції. Однією з великих переваг мови Python є велика і сильна спільнота, яка щодня поповнює мову простими готовими рішеннями.
  1. numpy і scipy
  2. pandas
  3. Візуалізація даних: seaborn, plotly, matplotlib
  4. Отримання даних із зовнішніх сайтів та API
  5. Data mining і парсинг
навички, які ви отримаєте
  1. Зможете підготувати візуальні звіти
  2. Освоїте експлоративний аналіз даних
  3. Навчіться працювати з матрицями та векторами в Python
  4. Навчіться працювати з pandas в таблицях
  5. Освоїте роботу з елементами масиву різних розмірностей в numpy
  6. Автоматизація отримання даних із зовнішніх джерел
  7. Автоматизація парсингу з сайтів
Модуль 3-Статистика в Python
У цьому модулі ви познайомитеся зі статистикою: саме вона допомагає закопатися глибше в дані, щоб знайти цікаві зв'язки і ефективно генерувати гіпотези. Вас чекають не тільки середнє, медіана і квартилі, а й одновимірний і багатовимірний аналіз, колінеарність. Ви навчитеся розраховувати необхідну вибірку і довірчий інтервал для стат. значимості тесту і проектувати дизайн a/b-тестів.
  1. Основи описової статистики, види розподілів у Python
  2. Центральна гранична теорема та статистичний аналіз даних у Python
  3. Основні статистичні тести та перевірка гіпотез
  4. Кейс-стаді. Статистичні показники в Python
навички, які ви отримаєте
  1. Зрозумієте основи описової статистики
  2. Навчіться проводити основні статистичні тести (z-test, f-test, chi-2 test)
  3. Освоїте проектування експериментів
  4. Навчіться проводити аналіз A/B-тестів
  5. Навчіться інтерпретувати вихідні дані для знаходження залежностей
  6. Застосування математичних моделей

Модуль 4 Feature engineering та попередня обробка даних
Ви вивчите інструменти вибору і оцінки фичей, навчитеся оптимізувати їх кількість. Нові знання допоможуть щільніше спілкуватися з розробкою в продукті і швидко виокремлювати помилки в їх логіці. Також ви долучитеся до головної бібліотеки data scientists — sklearn для feature selection.
  1. Перевірка та очищення даних за допомогою pandas та numpy
  2. Проведення аналізу та рекурсивного feature selection та на базі моделей
  3. Методи оцінки значущості та відбору ознак та їх використання
  4. "Прокляття розмірності", основні алгоритми і принципи їх роботи
  5. Використання алгоритмів sklearn
навички, які ви отримаєте
  1. Опануйте опис основних проблем даних
  2. Навчіться перевірці даних на повноту, цілісність, валідність, наявність шумів, помилок і пропусків
  3. Зможете очистити дані за допомогою numpy і pandas
  4. Розберетеся зі скороченням розмірності даних алгоритмами PCA, LDA, NMF за допомогою sklearn
  5. Навчіться вибору та оцінці фіч
лабораторні роботи
Крім домашніх завдань, в яких ви відпрацьовуєте окремі навички, в курсі буде дві перевірочні точки. Вони допоможуть вам оцінити свої сили в комплексних завданнях.
  1. За допомогою статистики вивчіть дані невеликого датасета на 200+ автомобілів по 26 параметрам, за допомогою візуалізацій виведете закономірності і протестуєте кілька статистичних гіпотез.
  2. Разом з викладачем підготуєте датасет на 1500 рядків до аналізу, оціните і виберете з 80 ознак потрібні і спрогнозуєте вартісну категорію будинку.
Диплом
В рамках дипломного проекту ви будете працювати з датасетом на медичну тематику. Ви не тільки самостійно підготуєте дані для аналізу в Python, але і напишете алгоритм, який пророкує ймовірність хвороби у пацієнта за різними ознаками.

Дипломна робота виконується самостійно під керівництвом експертів курсу і дозволяє закріпити весь спектр знань і навичок, отриманих на програмі.
https://privatelink.de/?https://netology.ru/programs/python-for-analytics#/
 
Угорі