Завдання по роботі з даними затребувані у всіх областях:від банківської сфери та ІТ до важкої промисловості і сільського господарства.
Python — простий і універсальний інструмент для вирішення будь-яких аналітичних задач.
- Автоматизуйте свою рутину за допомогою Python
- Обробляйте великі обсяги інформації без адміністрування та баз даних
- Опануйте ключовий інструмент у світі аналітики та машинного навчання
1. Більше автономності
Перестанете залежати від розробників в роботі з даними і навчитеся розуміти програмістів.
2. Автоматизація рутинних завдань
З Python ви відчуєте смак до оптимізації процесів і звільните час для нових завдань.
3. Широкий доступ до даних
Уміння швидко парсити сайти-безцінне. Ви почнете бачити і отримувати дані там, де раніше не помічали їх
4. Легкий перехід до data science
Python для аналітики-чудова база та можливість розпочати кар'єру в data science.
5. Готувати дані для алгоритмів
Уміння використовувати готові рішення для додання сенсу сирої інформації.
6. Пошук нових інсайтів
Знаходження нових взаємозв'язків в даних і їх інтерпретація для поліпшення показників бізнесу.
навички після навчання
Досягнуті результати
- Робота з реальними дата-сетами
- Робота з логами та рекомендаційними системами
- Отримання мінімального портфоліо для старту в професії
- Робота з сирими даними та їх підготовка для аналізу
- Робота з аналітичними бібліотеками numpy, scipy і pandas
- Візуалізація даних за допомогою бібліотек seaborn, plotly, matplotlib
- Статистичний аналіз даних
- Застосування математичних моделей
- Вибір і створення фіч
- Застосування основних алгоритмів для обробки даних
- Парсинг даних з сайтів і зовнішніх джерел
- Автоматизація процесів отримання даних для звітів
Модуль 1 - Основи Python для роботи з даними
Ви навчитеся користуватися базовими інструментами Python. Для студентів без досвіду в програмуванні модуль передбачає інтенсивну самостійну роботу. По ходу заняття викладач дасть багато корисних додаткових бібліотек і методів, які прискорять роботу з кодом, залишивши більше часу на аналітичні завдання.
Ви навчитеся працювати з головними аналітичними бібліотеками, а візуалізації допоможуть швидко знаходити залежності і кореляції. Однією з великих переваг мови Python є велика і сильна спільнота, яка щодня поповнює мову простими готовими рішеннями.
У цьому модулі ви познайомитеся зі статистикою: саме вона допомагає закопатися глибше в дані, щоб знайти цікаві зв'язки і ефективно генерувати гіпотези. Вас чекають не тільки середнє, медіана і квартилі, а й одновимірний і багатовимірний аналіз, колінеарність. Ви навчитеся розраховувати необхідну вибірку і довірчий інтервал для стат. значимості тесту і проектувати дизайн a/b-тестів.
Модуль 4 Feature engineering та попередня обробка даних
Ви вивчите інструменти вибору і оцінки фичей, навчитеся оптимізувати їх кількість. Нові знання допоможуть щільніше спілкуватися з розробкою в продукті і швидко виокремлювати помилки в їх логіці. Також ви долучитеся до головної бібліотеки data scientists — sklearn для feature selection.
Крім домашніх завдань, в яких ви відпрацьовуєте окремі навички, в курсі буде дві перевірочні точки. Вони допоможуть вам оцінити свої сили в комплексних завданнях.
В рамках дипломного проекту ви будете працювати з датасетом на медичну тематику. Ви не тільки самостійно підготуєте дані для аналізу в Python, але і напишете алгоритм, який пророкує ймовірність хвороби у пацієнта за різними ознаками.
Дипломна робота виконується самостійно під керівництвом експертів курсу і дозволяє закріпити весь спектр знань і навичок, отриманих на програмі.
Ви навчитеся користуватися базовими інструментами Python. Для студентів без досвіду в програмуванні модуль передбачає інтенсивну самостійну роботу. По ходу заняття викладач дасть багато корисних додаткових бібліотек і методів, які прискорять роботу з кодом, залишивши більше часу на аналітичні завдання.
- Вступні відеоуроки з встановлення, синтаксису та функцій Python
- Основи Python та Git
- Базові типи даних і цикли
- Функції та класи
- Просунуті типи даних: масиви, множини, словники
- Навчіться працювати в Jupyter-ноутбуці
- Освоїте читання файлів і запис даних у файли
- Зможете робити первинну перевірку даних на коректність і обробку помилок
- Навчіться працювати з датами з бібліотекою DateTime
- Освоїте роботу з JSON-форматом
- Навчіться імпортувати дані в Excel
- Познайомитеся з бібліотекою DateTime
Ви навчитеся працювати з головними аналітичними бібліотеками, а візуалізації допоможуть швидко знаходити залежності і кореляції. Однією з великих переваг мови Python є велика і сильна спільнота, яка щодня поповнює мову простими готовими рішеннями.
- numpy і scipy
- pandas
- Візуалізація даних: seaborn, plotly, matplotlib
- Отримання даних із зовнішніх сайтів та API
- Data mining і парсинг
- Зможете підготувати візуальні звіти
- Освоїте експлоративний аналіз даних
- Навчіться працювати з матрицями та векторами в Python
- Навчіться працювати з pandas в таблицях
- Освоїте роботу з елементами масиву різних розмірностей в numpy
- Автоматизація отримання даних із зовнішніх джерел
- Автоматизація парсингу з сайтів
У цьому модулі ви познайомитеся зі статистикою: саме вона допомагає закопатися глибше в дані, щоб знайти цікаві зв'язки і ефективно генерувати гіпотези. Вас чекають не тільки середнє, медіана і квартилі, а й одновимірний і багатовимірний аналіз, колінеарність. Ви навчитеся розраховувати необхідну вибірку і довірчий інтервал для стат. значимості тесту і проектувати дизайн a/b-тестів.
- Основи описової статистики, види розподілів у Python
- Центральна гранична теорема та статистичний аналіз даних у Python
- Основні статистичні тести та перевірка гіпотез
- Кейс-стаді. Статистичні показники в Python
- Зрозумієте основи описової статистики
- Навчіться проводити основні статистичні тести (z-test, f-test, chi-2 test)
- Освоїте проектування експериментів
- Навчіться проводити аналіз A/B-тестів
- Навчіться інтерпретувати вихідні дані для знаходження залежностей
- Застосування математичних моделей
Модуль 4 Feature engineering та попередня обробка даних
Ви вивчите інструменти вибору і оцінки фичей, навчитеся оптимізувати їх кількість. Нові знання допоможуть щільніше спілкуватися з розробкою в продукті і швидко виокремлювати помилки в їх логіці. Також ви долучитеся до головної бібліотеки data scientists — sklearn для feature selection.
- Перевірка та очищення даних за допомогою pandas та numpy
- Проведення аналізу та рекурсивного feature selection та на базі моделей
- Методи оцінки значущості та відбору ознак та їх використання
- "Прокляття розмірності", основні алгоритми і принципи їх роботи
- Використання алгоритмів sklearn
- Опануйте опис основних проблем даних
- Навчіться перевірці даних на повноту, цілісність, валідність, наявність шумів, помилок і пропусків
- Зможете очистити дані за допомогою numpy і pandas
- Розберетеся зі скороченням розмірності даних алгоритмами PCA, LDA, NMF за допомогою sklearn
- Навчіться вибору та оцінці фіч
Крім домашніх завдань, в яких ви відпрацьовуєте окремі навички, в курсі буде дві перевірочні точки. Вони допоможуть вам оцінити свої сили в комплексних завданнях.
- За допомогою статистики вивчіть дані невеликого датасета на 200+ автомобілів по 26 параметрам, за допомогою візуалізацій виведете закономірності і протестуєте кілька статистичних гіпотез.
- Разом з викладачем підготуєте датасет на 1500 рядків до аналізу, оціните і виберете з 80 ознак потрібні і спрогнозуєте вартісну категорію будинку.
В рамках дипломного проекту ви будете працювати з датасетом на медичну тематику. Ви не тільки самостійно підготуєте дані для аналізу в Python, але і напишете алгоритм, який пророкує ймовірність хвороби у пацієнта за різними ознаками.
Дипломна робота виконується самостійно під керівництвом експертів курсу і дозволяє закріпити весь спектр знань і навичок, отриманих на програмі.
https://privatelink.de/?https://netology.ru/programs/python-for-analytics#/