[Udemy] Анализ данных с помощью Python и Pandas. Часть 2 [2015]
Информация о курсе
- Автор: Udemy
- Оригинальное название: Data Analysis with Python and Pandas
- Продолжительность Части 2: 02:09:44
- Тип материала: Видеоурок
- Переводчик:
Пакет дает возможность строить сводные таблицы, выполнять группировки, предоставляет удобный доступ к табличным данным, а при наличии пакета matplotlib дает возможность рисовать графики на полученных наборах данных.
Pandas - это библиотека с открытым исходным кодом, обеспечивающая высокую производительность, легка в использовании структуры и инструментов анализа данных для языка программирования Python. Библиотека может считыватть данныезаписи в формате CSV , Excel, HDF, SQL, JSON, HTML и форматы Stata. Pandas хорошо подходит для работы с различными типами данных:
- Табличные данные со столбцами различных типов, как в таблицах SQL или Excel.
- Упорядоченными и неупорядоченными данными (не обязательно с постоянной частотой) временных рядов.
- Произвольными матричными данными (однородными или разнородными) с помеченными строками и столбцами.
- Любыми другими формами наборов данных наблюдений, либо статистических данных. Данные не требуют обязательного наличия метки для того, чтобы быть помещенными в структуру данных Pandas.
Series – это проиндексированный одномерный массив значений. Он похож на простой словарь типа dict, где имя элемента будет соответствовать индексу, а значение – значению записи.
DataFrame — это проиндексированный многомерный массив значений, соответственно каждый столбец DataFrame, является структурой Series.
Pandas является неплохой альтернативой Excel при работе с большими объемами данных.
В Части 2 этого курса озвучивается:
- Операции Pandas:
- Манипуляции с колонкой (Операции по колонкам, создавая новые)
- Категоризация колонок и DataFrame
- Статистические функции с данными
- Перемещение статистики
- Удаление Na
- Filling Forward And Backward Na
- Обнаружение выбросов
- Конкатенация - операция склеивания объектов линейной структуры, обычно строк.
- Добавление DataFrame
- Слияние DataFrame
- Присоединение DataFrame