Що нового?

Придбаний [Udemy] Анализ данных с помощью Python и Pandas. Часть 2 [2015]

Інформація про покупку
Тип покупки: Складчина
Ціна: 15723 ГРН
Учасників: 0 з 51
Організатор: Відсутній
Статус: Набір учасників
Внесок: 320.6 ГРН
0%
Основний список
Резервний список

Gadzhi

Модератор

[Udemy] Анализ данных с помощью Python и Pandas. Часть 2 [2015]



Информация о курсе
  • Автор: Udemy
  • Оригинальное название: Data Analysis with Python and Pandas
  • Продолжительность Части 2: 02:09:44
  • Тип материала: Видеоурок
  • Переводчик:
Пакет Pandas делает Python мощным инструментом для анализа данных.
Пакет дает возможность строить сводные таблицы, выполнять группировки, предоставляет удобный доступ к табличным данным, а при наличии пакета matplotlib дает возможность рисовать графики на полученных наборах данных.
Pandas - это библиотека с открытым исходным кодом, обеспечивающая высокую производительность, легка в использовании структуры и инструментов анализа данных для языка программирования Python. Библиотека может считыватть данныезаписи в формате CSV , Excel, HDF, SQL, JSON, HTML и форматы Stata. Pandas хорошо подходит для работы с различными типами данных:
  • Табличные данные со столбцами различных типов, как в таблицах SQL или Excel.
  • Упорядоченными и неупорядоченными данными (не обязательно с постоянной частотой) временных рядов.
  • Произвольными матричными данными (однородными или разнородными) с помеченными строками и столбцами.
  • Любыми другими формами наборов данных наблюдений, либо статистических данных. Данные не требуют обязательного наличия метки для того, чтобы быть помещенными в структуру данных Pandas.
Основными являются Series и DataFrame.
Series – это проиндексированный одномерный массив значений. Он похож на простой словарь типа dict, где имя элемента будет соответствовать индексу, а значение – значению записи.
DataFrame — это проиндексированный многомерный массив значений, соответственно каждый столбец DataFrame, является структурой Series.

Pandas является неплохой альтернативой Excel при работе с большими объемами данных.

В Части 2 этого курса озвучивается:
- Операции Pandas:

  • Манипуляции с колонкой (Операции по колонкам, создавая новые)
  • Категоризация колонок и DataFrame
  • Статистические функции с данными
  • Перемещение статистики
- Пропущенные данные, скачки
  • Удаление Na
  • Filling Forward And Backward Na
  • Обнаружение выбросов
- Комбинирование Dataframes
  • Конкатенация - операция склеивания объектов линейной структуры, обычно строк.
  • Добавление DataFrame
  • Слияние DataFrame
  • Присоединение DataFrame
// Сам курс есть в паблике
 
Угорі