Pandas - это инструмент для обработки данных высокого уровня, разработанный Уэсом МакКинни. Он построен на пакете Numpy, а его ключевая структура данных называется DataFrame. DataFrames позволяют хранить табличные данные в строках наблюдений и столбцах переменных и управлять ими.
Есть несколько способов создать DataFrame. Один из способов - использовать словарь. Например:
Как вы можете видеть с новым brics
DataFrame, Pandas назначил ключ для каждой страны в виде числовых значений от 0 до 4. Если вы хотите иметь разные значения индекса, например, двухбуквенный код страны, вы также можете легко это сделать. .
Другой способ создать DataFrame - импортировать CSV-файл с помощью Pandas. Теперь csv cars.csv
сохранен и может быть импортирован с помощью pd.read_csv
:
Есть несколько способов проиндексировать фрейм данных Pandas. Один из самых простых способов сделать это - использовать запись в квадратных скобках.
В приведенном ниже примере вы можете использовать квадратные скобки для выбора одного столбца cars
DataFrame. Вы можете использовать одинарную или двойную скобку. Одиночная скобка выводит серию Pandas, а двойная скобка выводит Pandas DataFrame.
Квадратные скобки также могут использоваться для доступа к наблюдениям (строкам) из DataFrame. Например:
Вы также можете использовать loc
и iloc
для выполнения практически любой операции выбора данных. loc
основан на метках, что означает, что вы должны указывать строки и столбцы на основе их меток строк и столбцов. iloc
основан на целочисленном индексе, поэтому вам нужно указать строки и столбцы по их целочисленному индексу, как вы это делали в предыдущем упражнении.