pandas ×54
Создан 03.01.2025
0
голоса
2
ответов
11
просмотров
Различие между типами str и object в Pandas

Я столкнулся с проблемой различия типов в Numpy и Pandas. В Numpy четко разграничиваются типы str и object. Например, при выполнении следующих команд:

import pandas as pd
import numpy as np
np.dtype(str)  # dtype('S')
np.dtype(object)  # dtype('O')

мы видим, что dtype('S')...

5
голоса
4
ответов
30
просмотров
Pandas read_csv: Опции low_memory и dtype

Я получаю предупреждение при загрузке CSV-файла с помощью pandas:

df = pd.read_csv('somefile.csv')

Сообщение об ошибке следующее:

.../site-packages/pandas/io/parsers.py:1130:
DtypeWarning: Columns (4,5,7,16) have mixed types.  Specify dtype option on import or set...
5
голоса
3
ответов
26
просмотров
Как сбросить индекс в DataFrame pandas?

У меня есть DataFrame, из которого я удалил некоторые строки. В результате я получил DataFrame с индексом, который выглядит как [1,5,6,10,11], и мне нужно сбросить его до [0,1,2,3,4]. Как я могу это сделать?

Похоже, что следующее решение работает:

df = df.reset_index()
del...
5
голоса
5
ответов
33
просмотров
Выбор строки из pandas Series/DataFrame по целочисленному индексу

Я столкнулся с проблемой при работе с DataFrame в Pandas. Меня интересует, почему df[2] не поддерживается, тогда как df.ix[2] и df[2:3] работают корректно.

Вот пример работы с DataFrame:

In [26]: df.ix[2]
Out[26]: 
A    1.027680
B    1.514210
C   -1.466963
D   -0.162339
Name:...
5
голоса
5
ответов
14
просмотров
Как сгруппировать строки DataFrame в список с помощью groupby в pandas

У меня есть DataFrame, и я хочу сгруппировать его по первой колонке, чтобы в результирующем DataFrame во второй колонке значения были представлены в виде списков. Например, начиная с DataFrame:

a b
A 1
A 2
B 5
B 5
B 4
C 6

Я хочу получить следующий результат:

A [1,2]
B [5,5,4]
C...
5
голоса
5
ответов
16
просмотров
Получить список из колонки или строки DataFrame в pandas?

Я имею dataframe df, импортированный из Excel-документа, который выглядит следующим образом:

cluster  load_date   budget  actual  fixed_price
A        1/1/2014    1000    4000    Y
A        2/1/2014    12000   10000   Y
A        3/1/2014    36000   2000    Y
B        4/1/2014    15000   10000 ...
5
голоса
4
ответов
13
просмотров
Улучшение размера/интервала подграфиков при использовании большого количества подграфиков

Я пытаюсь сгенерировать большое количество вертикально расположенных графиков с помощью библиотеки matplotlib. Я планирую сохранить полученный результат с помощью функции savefig и просматривать его на веб-странице, поэтому меня не волнует, насколько высоким будет финальное изображение, главное,...

6
голоса
5
ответов
12
просмотров
Переопределение значений в колонке pandas с помощью словаря, сохраняя NaN значения

У меня есть словарь, который выглядит так: di = {1: "A", 2: "B"}.

Я хотел бы применить этот словарь к столбцу col1 в DataFrame, который выглядит примерно так:

     col1   col2
0       w      a
1       1      2
2       2    NaN

В результате я хочу получить следующий DataFrame:

 ...
5
голоса
5
ответов
13
просмотров
Как выбрать все столбцы, кроме одного, в pandas?

У меня есть DataFrame, который выглядит следующим образом:

          a         b         c         d
0  0.418762  0.042369  0.869203  0.972314
1  0.991058  0.510228  0.594784  0.534366
2  0.407472  0.259811  0.396664  0.894202
3  0.726168  0.139531  0.324932  0.906575

Как я могу получить...

5
голоса
5
ответов
12
просмотров
Как развернуть иерархический индекс в столбцах

У меня есть датафрейм с иерархическим индексом по оси 1 (колонки), который получен в результате операции groupby.agg. Пример структуры данных представлен ниже:

     USAF   WBAN  year  month  day  s_PC  s_CL  s_CD  s_CNT  tempf       
                                     sum   sum   sum   ...
5
голоса
5
ответов
12
просмотров
Фильтрация строк DataFrame по наличию значения в колонке из заданного списка значений

У меня есть DataFrame в Python с использованием библиотеки pandas, названный rpt:

rpt

MultiIndex: 47518 entries, ('000002', '20120331') to ('603366', '20091231')
Data columns:
STK_ID                    47518  non-null values
STK_Name                  47518  non-null values
RPT_Date         ...
5
голоса
5
ответов
13
просмотров
Python Pandas: Как получить индексы строк, где значение в столбце соответствует заданному?

У меня возникла проблема с поиском индексов в DataFrame по колонке "BoolCol", где значения равны True. В данный момент я использую следующий способ с итерацией, который работает корректно:

for i in range(100, 3000):
    if df.iloc[i]['BoolCol'] == True:
         print(i,...
6
голоса
5
ответов
12
просмотров
Преобразование словаря Python в DataFrame

У меня есть словарь Python:

{u'2012-07-01': 391,
 u'2012-07-02': 392,
 u'2012-07-03': 392,
 u'2012-07-04': 392,
 u'2012-07-05': 392,
 u'2012-07-06': 392}

Я хотел бы преобразовать его в DataFrame библиотеки pandas, чтобы даты и соответствующие значения находились в двух отдельных...

5
голоса
5
ответов
15
просмотров
Как создать тестовые и обучающие выборки из одного DataFrame с помощью pandas?

У меня есть довольно большой набор данных в виде датафрейма, и я хотел бы узнать, как можно разбить этот датафрейм на две случайные выборки (80% для тренировки и 20% для тестирования).

Спасибо!

7
голоса
4
ответов
32
просмотров
Разница между методами map, applymap и apply в Pandas

Можете ли вы объяснить, когда использовать эти методы векторизации с простыми примерами?

Я вижу, что map — это метод Series, тогда как остальные методы относятся к DataFrame. Я запутался в отношении методов apply и applymap. Почему у нас есть два метода для применения функции к DataFrame? Буду...

6
голоса
4
ответов
23
просмотров
Как проверить, существует ли столбец в Pandas

Как проверить, существует ли колонка в DataFrame библиотеки Pandas df?

У меня есть DataFrame следующего вида:

A B C 0 3 40 100 1 6 30 200

Как мне проверить, существует ли колонка "A", чтобы я мог выполнить следующее вычисление:

df['sum'] = df['A'] + df['C']

А если колонки "A"...

6
голоса
5
ответов
40
просмотров
Как отсортировать DataFrame pandas по одному столбцу

У меня есть DataFrame, который выглядит следующим образом:

        0          1     2
0   354.7      April   4.0
1    55.4     August   8.0
2   176.5   December  12.0
3    95.5   February   2.0
4    85.6    January   1.0
5     152       July   7.0
6   238.7       June   6.0
7   104.8     ...
8
голоса
4
ответов
21
просмотров
Как преобразовать индекс DataFrame в колонку в pandas?

Как преобразовать индекс датафрейма в столбец?

У меня есть датафрейм, который выглядит следующим образом:

        gi       ptt_loc
0  384444683      593  
1  384444684      594 
2  384444686      596  

и мне нужно преобразовать его в следующий формат:

    index1    gi      ...
7
голоса
5
ответов
27
просмотров
Как избежать создания индекса при сохранении DataFrame в CSV с помощью pandas

Я пытаюсь сохранить CSV файл в папку после внесения в него некоторых изменений.

Каждый раз, когда я использую команду pd.to_csv('C:/Путь к файлу.csv'), в результирующем CSV файле появляется отдельный столбец с индексами. Я хочу избежать записи индексов в CSV.

Я...

8
голоса
5
ответов
35
просмотров
Установить значение для конкретной ячейки в DataFrame pandas с использованием индекса

Я создал Pandas DataFrame:

df = DataFrame(index=['A','B','C'], columns=['x','y'])

Теперь я хотел бы присвоить значение определенной ячейке, например, в строке C и столбце x. То есть, я хочу выполнить следующую трансформацию:

     x    y             x    y
A  NaN  NaN       ...