Вопросы с тегом [pandas]

0

голоса

5

ответов

53139

просмотров

Преобразование объекта summary из statsmodels в DataFrame Pandas

Я выполняю множественную линейную регрессию с использованием statsmodels.formula.api (версия 0.9.0) на Windows 10. После подгонки модели и получения сводной информации с помощью следующих строк, я получаю результат в формате объекта summary.

X_opt  = X[:, [0,1,2,3]]
regressor_OLS =...

17.09.2025 15:30 • Lunaflair2477

0

голоса

3

ответов

350

просмотров

Получить все ключи из объекта GroupBy в Pandas

Я ищу способ получить список всех ключей в объекте GroupBy, но не могу найти такую функцию в документации и через Google.

Определенно есть способ получить доступ к группам по их ключам, например, вот так:

df_gb = df.groupby(['EmployeeNumber'])
df_gb.get_group(key)

...поэтому я...

python pandas

11.04.2025 22:04 • Lunarae6351

0

голоса

0

ответов

343

просмотров

Как удалить или скрыть метки по оси X на графике

У меня есть график с помощью boxplot, и мне нужно удалить метки по оси x (то есть 'user_type' и 'member_gender'). Как это сделать в приведенном ниже коде?

sb.boxplot(x="user_type", y="Seconds", data=df, color=default_color, ax=ax[0,0], sym='').set_title('User-Type (0=Non-Subscriber,...

python pandas python-3.x matplotlib seaborn

08.04.2025 02:16 • AmiToki123

0

голоса

5

ответов

331

просмотров

Как исправить ошибку IndexError: недопустимый индекс для скалярной переменной

Вопрос на StackOverflow:

Я сталкиваюсь с ошибкой при выполнении следующего кода:

IndexError: invalid index to scalar variable.

Ошибка возникает на строке:

results.append(RMSPE(np.expm1(y_train[testcv]), [y[1] for y in y_test]))

Вот полный код:

import...

python pandas numpy

07.04.2025 16:08 • Aethera

0

голоса

1

ответов

305

просмотров

Как считать файл с разделителем в виде точки с запятой в pandas?

Я пытаюсь импортировать файл .csv в Python с помощью библиотеки pandas.

Вот формат файла из .csv:

a1;b1;c1;d1;e1;... a2;b2;c2;d2;e2;...
.....

Вот как я его загружаю:

from pandas import * csv_path = "C:...." data = read_csv(csv_path)

Однако, когда я пытаюсь распечатать содержимое файла, я...

python pandas csv

07.04.2025 02:03 • Теран Макаренko

0

голоса

4

ответов

311

просмотров

Итерация по DataFrame в pandas с использованием itertuples

Я перебираю DataFrame в pandas, используя метод itertuples(), и хотел бы захватить номера строк во время итерации. Вот мой текущий код:

for row in df.itertuples():
    print(row['name'])

Ожидаемый вывод:

1 larry
2 barry
3 michael

Где 1, 2, 3 — это номера строк. Я бы...

python pandas

06.04.2025 01:11 • Лунарос4598

0

голоса

1

ответов

276

просмотров

Преобразование pandas.Series из типа object в float с заменой ошибок на NaN

Описание проблемы:

Я столкнулся с проблемой при работе с библиотекой pandas в Python. У меня есть следующий код:

In [2]: a = pd.Series([1, 2, 3, 4, '.'])

In [3]: a
Out[3]: 
0    1
1    2
2    3
3    4
4    .
dtype: object

Я пытаюсь преобразовать элементы серии a в тип...

python pandas nan

05.04.2025 10:09 • CottonSpark1237860

0

голоса

2

ответов

279

просмотров

Pandas groupby с подсчетом по бинам

У меня есть DataFrame, который выглядит следующим образом:

+----------+---------+-------+
| username | post_id | views |
+----------+---------+-------+
| john     |       1 |     3 |
| john     |       2 |    23 |
| john     |       3 |    44 |
| john     |       4 |    82 |
| jane     |      ...

python pandas dataframe group-by pivot-table

05.04.2025 08:11 • LumaStar245759

0

голоса

2

ответов

432

просмотров

Различие между типами str и object в Pandas

Я столкнулся с проблемой различия типов в Numpy и Pandas. В Numpy четко разграничиваются типы str и object. Например, при выполнении следующих команд:

import pandas as pd
import numpy as np
np.dtype(str)  # dtype('S')
np.dtype(object)  # dtype('O')

мы видим, что dtype('S')...

python pandas string numpy

04.04.2025 17:22 • Kottentayl2574

0

голоса

5

ответов

343

просмотров

Добавление пустой строки в DataFrame с помощью pandas

Я пытаюсь добавить пустую строку в конец DataFrame, но у меня не получается. Я пытаюсь разобраться, как работает функция append в pandas, и всё равно не понимаю.

Вот мой код:

import pandas as pd

excel_names = ["ARMANI+EMPORIO+AR0143-book.xlsx"]
excels = [pd.ExcelFile(name) for name...

python pandas python-2.7

04.04.2025 05:08 • Флирк

0

голоса

1

ответов

287

просмотров

Провести расчет нового столбца как среднее значение других столбцов в pandas

Описание проблемы:

Я работаю с датафреймом в pandas и хочу добавить новый столбец, который будет содержать среднее значение по столбцам salary_1, salary_2 и salary_3. У меня есть следующий датафрейм:

df = pd.DataFrame({
    'salary_1': [230, 345, 222],
    'salary_2': [235,...

python pandas dataframe

02.04.2025 23:29 • Cotonex12

0

голоса

1

ответов

342

просмотров

Построение гистограммы на логарифмической шкале с помощью Matplotlib

Я работаю с DataFrame в Pandas и у меня есть следующая последовательность значений в серии:

x = [2, 1, 76, 140, 286, 267, 60, 271, 5, 13, 9, 76, 77, 6, 2, 27, 22, 1, 12, 7, 19, 81, 11, 173, 13, 7, 16, 19, 23, 197, 167, 1]

Мне было указано построить два гистограммы в Jupyter Notebook...

python pandas matplotlib numpy statistics

02.04.2025 15:39 • SolsticeRider

0

голоса

3

ответов

320

просмотров

Pandas: Многоуровневые названия столбцов

Проблема с добавлением многоуровневых имен столбцов в pandas

Я использую библиотеку pandas, которая поддерживает многоуровневые имена столбцов. Например, я создаю DataFrame следующим образом:

x = pd.DataFrame({'instance':['first','first','first'],'foo':['a','b','c'],'bar':rand(3)})
x =...

python pandas

31.03.2025 20:59 • Мягкийхвост

0

голоса

5

ответов

359

просмотров

Pandas: Количество месяцев между двумя датами

У меня возникла проблема, которая, как я думал, должна быть простой, но то, что я видел, представляет собой техники, которые требуют итерации по полям дат в dataframe, чтобы определить разницу между двумя датами. Я с этим испытываю трудности. Я знаком с функцией DATEDIFF в MSSQL, и думал, что в...

python date pandas diff

31.03.2025 16:11 • CottonSprout

0

голоса

4

ответов

300

просмотров

Предупреждение Pandas о повторяющихся записях в индексе при сводной таблице

Я столкнулся с проблемой при использовании метода pivot в библиотеке Pandas. В документации к этому методу приведено следующее описание:

Examples
--------
>>> df
    foo   bar  baz
0   one   A    1.
1   one   B    2.
2   one   C    3.
3   two   A    4.
4   two   B    5.
5   two   C   ...

python pandas

30.03.2025 22:04 • Лизардон2950

0

голоса

2

ответов

332

просмотров

Заменить строку/значение в DataFrame целиком

У меня есть очень большой набор данных, в котором я хочу заменить строки на числа. Я бы хотел работать с набором данных, не вводя функцию отображения для каждого ключа (столбца) в наборе. Это похоже на метод fillna, но нужно заменить конкретные строки на соответствующие значения.

Есть ли способ...

python pandas replace dataframe

29.03.2025 13:47 • Skyra87

0

голоса

4

ответов

302

просмотров

Pandas: Одновременное присвоение нескольких новых столбцов

У меня есть DataFrame df, содержащий столбец с метками для каждой строки (в дополнение к некоторым соответствующим данным для каждой строки). У меня есть словарь labeldict, у которого ключи соответствуют возможным меткам, а значения представляют собой 2-кортежи информации, связанной с этой...

python pandas

27.03.2025 20:06 • Смельчак

0

голоса

4

ответов

307

просмотров

Создание пустого MultiIndex

Я хотел бы создать пустой DataFrame с MultiIndex перед тем, как добавить в него строки. Я обнаружил, что пустые DataFrame не поддерживают назначение MultiIndex на лету, поэтому я устанавливаю имена для MultiIndex во время создания. Однако я не хочу задавать уровни, так как это будет...

python pandas multi-index

27.03.2025 19:15 • Lunaryx8571

5

голоса

4

ответов

328

просмотров

Pandas read_csv: Опции low_memory и dtype

Я получаю предупреждение при загрузке CSV-файла с помощью pandas:

df = pd.read_csv('somefile.csv')

Сообщение об ошибке следующее:

.../site-packages/pandas/io/parsers.py:1130:
DtypeWarning: Columns (4,5,7,16) have mixed types.  Specify dtype option on import or set...

python parsing pandas dataframe numpy

27.02.2025 13:10 • Veloflora

5

голоса

3

ответов

347

просмотров

Как сбросить индекс в DataFrame pandas?

У меня есть DataFrame, из которого я удалил некоторые строки. В результате я получил DataFrame с индексом, который выглядит как [1,5,6,10,11], и мне нужно сбросить его до [0,1,2,3,4]. Как я могу это сделать?

Похоже, что следующее решение работает:

df = df.reset_index()
del...

python pandas dataframe indexing

26.02.2025 20:15 • Артемий Светлов