pandas ×24
Создан 03.01.2025
8
голоса
5
ответов
7
просмотров
Перемешать строки DataFrame

У меня есть следующий DataFrame:

    Col1  Col2  Col3  Type
0      1     2     3     1
1      4     5     6     1
...
20     7     8     9     2
21    10    11    12     2
...
45    13    14    15     3
46    16    17    18     3
...

Этот DataFrame был загружен из CSV файла. Все строки с...

8
голоса
5
ответов
12
просмотров
Как фильтровать DataFrame Pandas с помощью 'in' и 'not in', как в SQL

Как мне добиться эквивалентов SQL-запросов IN и NOT IN в Pandas? У меня есть список с необходимыми значениями. Вот сценарий: df = pd.DataFrame({'country': ['US', 'UK', 'Germany', 'China']}) countries_to_keep = ['UK', 'China']

псевдокод:

df[df['country'] not in countries_to_keep]

Мой текущий...

9
голоса
5
ответов
8
просмотров
Фильтрация DataFrame pandas по критериям подстроки

Я имею DataFrame в pandas с колонкой строковых значений. Мне нужно выбрать строки на основе частичного совпадения строк.

Что-то вроде этого идиома:

re.search(pattern, cell_in_question)

который возвращает булево значение. Я знаком с синтаксисом df[df['A'] == "hello world"], но не...

13
голоса
5
ответов
11
просмотров
Как добавить новый столбец к существующему DataFrame

Я имею следующий индексированный DataFrame с именованными столбцами и не连续ными номерами строк:

          a         b         c         d
2  0.671399  0.101208 -0.181532  0.241273
3  0.446172 -0.243316  0.051767  1.577318
5  0.614758  0.075793 -0.451460 -0.012493

Я хотел бы добавить новый...

10
голоса
5
ответов
13
просмотров
Удаление строки DataFrame в Pandas на основе значения столбца

У меня есть следующий DataFrame:

             daysago  line_race rating        rw    wrating
 line_date                                                 
2007-03-31       62         11     56  1.000000  56.000000
2007-03-10       83         11     67  1.000000  67.000000
2007-02-10      111    ...
8
голоса
5
ответов
13
просмотров
Неоднозначное значение истинности Series. Используйте a.empty, a.bool(), a.item(), a.any() или a.all()

Я хочу отфильтровать свой DataFrame по условию с использованием оператора or, чтобы оставить строки, значения определённого столбца которых находятся вне диапазона [-0.25, 0.25]. Я попытался сделать это следующим образом:

df = df[(df['col'] < -0.25) or (df['col'] > 0.25)]

Однако я получаю...

14
голоса
5
ответов
22
просмотров
Как справиться с предупреждением SettingWithCopyWarning в Pandas

Описание проблемы Я только что обновил свою библиотеку Pandas с версии 0.11 до 0.13.0rc1. Теперь в приложении появилось множество новых предупреждений. Одно из них выглядит так: E:\FinReporter\FM_EXT.py:449: SettingWithCopyWarning: Значение пытается быть записано в копию среза DataFrame. Попробуйте...

11
голоса
5
ответов
15
просмотров
"Работа с большими данными" в pandas [закрыто]

Проблема с обработкой больших объемов данных с использованием Pandas

Я изучаю библиотеку Pandas в Python, и озадачен тем, как эффективно обрабатывать большие наборы данных, которые не могут быть полностью загружены в память. В моей повседневной работе я использую SAS, который отлично...

13
голоса
5
ответов
10
просмотров
Получение списка из заголовков столбцов DataFrame в Pandas

Я хочу получить список заголовков столбцов из объекта DataFrame библиотеки Pandas. DataFrame будет поступать от пользователя, поэтому я не знаю заранее, сколько будет столбцов и как они будут называться.

Например, если мне предоставят DataFrame следующего вида:

    y  gdp  cap
0   1    2   ...
12
голоса
5
ответов
38
просмотров
Преобразование списка словарей в DataFrame pandas

Как я могу преобразовать список словарей в DataFrame?

Мне нужно преобразовать следующий список:

[{'points': 50, 'time': '5:00', 'year': 2010}, 
 {'points': 25, 'time': '6:00', 'month': "february"}, 
 {'points': 90, 'time': '9:00', 'month': 'january'}, 
 {'points_h1': 20, 'month':...
11
голоса
5
ответов
28
просмотров
Запись DataFrame pandas в CSV файл

У меня есть датафрейм в pandas, который я хотел бы записать в CSV файл. Я делаю это с помощью следующей команды:

df.to_csv('out.csv')

Однако получаю следующую ошибку:

UnicodeEncodeError: 'ascii' codec can't encode character u'\u03b1' in position 20: ordinal not in...
17
голоса
5
ответов
17
просмотров
Выбор нескольких колонок в DataFrame Pandas

Как выбрать столбцы a и b из df и сохранить их в новом датафрейме df1? У меня есть следующий датафрейм:

index a b c 1 2 3 4 2 3 4 5

Я делал несколько попыток, но они оказались неудачными:

df1 = df['a':'b'] df1 = df.ix[:, 'a':'b']

Как правильно извлечь столбцы a и b и...

8
голоса
5
ответов
1
просмотров
Получить статистику для каждой группы (например, количество, среднее и т.д.) с помощью pandas GroupBy?

У меня есть DataFrame df, и я использую несколько его столбцов для выполнения операции groupby:

df[['col1', 'col2', 'col3', 'col4']].groupby(['col1', 'col2']).mean()

Таким образом, я почти получаю нужную таблицу (DataFrame). Однако мне не хватает дополнительного столбца, который...

16
голоса
5
ответов
14
просмотров
Как изменить порядок столбцов в DataFrame?

У меня есть следующий DataFrame (df):

import numpy as np
import pandas as pd

df = pd.DataFrame(np.random.rand(10, 5))

Я добавил новый столбец с именем mean следующим образом:

df['mean'] = df.mean(1)

Как я могу переместить столбец mean на первое место, оставив...

10
голоса
5
ответов
39
просмотров
Объединение двух столбцов текста в DataFrame pandas

У меня есть DataFrame, который выглядит следующим образом:

Year  quarter
2000       q2
2001       q3

Как мне добавить новый столбец, объединив существующие столбцы, чтобы получить следующий DataFrame?

Year  quarter  period
2000       q2  2000q2
2001       q3  2001q3

Как...

35
голоса
5
ответов
24
просмотров
Как выбрать строки из DataFrame на основе значений столбцов?

Как выбрать строки из DataFrame на основе значений в определенном столбце в Pandas?

В SQL я бы использовал следующий запрос:

SELECT *
FROM table
WHERE column_name = some_value

Пытаюсь понять, как выполнить аналогичную операцию в Pandas, чтобы отфильтровать строки DataFrame по значению...

14
голоса
5
ответов
14
просмотров
Python: как определить, является ли объект итерируемым?

Есть ли метод, аналогичный isiterable? Единственное решение, которое я нашел до сих пор, — это вызвать:

hasattr(myObj, '__iter__')

Но я не уверен, насколько это надежно.

13
голоса
4
ответов
12
просмотров
Использование списка значений для выбора строк из DataFrame в Pandas

У меня есть следующий DataFrame в Pandas:

df = DataFrame({'A': [5,6,3,4], 'B': [1,2,3,5])
df

     A   B
0    5   1
1    6   2
2    3   3
3    4   5

Я могу отобрать строки на основе конкретного значения:

x = df[df['A'] == 3]
x

     A   B
2    3   3

Но как мне...

22
голоса
5
ответов
31
просмотров
Удаление столбца из DataFrame в Pandas

Проблема удаления столбца в DataFrame:

Я пытаюсь удалить столбец из DataFrame и успешно использую следующий код:

del df['column_name']

Однако, почему у меня не получается выполнить удаление с помощью следующей команды?

del df.column_name

Я ожидаю, что это сработает,...

14
голоса
5
ответов
15
просмотров
Как удалить строки DataFrame в Pandas с NaN в определённом столбце

У меня есть DataFrame, и я хочу оставить только те записи, в которых столбец EPS не содержит значений NaN. Пример исходного DataFrame:

                 STK_ID  EPS  cash
STK_ID RPT_Date                   
601166 20111231  601166  NaN   NaN
600036 20111231  600036  NaN    12
600016 20111231 ...