Вопросы
Как выбрать строки из DataFrame на основе значений столбцов?
Как выбрать строки из DataFrame на основе значений в определенном столбце в Pandas?
В SQL я бы использовал следующий запрос:
SELECT *
FROM table
WHERE column_name = some_value
Пытаюсь понять, как выполнить аналогичную операцию в Pandas, чтобы отфильтровать строки DataFrame по значению...
Переименование названий столбцов в Pandas
Я хочу изменить метки столбцов в DataFrame Pandas с
['$a', '$b', '$c', '$d', '$e']
на
['a', 'b', 'c', 'd', 'e']
Как это можно сделать?
Удаление столбца из DataFrame в Pandas
Проблема удаления столбца в DataFrame:
Я пытаюсь удалить столбец из DataFrame и успешно использую следующий код:
del df['column_name']
Однако, почему у меня не получается выполнить удаление с помощью следующей команды?
del df.column_name
Я ожидаю, что это сработает,...
Выбор нескольких колонок в DataFrame Pandas
Как выбрать столбцы a и b из df и сохранить их в новом датафрейме df1? У меня есть следующий датафрейм:
index a b c 1 2 3 4 2 3 4 5
Я делал несколько попыток, но они оказались неудачными:
df1 = df['a':'b'] df1 = df.ix[:, 'a':'b']
Как правильно извлечь столбцы a и b и...
Как изменить порядок столбцов в DataFrame?
У меня есть следующий DataFrame (df
):
import numpy as np
import pandas as pd
df = pd.DataFrame(np.random.rand(10, 5))
Я добавил новый столбец с именем mean
следующим образом:
df['mean'] = df.mean(1)
Как я могу переместить столбец mean
на первое место, оставив...
Изменение типа столбца в pandas
Я создал DataFrame из списка списков:
table = [
['a', '1.2', '4.2'],
['b', '70', '0.03'],
['x', '5', '0']
]
df = pd.DataFrame(table)
Как мне конвертировать столбцы в определенные типы? В данном случае я хочу преобразовать 2-й и 3-й столбцы в тип float
....
Создание DataFrame в Pandas путём последовательного добавления строк
Как создать пустой DataFrame в Pandas и добавлять строки по одной?
Я создал пустой DataFrame:
df = pd.DataFrame(columns=('lib', 'qty1', 'qty2'))
Затем я могу добавить новую строку в конец и заполнить одно поле следующим образом:
df = df._set_value(index=len(df), col='qty1',...
Как удалить строки DataFrame в Pandas с NaN в определённом столбце
У меня есть DataFrame, и я хочу оставить только те записи, в которых столбец EPS не содержит значений NaN. Пример исходного DataFrame:
STK_ID EPS cash
STK_ID RPT_Date
601166 20111231 601166 NaN NaN
600036 20111231 600036 NaN 12
600016 20111231 ...
Как справиться с предупреждением SettingWithCopyWarning в Pandas
Описание проблемы Я только что обновил свою библиотеку Pandas с версии 0.11 до 0.13.0rc1. Теперь в приложении появилось множество новых предупреждений. Одно из них выглядит так: E:\FinReporter\FM_EXT.py:449: SettingWithCopyWarning: Значение пытается быть записано в копию среза DataFrame. Попробуйте...
Использование списка значений для выбора строк из DataFrame в Pandas
У меня есть следующий DataFrame в Pandas:
df = DataFrame({'A': [5,6,3,4], 'B': [1,2,3,5])
df
A B
0 5 1
1 6 2
2 3 3
3 4 5
Я могу отобрать строки на основе конкретного значения:
x = df[df['A'] == 3]
x
A B
2 3 3
Но как мне...
Как добавить новый столбец к существующему DataFrame
Я имею следующий индексированный DataFrame с именованными столбцами и не连续ными номерами строк:
a b c d
2 0.671399 0.101208 -0.181532 0.241273
3 0.446172 -0.243316 0.051767 1.577318
5 0.614758 0.075793 -0.451460 -0.012493
Я хотел бы добавить новый...
Получение списка из заголовков столбцов DataFrame в Pandas
Я хочу получить список заголовков столбцов из объекта DataFrame библиотеки Pandas. DataFrame будет поступать от пользователя, поэтому я не знаю заранее, сколько будет столбцов и как они будут называться.
Например, если мне предоставят DataFrame следующего вида:
y gdp cap
0 1 2 ...
"Красивая печать всей Series / DataFrame в Pandas"
Я много работаю с Series и DataFrames в терминале. По умолчанию метод repr для Series возвращает сокращенное представление, показывающее некоторые значения с начала и конца, в то время как остальная часть данных скрыта.
Существует ли встроенный способ красиво отобразить всю Series или...
Преобразование списка словарей в DataFrame pandas
Как я могу преобразовать список словарей в DataFrame?
Мне нужно преобразовать следующий список:
[{'points': 50, 'time': '5:00', 'year': 2010},
{'points': 25, 'time': '6:00', 'month': "february"},
{'points': 90, 'time': '9:00', 'month': 'january'},
{'points_h1': 20, 'month':...
Запись DataFrame pandas в CSV файл
У меня есть датафрейм в pandas, который я хотел бы записать в CSV файл. Я делаю это с помощью следующей команды:
df.to_csv('out.csv')
Однако получаю следующую ошибку:
UnicodeEncodeError: 'ascii' codec can't encode character u'\u03b1' in position 20: ordinal not in...
Объединение двух столбцов текста в DataFrame pandas
У меня есть DataFrame, который выглядит следующим образом:
Year quarter
2000 q2
2001 q3
Как мне добавить новый столбец, объединив существующие столбцы, чтобы получить следующий DataFrame?
Year quarter period
2000 q2 2000q2
2001 q3 2001q3
Как...
Удаление строки DataFrame в Pandas на основе значения столбца
У меня есть следующий DataFrame:
daysago line_race rating rw wrating
line_date
2007-03-31 62 11 56 1.000000 56.000000
2007-03-10 83 11 67 1.000000 67.000000
2007-02-10 111 ...
Фильтрация DataFrame pandas по критериям подстроки
Я имею DataFrame в pandas с колонкой строковых значений. Мне нужно выбрать строки на основе частичного совпадения строк.
Что-то вроде этого идиома:
re.search(pattern, cell_in_question)
который возвращает булево значение. Я знаком с синтаксисом df[df['A'] == "hello world"]
, но не...
Как фильтровать DataFrame Pandas с помощью 'in' и 'not in', как в SQL
Как мне добиться эквивалентов SQL-запросов IN и NOT IN в Pandas? У меня есть список с необходимыми значениями. Вот сценарий: df = pd.DataFrame({'country': ['US', 'UK', 'Germany', 'China']}) countries_to_keep = ['UK', 'China']
псевдокод:
df[df['country'] not in countries_to_keep]
Мой текущий...
Получить статистику для каждой группы (например, количество, среднее и т.д.) с помощью pandas GroupBy?
У меня есть DataFrame df
, и я использую несколько его столбцов для выполнения операции groupby
:
df[['col1', 'col2', 'col3', 'col4']].groupby(['col1', 'col2']).mean()
Таким образом, я почти получаю нужную таблицу (DataFrame). Однако мне не хватает дополнительного столбца, который...