apache-spark-sql
×2
Создан 24.04.2025
Вопросы
0
голоса
2
ответов
21
просмотров
Применение UDF в GroupedData в PySpark (с работающим примером на Python)
У меня есть следующий код на Python, который работает локально с использованием DataFrame из библиотеки pandas:
df_result = pd.DataFrame(df
.groupby('A')
.apply(lambda x: myFunction(zip(x.B, x.C), x.name))
Я хотел бы запустить этот...
0
голоса
3
ответов
13
просмотров
Псевдонимы столбцов после groupBy в PySpark
Нужна помощь с проблемой в коде. Я пытаюсь получить из DataFrame, сформированного с помощью groupBy
, колонку с максимальным значением 'diff', и чтобы эта колонка имела псевдоним "maxDiff". Однако строка кода ниже не изменяет результат, и при этом не выдает никаких ошибок.
grpdf =...
Эксперты по тегу