Advertisement
Not a member of Pastebin yet?
Sign Up,
it unlocks many cool features!
- import pandas as pd
- df = pd.read_csv('/datasets/drink_preferences.csv')
- df = df.dropna(subset=['nonalcoholic_drink'])
- df_female = df[df['gender'] == 'Female']
- # Сгруппируйте и отсортируйте данные
- df_agg = (df_female
- .groupby('nonalcoholic_drink')
- .agg({'resp_id': 'nunique'})
- .sort_values(by='resp_id', ascending=False)
- .reset_index())
- print(df_agg)
- '''
- Данные в переменной df_agg не совпадают.
- например в строке 8 ожидались следующие данные:
- nonalcoholic_drink Pepsi
- resp_id 7
- Name: 8, dtype: object
- В вашей переменной эти данные:
- nonalcoholic_drink Pepsi
- resp_id 6
- Name: 8, dtype: object
- '''
- '''
- Мой результат
- nonalcoholic_drink resp_id
- 0 Coffee 25
- 1 Green Tea 22
- 2 Black Tea 21
- 3 Apple Juice 19
- 4 Water 19
- 5 Gatorade 15
- 6 Dr. Pepper 12
- 7 Coke 8
- 8 Pepsi 6
- 9 Red Bull 4
- '''
Advertisement
Add Comment
Please, Sign In to add comment
Advertisement