Advertisement
AliaksandrLet

Лаборатория алгоритма предобработки

Mar 23rd, 2022 (edited)
64
0
Never
Not a member of Pastebin yet? Sign Up, it unlocks many cool features!
Python 1.11 KB | None | 0 0
  1. # импортируйте библиотеку pandas
  2. import pandas as pn
  3.  
  4. # считайте csv-файл 'music_log.csv' в переменную df
  5. df = pn.read_csv('music_log.csv')
  6.  
  7. # переименуйте названия столбцов df
  8. df.rename(columns={'  user_id' : 'user_id', 'total play' : 'total_play', 'Artist' : 'artist'}, inplace = True)
  9.  
  10. # объявите список columns_to_replace с названиями столбцов track, artist, genre
  11. columns_to_replace = ['track', 'artist', 'genre']
  12.  
  13. # заполните отсутствующие значения столбцов из списка columns_to_replace значением 'unknown' в цикле
  14. for column in columns_to_replace:
  15.     df[column] = df[column].fillna('unknown')
  16.    
  17. # удалите строки-дубликаты из датафрейма df
  18. #df['genre'] = df['genre'].replace('электроника', 'electronic')
  19. df = df.drop_duplicates().reset_index(drop=True)
  20.  
  21. # выведите на экран первые 20 строчек обновлённого набора данных df
  22. print(df.head(20))
  23.  
Advertisement
Add Comment
Please, Sign In to add comment
Advertisement