Advertisement
Vitaliy_Novichikhin

10..8.1 8.Лаборатория алгоритма предобработки верный код 08.03.py

Mar 8th, 2022
2,302
0
Never
Not a member of Pastebin yet? Sign Up, it unlocks many cool features!
Python 1.06 KB | None | 0 0
  1. # импортируйте библиотеку pandas
  2. import pandas as pd
  3. # считайте csv-файл 'music_log.csv' в переменную df
  4. df = pd.read_csv('music_log.csv')
  5. # переименуйте названия столбцов df
  6. df.rename(columns = {'  user_id' : 'user_id',
  7.                      'total play' : 'total_play',
  8.                      'Artist' : 'artist'}, inplace = True)
  9. # объявите список columns_to_replace с названиями столбцов track, artist, genre
  10. columns_to_replace =  ['track', 'artist', 'genre']
  11. # заполните отсутствующие значения столбцов из списка columns_to_replace значением 'unknown' в цикле
  12. for column in columns_to_replace:
  13.     df[column] = df[column].fillna('unknown')
  14. # удалите строки-дубликаты из датафрейма df
  15. df = df.drop_duplicates().reset_index(drop=True)
  16. # выведите на экран первые 20 строчек обновлённого набора данных df
  17. print(df.head(20))
Advertisement
Add Comment
Please, Sign In to add comment
Advertisement