AlexErin1308

Task #1

Mar 6th, 2024
37
0
Never
Not a member of Pastebin yet? Sign Up, it unlocks many cool features!
Python 1.00 KB | Source Code | 0 0
  1. # импортируем библиотеку pandas
  2. import pandas as pd
  3.  
  4. # создаём датафрейм metrica из CSV-файла
  5. metrica = pd.read_csv('/datasets/metrica_data.csv')
  6.  
  7. # перебираем каждый тип девайса в наборе уникальных значений столба device_type
  8. for d in metrica['device_type'].unique():
  9.     # на каждом шаге цикла с помощью атрибута loc выбираем строки,
  10.     # в которых в device_type текущий тип девайса (d) и есть пропуски в time
  11.     metrica.loc[(metrica['device_type'] == d) & (metrica['time'].isna()), 'time'] = \
  12.     metrica.loc[(metrica['device_type'] == d), 'time'].mean()
  13.     # и записываем в них среднее значение time среди строк с текущим типом девайса (d)
  14.  
  15. # проверяем, что все пропуски заполнены
  16. print(metrica['time'].isna().sum())
Add Comment
Please, Sign In to add comment