Advertisement
AlexErin1308

TASK #2(23_03_24)

Mar 23rd, 2024
53
0
Never
Not a member of Pastebin yet? Sign Up, it unlocks many cool features!
Python 1.70 KB | Source Code | 0 0
  1. import pandas as pd
  2.  
  3. data = pd.read_csv('/datasets/visits.csv', sep='\t')
  4. data['local_time'] = pd.to_datetime(
  5.     data['date_time'], format='%Y-%m-%dT%H:%M:%S'
  6. ) + pd.Timedelta(hours=3)
  7. data['date_hour'] = data['local_time'].dt.round('1H')
  8. (data.query('id=="3c1e4c52"')
  9. .pivot_table(index='date_hour', values='time_spent', aggfunc='count')
  10. .plot(grid=True, figsize=(12, 5))
  11. )
  12. #Если между временем прибытия на АЗС и числом заездов нет никакой связи, это серьёзный повод насторожиться. Вряд ли количество заездов #в два часа ночи и в восемь утра одинаково. Чтобы понять, что же происходит, постройте график зависимости между временем прибытия и #количеством заездов в час.
  13. #Выполните следующие шаги, помня о бритве Оккама:
  14. #Сделайте срез из data по АЗС с id=="3c1e4c52".
  15. #Из данных этого среза постройте сводную таблицу, которая будет отображать количество заездов по времени прибытия. Передайте параметру #values значение 'time_spent'.
  16. #Из данных сводной таблицы постройте график зависимости между временем прибытия и количеством заездов в час (по аналогии с примером в #уроке). Добавьте линии сетки, задайте размер графика 12х5 дюймов.
Advertisement
Add Comment
Please, Sign In to add comment
Advertisement