Advertisement
AlexErin1308

TASK #1(23_03_24)

Mar 23rd, 2024
53
0
Never
Not a member of Pastebin yet? Sign Up, it unlocks many cool features!
Python 2.53 KB | Source Code | 0 0
  1. import pandas as pd
  2.  
  3. data = pd.read_csv('/datasets/visits.csv', sep='\t')
  4. #print(data.head())
  5.  
  6. data['date_time'] = pd.to_datetime(data['date_time'], format='%Y%m%dT%H%M%S')
  7. #print(data.head())
  8.  
  9. data['local_time'] = data['date_time'] + pd.Timedelta(hours=3)
  10. print(data.head())
  11.  
  12. data['date_hour'] = data['local_time'].dt.round('1H')
  13. print(data.head())
  14. .
  15. Причиной коротких заездов может быть то, что водители нечаянно заезжают на АЗС, которые не работают по ночам. Если это действительно так, то вы увидите связь между короткими заездами и временем прибытия. Чтобы проверить эту гипотезу, измените тип столбца date_time на более удобный тип для даты.
  16. Методом pd.to_datetime() переведите значения столбца date_time в таблице data в объекты datetime. В параметре format= укажите строку, соответствующую текущему формату date_time, с помощью специальных обозначений.
  17. Выведите на экран первые пять строк data, чтобы проверить, что получилось.
  18. Напомним, что в датафрейме записано время UTC. Московское рассчитывают как UTC + 3 часа.
  19. Создайте столбец data['local_time'] и сохраните в нём сдвинутое на 3 часа время из столбца data['date_time']. Напечатайте первые 5 строк таблицы data.
  20. Данные, связанные со временем, лучше округлять до той величины, которой будет достаточно для детального анализа. Чтобы проанализировать взаимосвязь между временем прибытия на АЗС и продолжительностью заезда, точность до минут и секунд не нужна. Округлите время до часов.
  21. Выполните следующие шаги:
  22. Создайте новый столбец date_hour и передайте ему значения столбца local_time, округлённые до часов.
  23. Выведите первые пять строк data, чтобы проверить результаты.
  24.  
Advertisement
Add Comment
Please, Sign In to add comment
Advertisement