Advertisement
Not a member of Pastebin yet?
Sign Up,
it unlocks many cool features!
- import pandas as pd
- data = pd.read_csv('/datasets/visits.csv', sep='\t')
- data['local_time'] = pd.to_datetime(
- data['date_time'], format='%Y-%m-%dT%H:%M:%S'
- ) + pd.Timedelta(hours=3)
- data['date_hour'] = data['local_time'].dt.round('1H')
- (data.query('id=="3c1e4c52"')
- .pivot_table(index='date_hour', values='time_spent', aggfunc='count')
- .plot(grid=True, figsize=(12, 5))
- )
- #Если между временем прибытия на АЗС и числом заездов нет никакой связи, это серьёзный повод насторожиться. Вряд ли количество заездов #в два часа ночи и в восемь утра одинаково. Чтобы понять, что же происходит, постройте график зависимости между временем прибытия и #количеством заездов в час.
- #Выполните следующие шаги, помня о бритве Оккама:
- #Сделайте срез из data по АЗС с id=="3c1e4c52".
- #Из данных этого среза постройте сводную таблицу, которая будет отображать количество заездов по времени прибытия. Передайте параметру #values значение 'time_spent'.
- #Из данных сводной таблицы постройте график зависимости между временем прибытия и количеством заездов в час (по аналогии с примером в #уроке). Добавьте линии сетки, задайте размер графика 12х5 дюймов.
Advertisement
Add Comment
Please, Sign In to add comment
Advertisement