Advertisement
Not a member of Pastebin yet?
Sign Up,
it unlocks many cool features!
- import pandas as pd
- import numpy as np
- import matplotlib.pyplot as plt
- data_msk = pd.read_csv('Москва_25_05_2022_16_09.csv')
- data_spb = pd.read_csv('Санкт-Петербург_25_05_2022_16_09.csv')
- data_uosh = pd.read_csv('Йошкар-Ола_25_05_2022_16_09.csv')
- """
- Минимальная скидка, частота встречи минимальной скидки и чему равна минимальная скидка
- """
- # data_msk1 = np.genfromtxt('Москва_19_05_2022_20_18.csv', dtype='int32')
- df1 = pd.DataFrame(data_msk)
- df2 = pd.DataFrame(data_spb)
- df3 = pd.DataFrame(data_uosh)
- #
- # print(df1)
- """
- Количество по каждой категории в городе Москва
- """
- cheap_msk = df1.loc[df1['Новая цена'] < 1000.0]["Продукты"].count()
- expensive_msk = df1.loc[df1['Новая цена'] > 1000.0]["Продукты"].count()
- """
- Количество по каждой категории в городе Санкт-Петербург
- """
- cheap_spb = df1.loc[df1['Новая цена'] < 300.0]["Продукты"].count()
- expensive_spb = df1.loc[df1['Новая цена'] > 1000.0]["Продукты"].count()
- """
- Количество по каждой категории в городе Йошкар-Ола
- """
- cheap_uosh = df1.loc[df1['Новая цена'] < 300.0]["Продукты"].count()
- expensive_uosh = df1.loc[df1['Новая цена'] > 1000.0]["Продукты"].count()
- """
- Количество по каждой категории в городе Москва
- """
- cheap_msk_old = df1.loc[df1['Старая цена'] < 300.0]["Продукты"].count()
- expensive_msk_old = df1.loc[df1['Старая цена'] > 1000.0]["Продукты"].count()
- """
- Количество по каждой категории в городе Санкт-Петербург
- """
- cheap_spb_old = df1.loc[df1['Старая цена'] < 300.0]["Продукты"].count()
- expensive_spb_old = df1.loc[df1['Старая цена'] > 1000.0]["Продукты"].count()
- """
- Количество по каждой категории в городе Йошкар-Ола
- """
- cheap_uosh_old = df1.loc[df1['Новая цена'] < 300.0]["Продукты"].count()
- expensive_uosh_old = df1.loc[df1['Новая цена'] > 1000.0]["Продукты"].count()
- """
- Разница товаров до скидки и после скидки в категориях по Москве
- """
- diff_cheap = abs(cheap_msk - cheap_msk_old)
- diff_expensive = abs(expensive_msk - expensive_msk_old)
- """
- Разница товаров до скидки и после скидки в категориях по Санкт-Петербургу
- """
- diff_cheap = abs(cheap_spb - cheap_spb_old)
- diff_expensive = abs(expensive_spb - expensive_spb_old)
- # print(diff_cheap, diff_middle, diff_expensive)
- #
- #
- #
- #
- #
- #
- #
- #
- # print(min(df1["Процент скидки"])) # минимальный процент по скидке мск
- #
- # print(min(df2["Процент скидки"])) # минимальный процент по скидке спб
- #
- # print(min(df3["Процент скидки"])) # минимальный процент по скидке йош
- #
- # print(df1.loc[df1['Процент скидки'] == min(df1["Процент скидки"])]['Продукты']) # товары с минимальной скидкой по мск
- # print("-"*50)
- # print(df2.loc[df2['Процент скидки'] == min(df2["Процент скидки"])]['Продукты']) # товары с минималльной скидкой по спб
- # print("-"*50)
- # print(df3.loc[df3['Процент скидки'] == min(df3["Процент скидки"])]['Продукты']) # товары с минималльной скидкой по йош
- # print("-"*50)
- #
- # print(max(df1["Процент скидки"])) # макс процент по скидке мск
- #
- # print(max(df2["Процент скидки"])) # макс процент по скидке спб
- #
- # print(max(df3["Процент скидки"])) # макс процент по скидке йош
- #
- # print(df1.loc[df1['Процент скидки'] == max(df1["Процент скидки"])]['Продукты']) # товары с макс скидкой по мск
- #
- # print(df2.loc[df2['Процент скидки'] == max(df2["Процент скидки"])]['Продукты']) # товары с макс скидкой по спб
- #
- # print(df3.loc[df3['Процент скидки'] == max(df3["Процент скидки"])]['Продукты']) # товары с макс скидкой по йош
- #
- #
- #
- #
- #
- #
- #
- #
- # print(min(df1))
- #
- # print('Общая информация по городу: Москва')
- # print(data_msk.describe())
- #
- # print("-"*20)
- #
- # print('Общая информация по городу: Санкт-Петербург')
- # print(data_spb.describe())
- #
- # print("-"*20)
- #
- # print('Общая информация по городу: Йошкар-Ола')
- # print(data_uosh.describe())
- #
- # print("-"*20)
- #
- # print(f'средний процент скидки msk : {data_msk["Процент скидки"].mean()} ') # средний процент скидки по Мск
- # print(f'средний процент скидки spb : {data_spb["Процент скидки"].mean()}') # средний процент скидки по Спб
- # print(f'средний процент скидки uosh : {data_uosh["Процент скидки"].mean()}') # средний процент скидки по Йош
- #
- # # data_msk["Процент скидки"]
- # d2 = data_spb["Процент скидки"].plot()# распределение скидки по товарам
- # # plt.show()
- #
- # fig, td_plot = plt.subplots()
- # td_plot.plot(data_msk.index, data_msk["Процент скидки"])
- # td_plot.plot(data_spb.index, data_spb["Процент скидки"])
- # td_plot.plot(data_uosh.index, data_uosh["Процент скидки"])
- # plt.show()
- #
- #
- # # print(df1["Процент скидки"].plot(kind='hist', bins=30)) # количество товаров по скидке
- #
- # # print(df1.info())
- # # print(df1["Старая цена"].hist(bins=30, log=True))
- #
- # plt.show()
Advertisement
Add Comment
Please, Sign In to add comment
Advertisement