Advertisement
Not a member of Pastebin yet?
Sign Up,
it unlocks many cool features!
- # Импортируем необходимые библиотеки:
- import pandas as pd
- import matplotlib.pyplot as plt
- import seaborn as sns
- # Загрузим данные в переменную df:
- df = pd.read_csv('https://code.s3.yandex.net/datasets/real_estate_data_n_missing.csv')
- # Отфильтруем аномально высокое значение высоты потолка:
- df = df.query('ceiling_height < 100')
- # Преобразуем все значения потолка с высотой более 20 метров:
- df.loc[df['ceiling_height'] > 20, 'ceiling_height'] /= 10
- # Выделим данные с низкими потолками (менее 2.6 м) в отдельный датасет:
- low_ceiling_height_df = df.query('ceiling_height < 2.6')
- # Изучим основные статистические показатели ceiling_height в новом срезе данных:
- print(low_ceiling_height_df['ceiling_height'].describe())
- # Построим диаграмму размаха по новому срезу данных:
- plt.figure(figsize=(12, 4))
- sns.boxplot(data=low_ceiling_height_df, x='ceiling_height')
- # Добавим оформление графика:
- plt.title('Диаграма размаха значений высоты потолка', fontsize=16)
- plt.xlabel('Высота потолка', fontsize=14)
- plt.ylabel(None)
- plt.grid()
- plt.show()
- # Изучем долю квартир с высотой потолков 2.4 и менее метров:
- low_ceiling_height_amount = df.loc[df['ceiling_height'] <= 2.4, 'ceiling_height'].count()
- total_amount = df['ceiling_height'].count()
- share = low_ceiling_height_amount / total_amount
- print(f'Доля квартир с высотой потолков 2.4 м и ниже: {share:.2%}')
- # Отфильтруем квартиры с потолком 2.4 и менее метров:
- df = df.query('ceiling_height < 2.4')
- # Проверим результат и найдём минимальную высоту потолка:
- min_ceiling_height = df['ceiling_height'].min()
- print('Минимальная высота потолка:', min_ceiling_height)
Advertisement
Add Comment
Please, Sign In to add comment
Advertisement