Advertisement
Not a member of Pastebin yet?
Sign Up,
it unlocks many cool features!
- 1) Статистика по странам, можно оформить в виде круговой или столбцовой диаграммы где будут числа для разных стран (можно заранее выбрать скажем 5 конкретных стран для которых это делать):
- - % привитых людей в населении (можно будет связать с развитостью страны и тем насколько болезнь сильно протекала там, а протекание болезни через число заражённых выразить)
- - % людей, которые сделали вторую дозу вакцины после первой (см нужные столбцы в Vaccinations в README файле описания столбцов)
- 2) Зависимость числа новых заболевших от числа вакцинированных
- (предполагаю может случиться интересное явление, либо же можно найти страну где такое было: в промежутке от момента, где только начали колоть вакцину, до момента когда вакцинироваться стала большая часть людей, может наблюдаться зависимость, что число новых заражённых после того как придумали вакцину начало только расти. Этот эффект можно связать с тем, что у людей когда они узнали про вакцину снизились стимулы чтобы соблюдать тщательно меры предосторожности, носить маски и т.п., поэтому они стали забивать на это и стало больше заражений, тк на этом этапе эффект от вакцины был переоценён тк привитых мало было) - всё это очень красиво на графике изобразить
- можно
- 3) Из тупого: число новых заражённых от карантинных мер (stringency_index), из этого можно сказать насколько эффективно государство политику проводило + если извне взять данные то с ВВП сравнить stringency_index было бы интересно
- 4) Разобраться с тем как коэфф рождаемости считается, и после этого посомтреть снизилась ли рождаемость в пандемию, те стало ли людям страшнее за своих потенциальных детей, что время опасное + можно связать со снижением зарплат во многих семьях. А ещё можно как интересным фактом запихнуть что-то не из таблицы: Например в комментарии написать: Такая низкая рождаемость не наблюдалась со времён перестройки России
- 5) Вот это вроде интересная зависимость будет: Сравнить по странам как зависит число смертей и людей под ИВЛ от числа
- а) людей с сердечными заболеваниями
- б) медианного возраста
- в) числа курящих женщин и мужчин
- г) доли стариков в населении
- д) от handwashing_facilities (насколько у населения доступность есть к средствам гигиены)
- Таким образом можно найти наиболее уязвимые страны для ковида и связать с тем что ковид более опасен для сердечников, диабетиков и стариков
- 6) Тоже интересно:
- Сравнить как зависит число болеющих и смертей, а также то насколько жёстко и долго протекала основная волна ковида от
- а) ВВП
- б) Продолжительности жизни
- Можно будет сказать что либо перед ковидом равны как бедный так и богатые страны, либо же наоборот у богатых стран всё идёт лучше, тк у них больше средств на борьбу с короной
- 7) Сравнить степень тяжести ковида (заражённые) от того, насколько страна развитая, богатая, также от климата например как зависит протекание болезни или от континента. А ещё можно сравнить как это зависит от того насколько страна близка к автаркии - тут можно на группы будет страны поделить в каждую категорию скажем по 5-10 стран.
- 8) Всякие чисто статистические данные по типу: В Европе большая смертность была чем в Северной Америке
- 9) Можно запихнуть зависимость которая не относится к ковиду но интересная. Например связь ВВП и числа людей которые имеют доступ к мытью рук а также зависимость от региона - тут как раз можно запихнуть интересные штуки ДЛЯ ЛИНЕЙНОЙ РЕГРЕССИИ от многих факторов.
- Типа каким уравнением можно описать Числа людей за чертой бедности от Мытых рук, числа курящих женщин, курящих мужчин, старшего поколения и ВВП
- 10) Связь числа вакцинированных людей в % населения от того насколько много стариков и других людей которые более склонны умирать от короны.
- Если прививаются больше в странах где много людей которые могут умереть, то это можно связать как с тем что эти же старики бегут прививаться чтобы спасти жизнь, а также например с солидарностью к ним, что типа молодёжь прививается тк не хочет чтобы старшее поколение заразилось от них и умерло (также снова можно сранвить и сделать выводы где более ответственные люди проживают, а также проверить догадки эти, например погуглив доп данные интересные о том насколько пенсии большие например у стариков)
- Линейную регрессию запихнуть можно на самом деле куда угодно, но там вполне итак очевидные результаты будут по типу: Число людей под ИВЛ меняется пропорционально числу заболевших и числу позитивных тестов и отрицательно от контроля государсва
- или неочевидные штуки исопльзования линейной регрессии
- kNN можно тоже запихнуть по интересному:
- Классифицировать страны некоторые по их ВВП на душу, по числу людей с мытыми руками, курящих людей, медианному возрасту и т.д.
- И посмотреть как протекала корона в разных классах стран
- Потом методом kNN Россию куда-то постараться запихнуть и посмотреть насколько коронавирусная статистика по России соответсвует статистике стран в том классе к которому РОссию отнесли
Advertisement
Add Comment
Please, Sign In to add comment
Advertisement