Advertisement
Danila_lipatov

markov_cont_process

Mar 3rd, 2025
191
0
Never
Not a member of Pastebin yet? Sign Up, it unlocks many cool features!
Python 5.37 KB | None | 0 0
  1.     for ogrn in set_ogrn:
  2.         if pd.isna(ogrn) != True:
  3.             # result_migr = {}
  4.             result_migr = defaultdict(list)
  5.             time.sleep(0.01)
  6.             my_bar.progress(int(100 * counter / len(set_ogrn)), text=progress_text)
  7.             counter += 1
  8.             # result = {}
  9.             # result_migr = {}
  10.             pr = data_1.loc[data_1[col_ogrn] == ogrn].reset_index(drop=True).sort_values(col_date)
  11.             # start_dates = pr[col_date][0]
  12.             start_dates = start_date
  13.             # end_dates = pr[col_date][len(pr) - 1]
  14.             while start_dates < (datetime.strptime(end_dates, "%Y-%m-%d")).strftime('%Y-%m-%d'):
  15.                
  16.                 data_prev = pr[(pr[col_date] < start_dates)]
  17.                 end_date = (datetime.strptime(start_dates, "%Y-%m-%d") + curent_step).strftime('%Y-%m-%d')
  18.                 temp_df = pr[(pr[col_date] >= start_dates) & (pr[col_date] <= end_date)].reset_index().drop(columns=['index']).sort_values(col_date)
  19.                 first = pr[col_rating].iloc[0]  # Если только одна запись, берем ее
  20.                 if len(pr) > 1:
  21.                     transitions = []
  22.                     prev_rating = pr[col_rating].iloc[0]  # Начинаем с первого рейтинга
  23.  
  24.                     for i in range(1, len(pr)):  # Проходим по записям начиная со второго элемента
  25.                         cur_rating = pr[col_rating].iloc[i]
  26.                         prev_year = pd.to_datetime(pr[col_date].iloc[i - 1]).year
  27.                         cur_year = pd.to_datetime(pr[col_date].iloc[i]).year
  28.  
  29.                         if cur_year - prev_year >= 1:
  30.                             # print(ogrn, 'yes')
  31.                             pass  # Пропускаем большие разрывы во времени
  32.                         else:
  33.                             result_migr[prev_rating].append(cur_rating)
  34.                             # transitions.append((prev_rating, cur_rating))  # Запоминаем переход
  35.  
  36.                             prev_rating = cur_rating  # Обновляем "предыдущее" значение
  37.  
  38.                 else:
  39.                     if first in agency_dict:
  40.                         result_migr[first].append(first)
  41.  
  42.                 transition_counts = defaultdict(Counter)
  43.                 #
  44.                 # if first == 'D':
  45.                 #     print(ogrn, result_migr)
  46.  
  47.                 for start_rating in full_dict.keys():
  48.                     if start_rating in result_migr:
  49.                         for end_rating in result_migr[start_rating]:
  50.                             if start_rating == "CCC-C" and end_rating == "D":
  51.                                 counter_def += 1
  52.                             transition_counts[start_rating][end_rating] += 1
  53.                             full_[start_rating][end_rating] += 1
  54.                     else:
  55.                         for end_rating_ in full_dict.keys():
  56.                             transition_counts[start_rating][end_rating_] += 0
  57.                             full_[start_rating][end_rating_] += 0
  58.  
  59.                 transition_df = pd.DataFrame.from_dict(transition_counts, orient='index').fillna(0)
  60.                 # print(ogrn, transition_df)
  61.                 transition_df["Total"] = transition_df.sum(axis=1)
  62.                 df_sum = pd.DataFrame.from_dict(full_, orient='index').fillna(0)
  63.                 df_sum["Total"] = df_sum.sum(axis=1)
  64.                 # st.write(df_sum)
  65.                 # st.write(transition_df["Total"])
  66.                 for key, value_d in full_dict.items():
  67.                     for key_d, value_in_d in value_d.items():
  68.  
  69.                         if key_d in result_migr.values():
  70.                             counter_CC_D += 1
  71.  
  72.                         n_ = df_sum.at[key, "Total"]
  73.  
  74.                         if key in result_migr:
  75.                             if key_d in result_migr[key]:
  76.                                 # if key_d == key:
  77.                                 #     # print(key_d, key)
  78.                                 old_rank = agency_dict[key]
  79.                                 new_rank = agency_dict[key_d]
  80.                                 penalty = abs((new_rank - old_rank))
  81.  
  82.                                 if penalty == 0:
  83.                                     penalty = 1
  84.  
  85.                                 t_alpha = value_in_d["alpha"]
  86.                                 t_beta = value_in_d["beta"]
  87.  
  88.                                 full_dict[key][key_d]["alpha"] = t_alpha + transition_counts[key][key_d]
  89.                                 full_dict[key][key_d]["beta"] = t_beta + (transition_df.at[key, "Total"] - transition_counts[key][key_d])
  90.  
  91.                         weight = 1 / (1 + np.exp(-tau * (n_ - n0)))
  92.                         if transition_counts[key][key_d] == 0:
  93.                             old_rank = agency_dict[key]
  94.                             new_rank = agency_dict[key_d]
  95.                             # penalty = (new_rank - old_rank) ** 2
  96.                             penalty = abs((new_rank - old_rank))
  97.  
  98.                             if penalty == 0:
  99.                                 penalty = 1
  100.  
  101.                             full_dict[key][key_d]["beta"] += np.exp(penalty) * (1 - weight)
  102.                 start_dates = (datetime.strptime(start_dates, "%Y-%m-%d") + full_step).strftime('%Y-%m-%d')
Advertisement
Add Comment
Please, Sign In to add comment
Advertisement