Advertisement
cobija

pywikiconfig

Dec 24th, 2024
74
0
Never
Not a member of Pastebin yet? Sign Up, it unlocks many cool features!
Python 3.47 KB | Source Code | 0 0
  1. import re
  2.  
  3. # Regex pattern'larını önceden derle
  4. PATTERNS = {
  5.     'ara_bellek': re.compile(r'(?<![a-zA-Z])ara (B|b)elle'),
  6.     'cevrim_ici': re.compile(r'(?<![a-zA-Z])(C|c)(\u00e7|\u00c7)evrim (\u0130|i)\u00e7i'),
  7.     'cevrim_disi': re.compile(r'(?<![a-zA-Z])(C|c)(\u00e7|\u00c7)evrim (D|d)(\u0131|\u00d1)\u015fi'),
  8.     'bilim_kurgu': re.compile(r'(?<![a-zA-Z])(B|b)ilim (K|k)urgu'),
  9.     'on_deyis': re.compile(r'(?<![a-zA-Z])(\u00d6|\u00f6)n (D|d)eyiş'),
  10.     'on_yargi': re.compile(r'(?<![a-zA-Z])(\u00d6|\u00f6)n (Y|y)arg\u0131'),
  11.     'on_soz': re.compile(r'(?<![a-zA-Z])(\u00d6|\u00f6)n (S|s)\u00f6z'),
  12.     'on_bellek': re.compile(r'(?<![a-zA-Z])(\u00d6|\u00f6)n (B|b)elle'),
  13.     'veri_tabani': re.compile(r'(?<![a-zA-Z])(V|v)eri (T|t)aban'),
  14.     'veri_yolu': re.compile(r'(?<![a-zA-Z])(V|v)eri (Y|y)ol'),
  15.     'es_zaman': re.compile(r'(?<![a-zA-Z])(E|e)(\u015f|\u015e) (Z|z)aman'),
  16.     'ara_yuz': re.compile(r'(?<![a-zA-Z])ara (Y|y)(\u00fc|\u00dc)z')
  17. }
  18.  
  19. # Değişiklik yapılmayacak ifadeler
  20. excluded_phrases = {
  21.     'ara_yuz': [r'ara yüzey'],
  22.     'on_yargi': [r'ön yargılama'],
  23.     'on_soz': [r'ön sözleşme'],
  24.     'veri_yolu': [r'veri yolculuğu']
  25. }
  26.  
  27. # Değişiklik yapılmayacak maddeler
  28. excluded_pages = {"Orhan Duru", "Bilimkurgu", "Filiz Dağ", "Evrensel Bilim Kurgu ve Fantastik Film Festivali", "Bilim Kurgudaki Bilim: İmkânsızın Ardındaki Fizik", "Aylin Kabasakal"}
  29.  
  30. # Değiştirme eşleştirmeleri
  31. replacements = {
  32.     'ara_bellek': {
  33.         'Ara belle': 'Arabelle',
  34.         'Ara Belle': 'Arabelle',
  35.         'ara belle': 'arabelle'
  36.     },
  37.     'cevrim_ici': {
  38.         'Çevrim içi': 'Çevrimiçi',
  39.         'Çevrim İçi': 'Çevrimiçi',
  40.         'çevrim içi': 'çevrimiçi'
  41.     },
  42.     'cevrim_disi': {
  43.         'Çevrim dışı': 'Çevrimdışı',
  44.         'Çevrim Dışı': 'Çevrimdışı',
  45.         'çevrim dışı': 'çevrimdışı'
  46.     },
  47.     'bilim_kurgu': {
  48.         'Bilim kurgu': 'Bilimkurgu',
  49.         'Bilim Kurgu': 'Bilimkurgu',
  50.         'bilim kurgu': 'bilimkurgu'
  51.     },
  52.     'on_deyis': {
  53.         'Ön deyiş': 'Öndeyiş',
  54.         'Ön Deyiş': 'Öndeyiş',
  55.         'ön deyiş': 'öndeyiş'
  56.     },
  57.     'on_yargi': {
  58.         'Ön yargı': 'Önyargı',
  59.         'Ön Yargı': 'Önyargı',
  60.         'ön yargı': 'önyargı'
  61.     },
  62.     'on_soz': {
  63.         'Ön söz': 'Önsöz',
  64.         'Ön Söz': 'Önsöz',
  65.         'ön söz': 'önsöz'
  66.     },
  67.     'on_bellek': {
  68.         'Ön belle': 'Önbelle',
  69.         'Ön Belle': 'Önbelle',
  70.         'ön belle': 'önbelle'
  71.     },
  72.     'veri_tabani': {
  73.         'Veri taban': 'Veritaban',
  74.         'Veri Taban': 'Veritaban',
  75.         'veri taban': 'veritaban'
  76.     },
  77.     'veri_yolu': {
  78.         'Veri yol': 'Veriyol',
  79.         'Veri Yol': 'Veriyol',
  80.         'veri yol': 'veriyol'
  81.     },
  82.     'es_zaman': {
  83.         'Eş zaman': 'Eşzaman',
  84.         'Eş Zaman': 'Eşzaman',
  85.         'eş zaman': 'eşzaman'
  86.     },
  87.     'ara_yuz': {
  88.         'Ara yüz': 'Arayüz',
  89.         'Ara Yüz': 'Arayüz',
  90.         'ara yüz': 'arayüz'
  91.     }
  92. }
  93.  
  94. # Arama terimleri
  95. search_terms = {
  96.     '"\u00e7evrim içi"', '"bilim kurgu"', '"\u00f6n yargı"', '"\u00f6n söz"',
  97.     '"\u00f6n deyiş"', '"ara bellek"', '"\u00f6n bellek"',
  98.     '"veri tabanı"', '"veri yolu"', '"\u00e7evrim dışı"',
  99.     '"eş zaman"', '"ara yüz"'
  100. }
  101.  
  102. # Exclusions kontrolü öncelikli olarak uygulanır.
  103. def exclude_line(line, pattern_key):
  104.     return any(re.search(exclusion, line) for exclusion in exclusions.get(pattern_key, []))
Tags: vikipedi
Advertisement
Add Comment
Please, Sign In to add comment
Advertisement