Advertisement
Not a member of Pastebin yet?
Sign Up,
it unlocks many cool features!
- import re
- # Regex pattern'larını önceden derle
- PATTERNS = {
- 'ara_bellek': re.compile(r'(?<![a-zA-Z])ara (B|b)elle'),
- 'cevrim_ici': re.compile(r'(?<![a-zA-Z])(C|c)(\u00e7|\u00c7)evrim (\u0130|i)\u00e7i'),
- 'cevrim_disi': re.compile(r'(?<![a-zA-Z])(C|c)(\u00e7|\u00c7)evrim (D|d)(\u0131|\u00d1)\u015fi'),
- 'bilim_kurgu': re.compile(r'(?<![a-zA-Z])(B|b)ilim (K|k)urgu'),
- 'on_deyis': re.compile(r'(?<![a-zA-Z])(\u00d6|\u00f6)n (D|d)eyiş'),
- 'on_yargi': re.compile(r'(?<![a-zA-Z])(\u00d6|\u00f6)n (Y|y)arg\u0131'),
- 'on_soz': re.compile(r'(?<![a-zA-Z])(\u00d6|\u00f6)n (S|s)\u00f6z'),
- 'on_bellek': re.compile(r'(?<![a-zA-Z])(\u00d6|\u00f6)n (B|b)elle'),
- 'veri_tabani': re.compile(r'(?<![a-zA-Z])(V|v)eri (T|t)aban'),
- 'veri_yolu': re.compile(r'(?<![a-zA-Z])(V|v)eri (Y|y)ol'),
- 'es_zaman': re.compile(r'(?<![a-zA-Z])(E|e)(\u015f|\u015e) (Z|z)aman'),
- 'ara_yuz': re.compile(r'(?<![a-zA-Z])ara (Y|y)(\u00fc|\u00dc)z')
- }
- # Değişiklik yapılmayacak ifadeler
- excluded_phrases = {
- 'ara_yuz': [r'ara yüzey'],
- 'on_yargi': [r'ön yargılama'],
- 'on_soz': [r'ön sözleşme'],
- 'veri_yolu': [r'veri yolculuğu']
- }
- # Değişiklik yapılmayacak maddeler
- excluded_pages = {"Orhan Duru", "Bilimkurgu", "Filiz Dağ", "Evrensel Bilim Kurgu ve Fantastik Film Festivali", "Bilim Kurgudaki Bilim: İmkânsızın Ardındaki Fizik", "Aylin Kabasakal"}
- # Değiştirme eşleştirmeleri
- replacements = {
- 'ara_bellek': {
- 'Ara belle': 'Arabelle',
- 'Ara Belle': 'Arabelle',
- 'ara belle': 'arabelle'
- },
- 'cevrim_ici': {
- 'Çevrim içi': 'Çevrimiçi',
- 'Çevrim İçi': 'Çevrimiçi',
- 'çevrim içi': 'çevrimiçi'
- },
- 'cevrim_disi': {
- 'Çevrim dışı': 'Çevrimdışı',
- 'Çevrim Dışı': 'Çevrimdışı',
- 'çevrim dışı': 'çevrimdışı'
- },
- 'bilim_kurgu': {
- 'Bilim kurgu': 'Bilimkurgu',
- 'Bilim Kurgu': 'Bilimkurgu',
- 'bilim kurgu': 'bilimkurgu'
- },
- 'on_deyis': {
- 'Ön deyiş': 'Öndeyiş',
- 'Ön Deyiş': 'Öndeyiş',
- 'ön deyiş': 'öndeyiş'
- },
- 'on_yargi': {
- 'Ön yargı': 'Önyargı',
- 'Ön Yargı': 'Önyargı',
- 'ön yargı': 'önyargı'
- },
- 'on_soz': {
- 'Ön söz': 'Önsöz',
- 'Ön Söz': 'Önsöz',
- 'ön söz': 'önsöz'
- },
- 'on_bellek': {
- 'Ön belle': 'Önbelle',
- 'Ön Belle': 'Önbelle',
- 'ön belle': 'önbelle'
- },
- 'veri_tabani': {
- 'Veri taban': 'Veritaban',
- 'Veri Taban': 'Veritaban',
- 'veri taban': 'veritaban'
- },
- 'veri_yolu': {
- 'Veri yol': 'Veriyol',
- 'Veri Yol': 'Veriyol',
- 'veri yol': 'veriyol'
- },
- 'es_zaman': {
- 'Eş zaman': 'Eşzaman',
- 'Eş Zaman': 'Eşzaman',
- 'eş zaman': 'eşzaman'
- },
- 'ara_yuz': {
- 'Ara yüz': 'Arayüz',
- 'Ara Yüz': 'Arayüz',
- 'ara yüz': 'arayüz'
- }
- }
- # Arama terimleri
- search_terms = {
- '"\u00e7evrim içi"', '"bilim kurgu"', '"\u00f6n yargı"', '"\u00f6n söz"',
- '"\u00f6n deyiş"', '"ara bellek"', '"\u00f6n bellek"',
- '"veri tabanı"', '"veri yolu"', '"\u00e7evrim dışı"',
- '"eş zaman"', '"ara yüz"'
- }
- # Exclusions kontrolü öncelikli olarak uygulanır.
- def exclude_line(line, pattern_key):
- return any(re.search(exclusion, line) for exclusion in exclusions.get(pattern_key, []))
Advertisement
Add Comment
Please, Sign In to add comment
Advertisement