a_khuzina

Stemming

Nov 17th, 2021 (edited)
70
0
Never
Not a member of Pastebin yet? Sign Up, it unlocks many cool features!
Python 0.98 KB | None | 0 0
  1. queries = ["эпл айфоны",
  2.            "купить эпл телефон",
  3.            "лучшие смартфоны",
  4.            "барон фон",
  5.            "смартфон эпл айфон",
  6.            "смартфоны 2019",
  7.            "эплан",
  8.            "фоновая музыка",
  9.            "эпл айфоны икс",
  10.            "эпл айфон 64гб",
  11.            "фон для фото",
  12.            "купить эпл",
  13.            "эпл айфон купить",
  14.            "эплеренон купить",
  15.            "смартфон где купить",
  16.            "эплан показания",
  17.            "смартфон huawei",
  18.            "эпл"]
  19.  
  20. from nltk.stem import SnowballStemmer
  21. russian_stemmer = SnowballStemmer('russian')
  22.  
  23. for query in queries:
  24.     for word in query.split():
  25.         stemmed_word = russian_stemmer.stem(word)
  26.         if stemmed_word == 'эпл':
  27.              print(query)    
Add Comment
Please, Sign In to add comment