Advertisement
Alaricy

статусы пока компилируются

Oct 18th, 2022
83
0
Never
Not a member of Pastebin yet? Sign Up, it unlocks many cool features!
C++ 6.79 KB | None | 0 0
  1. #include <algorithm>
  2. #include <cmath>
  3. #include <iostream>
  4. #include <map>
  5. #include <set>
  6. #include <string>
  7. #include <utility>
  8. #include <vector>
  9.  
  10. using namespace std;
  11.  
  12. const int MAX_RESULT_DOCUMENT_COUNT = 5;
  13.  
  14. string ReadLine() {
  15.     string s;
  16.     getline(cin, s);
  17.     return s;
  18. }
  19.  
  20. int ReadLineWithNumber() {
  21.     int result;
  22.     cin >> result;
  23.     ReadLine();
  24.     return result;
  25. }
  26.  
  27. vector<string> SplitIntoWords(const string& text) {
  28.     vector<string> words;
  29.     string word;
  30.     for (const char c : text) {
  31.         if (c == ' ') {
  32.             words.push_back(word);
  33.             word = "";
  34.         } else {
  35.             word += c;
  36.         }
  37.     }
  38.     words.push_back(word);
  39.    
  40.     return words;
  41. }
  42.    
  43. struct Document {
  44.     int id;
  45.     double relevance;
  46.     int rating;
  47. };
  48. enum DocumentStatus {
  49.         ACTUAL,
  50.         IRRELEVANT,
  51.         BANNED,
  52.         REMOVED
  53. };
  54.  
  55. class SearchServer {
  56. public:
  57.     void SetStopWords(const string& text) {
  58.         for (const string& word : SplitIntoWords(text)) {
  59.             stop_words_.insert(word);
  60.         }
  61.     }    
  62.    
  63.     void AddDocument(int document_id, const string& document, DocumentStatus status, const vector<int>& ratings) {
  64.         const vector<string> words = SplitIntoWordsNoStop(document);
  65.         const double inv_word_count = 1.0 / words.size();
  66.         documents_status_[document_id]=status;
  67.         for (const string& word : words) {
  68.             word_to_document_freqs_[word][document_id] += inv_word_count;
  69.         }
  70.         document_ratings_.emplace(document_id, ComputeAverageRating(ratings));
  71.     }
  72.  
  73.     vector<Document> FindTopDocuments(const string& raw_query) const {            
  74.         const Query query = ParseQuery(raw_query);
  75.         auto matched_documents = FindAllDocuments(query);
  76.        
  77.         sort(matched_documents.begin(), matched_documents.end(),
  78.              [](const Document& lhs, const Document& rhs) {
  79.                  return lhs.relevance > rhs.relevance;
  80.              });
  81.         if (matched_documents.size() > MAX_RESULT_DOCUMENT_COUNT) {
  82.             matched_documents.resize(MAX_RESULT_DOCUMENT_COUNT);
  83.         }
  84.         return matched_documents;
  85.     }
  86.    
  87. private:
  88.     set<string> stop_words_;
  89.     map<string, map<int, double>> word_to_document_freqs_;
  90.     map<int, int> document_ratings_;
  91.     map<int, DocumentStatus> documents_status_;
  92.    
  93.     bool IsStopWord(const string& word) const {
  94.         return stop_words_.count(word) > 0;
  95.     }
  96.    
  97.     vector<string> SplitIntoWordsNoStop(const string& text) const {
  98.         vector<string> words;
  99.         for (const string& word : SplitIntoWords(text)) {
  100.             if (!IsStopWord(word)) {
  101.                 words.push_back(word);
  102.             }
  103.         }
  104.         return words;
  105.     }
  106.    
  107.     static int ComputeAverageRating(const vector<int>& ratings) {
  108.         int rating_sum = 0;
  109.         for (const int rating : ratings) {
  110.             rating_sum += rating;
  111.         }
  112.         return rating_sum / static_cast<int>(ratings.size());
  113.     }
  114.    
  115.     struct QueryWord {
  116.         string data;
  117.         bool is_minus;
  118.         bool is_stop;
  119.     };
  120.    
  121.     QueryWord ParseQueryWord(string text) const {
  122.         bool is_minus = false;
  123.         // Word shouldn't be empty
  124.         if (text[0] == '-') {
  125.             is_minus = true;
  126.             text = text.substr(1);
  127.         }
  128.         return {
  129.             text,
  130.             is_minus,
  131.             IsStopWord(text)
  132.         };
  133.     }
  134.    
  135.     struct Query {
  136.         set<string> plus_words;
  137.         set<string> minus_words;
  138.     };
  139.    
  140.     Query ParseQuery(const string& text) const {
  141.         Query query;
  142.         for (const string& word : SplitIntoWords(text)) {
  143.             const QueryWord query_word = ParseQueryWord(word);
  144.             if (!query_word.is_stop) {
  145.                 if (query_word.is_minus) {
  146.                     query.minus_words.insert(query_word.data);
  147.                 } else {
  148.                     query.plus_words.insert(query_word.data);
  149.                 }
  150.             }
  151.         }
  152.         return query;
  153.     }
  154.    
  155.     // Existence required
  156.     double ComputeWordInverseDocumentFreq(const string& word) const {
  157.         return log(document_ratings_.size() * 1.0 / word_to_document_freqs_.at(word).size());
  158.     }
  159.  
  160.     vector<Document> FindAllDocuments(const Query& query) const {
  161.         map<int, double> document_to_relevance;
  162.         for (const string& word : query.plus_words) {
  163.             if (word_to_document_freqs_.count(word) == 0) {
  164.                 continue;
  165.             }
  166.             const double inverse_document_freq = ComputeWordInverseDocumentFreq(word);
  167.             for (const auto [document_id, term_freq] : word_to_document_freqs_.at(word)) {
  168.                 document_to_relevance[document_id] += term_freq * inverse_document_freq;
  169.             }
  170.         }
  171.        
  172.         for (const string& word : query.minus_words) {
  173.             if (word_to_document_freqs_.count(word) == 0) {
  174.                 continue;
  175.             }
  176.             for (const auto [document_id, _] : word_to_document_freqs_.at(word)) {
  177.                 document_to_relevance.erase(document_id);
  178.             }
  179.         }
  180.  
  181.         vector<Document> matched_documents;
  182.         for (const auto [document_id, relevance] : document_to_relevance) {
  183.             matched_documents.push_back({
  184.                 document_id,
  185.                 relevance,
  186.                 document_ratings_.at(document_id)
  187.             });
  188.         }
  189.         return matched_documents;
  190.     }
  191. };
  192.  
  193.  
  194. SearchServer CreateSearchServer() {
  195.     SearchServer search_server;
  196.     search_server.SetStopWords(ReadLine());
  197.  
  198.     const int document_count = ReadLineWithNumber();
  199.     for (int document_id = 0; document_id < document_count; ++document_id) {
  200.         const string document = ReadLine();
  201.         int ratings_size;
  202.         cin >> ratings_size;
  203.         int status_id;
  204.         cin >> status_id;
  205.        
  206.         // создали вектор размера ratings_size из нулей
  207.         vector<int> ratings(ratings_size, 0);
  208.        
  209.         // считали каждый элемент с помощью ссылки
  210.         for (int& rating : ratings) {
  211.             cin >> rating;
  212.         }
  213.        
  214.        
  215.         search_server.AddDocument(document_id, document, static_cast<DocumentStatus>(status_id), ratings);
  216.         ReadLine();
  217.     }
  218.    
  219.     return search_server;
  220. }
  221.  
  222.  
  223. int main() {
  224.     const SearchServer search_server = CreateSearchServer();
  225.  
  226.     const string query = ReadLine();
  227.     for (const Document& document : search_server.FindTopDocuments(query)) {
  228.         cout << "{ "
  229.              << "document_id = " << document.id << ", "
  230.              << "relevance = " << document.relevance << ", "
  231.              << "rating = " << document.rating
  232.              << " }" << endl;
  233.     }
  234. }
Advertisement
Add Comment
Please, Sign In to add comment
Advertisement