Advertisement
Alaricy

сделал с рейтингом

Oct 14th, 2022 (edited)
124
0
Never
Not a member of Pastebin yet? Sign Up, it unlocks many cool features!
C++ 6.45 KB | None | 0 0
  1. #include <algorithm>
  2. #include <cmath>
  3. #include <iostream>
  4. #include <map>
  5. #include <set>
  6. #include <string>
  7. #include <utility>
  8. #include <vector>
  9. #include <numeric>
  10.  
  11. using namespace std;
  12.  
  13. const int MAX_RESULT_DOCUMENT_COUNT = 5;
  14.  
  15. vector<string> SplitIntoWords(const string& text) {
  16.     vector<string> words;
  17.     string word;
  18.     for (const char c : text) {
  19.         if (c == ' ') {
  20.             if (!word.empty()) {
  21.                 words.push_back(word);
  22.                 word.clear();
  23.             }
  24.         } else {
  25.             word += c;
  26.         }
  27.     }
  28.     if (!word.empty()) {
  29.         words.push_back(word);
  30.     }
  31.  
  32.     return words;
  33. }
  34.  
  35. vector <int> ReadRating(){
  36.     vector<int> ratings;
  37.     vector<string> text_ratings;
  38.     string raw_ratings;
  39.     getline(cin, raw_ratings);
  40.     text_ratings=SplitIntoWords(raw_ratings);
  41.         for (int i=1; i<text_ratings.size(); ++i){
  42.             ratings.push_back(stoi(text_ratings[i]));
  43.         //         cout << ratings[i-1] <<"/";
  44.         }
  45.   //  cout<< endl;
  46.     return ratings;                          
  47. }
  48.  
  49. string ReadLine() {
  50.     string s;
  51.     getline(cin, s);
  52.     return s;
  53. }
  54.  
  55. int ReadLineWithNumber() {
  56.     int result;
  57.     cin >> result;
  58.     ReadLine();
  59.     return result;
  60. }
  61.  
  62. struct Document {
  63.     int id;
  64.     double relevance;
  65.     int rating;
  66. };
  67.  
  68. class SearchServer {
  69. public:
  70.     void SetStopWords(const string& text) {
  71.         for (const string& word : SplitIntoWords(text)) {
  72.             stop_words_.insert(word);
  73.         }
  74.     }
  75.  
  76.     void AddDocument(int document_id, const string& document, const vector<int> ratings) {
  77.         ++document_count_;        
  78.         document_ratings_[document_id]=ComputeAverageRating(ratings);
  79.        
  80.         const vector<string> words = SplitIntoWordsNoStop(document);
  81.         const double inv_word_count = 1.0 / words.size();
  82.         for (const string& word : words) {
  83.             word_to_document_freqs_[word][document_id] += inv_word_count;
  84.         }
  85.     }
  86.  
  87.     vector<Document> FindTopDocuments(const string& raw_query) const {
  88.         const Query query = ParseQuery(raw_query);
  89.         auto matched_documents = FindAllDocuments(query);
  90.  
  91.         sort(matched_documents.begin(), matched_documents.end(),
  92.              [](const Document& lhs, const Document& rhs) {
  93.                  return lhs.relevance > rhs.relevance;
  94.              });
  95.         if (matched_documents.size() > MAX_RESULT_DOCUMENT_COUNT) {
  96.             matched_documents.resize(MAX_RESULT_DOCUMENT_COUNT);
  97.         }
  98.         return matched_documents;
  99.     }
  100.  
  101. private:
  102.     int document_count_ = 0;
  103.     set<string> stop_words_;
  104.     map<string, map<int, double>> word_to_document_freqs_;
  105.     map<int,int> document_ratings_;
  106.  
  107.     bool IsStopWord(const string& word) const {
  108.         return stop_words_.count(word) > 0;
  109.     }
  110.  
  111.     vector<string> SplitIntoWordsNoStop(const string& text) const {
  112.         vector<string> words;
  113.         for (const string& word : SplitIntoWords(text)) {
  114.             if (!IsStopWord(word)) {
  115.                 words.push_back(word);
  116.             }
  117.         }
  118.         return words;
  119.     }
  120.  
  121.     struct QueryWord {
  122.         string data;
  123.         bool is_minus;
  124.         bool is_stop;
  125.     };
  126.  
  127.     QueryWord ParseQueryWord(string text) const {
  128.         bool is_minus = false;
  129.         // Word shouldn't be empty
  130.         if (text[0] == '-') {
  131.             is_minus = true;
  132.             text = text.substr(1);
  133.         }
  134.         return {text, is_minus, IsStopWord(text)};
  135.     }
  136.  static int ComputeAverageRating(const vector<int>& ratings) {
  137.     int size = ratings.size();
  138.     int rating = accumulate(ratings.begin(), ratings.end(), 0)/size;
  139.     return rating;
  140. }
  141.     struct Query {
  142.         set<string> plus_words;
  143.         set<string> minus_words;
  144.     };
  145.  
  146.     Query ParseQuery(const string& text) const {
  147.         Query query;
  148.         for (const string& word : SplitIntoWords(text)) {
  149.             const QueryWord query_word = ParseQueryWord(word);
  150.             if (!query_word.is_stop) {
  151.                 if (query_word.is_minus) {
  152.                     query.minus_words.insert(query_word.data);
  153.                 } else {
  154.                     query.plus_words.insert(query_word.data);
  155.                 }
  156.             }
  157.         }
  158.         return query;
  159.     }
  160.  
  161.     // Existence required
  162.     double ComputeWordInverseDocumentFreq(const string& word) const {
  163.         return log(document_count_ * 1.0 / word_to_document_freqs_.at(word).size());
  164.     }
  165.  
  166.     vector<Document> FindAllDocuments(const Query& query) const {
  167.         map<int, double> document_to_relevance;
  168.         for (const string& word : query.plus_words) {
  169.             if (word_to_document_freqs_.count(word) == 0) {
  170.                 continue;
  171.             }
  172.             const double inverse_document_freq = ComputeWordInverseDocumentFreq(word);
  173.             for (const auto [document_id, term_freq] : word_to_document_freqs_.at(word)) {
  174.                 document_to_relevance[document_id] += term_freq * inverse_document_freq;
  175.             }
  176.         }
  177.  
  178.         for (const string& word : query.minus_words) {
  179.             if (word_to_document_freqs_.count(word) == 0) {
  180.                 continue;
  181.             }
  182.             for (const auto [document_id, _] : word_to_document_freqs_.at(word)) {
  183.                 document_to_relevance.erase(document_id);
  184.             }
  185.         }
  186.  
  187.         vector<Document> matched_documents;
  188.         for (const auto [document_id, relevance] : document_to_relevance) {
  189.             matched_documents.push_back({document_id, relevance, document_ratings_.at(document_id)});
  190.         }
  191.         return matched_documents;
  192.     }
  193. };
  194.  
  195. SearchServer CreateSearchServer() {
  196.     SearchServer search_server;
  197.     search_server.SetStopWords(ReadLine());
  198.  
  199.     const int document_count = ReadLineWithNumber();
  200.     for (int document_id = 0; document_id < document_count; ++document_id) {
  201.         string txt=ReadLine();
  202.         vector<int> vnum=ReadRating();
  203.        // vector<int> num=ComputeAverageRating(vnum);
  204.         search_server.AddDocument(document_id, txt, vnum);
  205.     }
  206.  
  207.     return search_server;
  208. }
  209.  
  210. int main() {
  211.     const SearchServer search_server = CreateSearchServer();
  212.  
  213.     const string query = ReadLine();
  214.     for (auto [document_id, relevance, rating] : search_server.FindTopDocuments(query)) {
  215.         cout << "{ document_id = "s << document_id << ", "s
  216.              << "relevance = "s << relevance <<", rating = "s << rating <<" }"s << endl;
  217.     }
  218. }
Advertisement
Add Comment
Please, Sign In to add comment
Advertisement