Advertisement
chevengur

CПРИНТ № 2 | Пары и кортежи | Урок 6: Возврат нескольких значений из функции

Oct 17th, 2023
246
0
Never
Not a member of Pastebin yet? Sign Up, it unlocks many cool features!
C++ 7.96 KB | None | 0 0
  1. #include <algorithm>
  2. #include <cmath>
  3. #include <iostream>
  4. #include <map>
  5. #include <set>
  6. #include <string>
  7. #include <utility>
  8. #include <vector>
  9.  
  10. using namespace std;
  11.  
  12. const int MAX_RESULT_DOCUMENT_COUNT = 5;
  13.  
  14. string ReadLine() {
  15.     string s;
  16.     getline(cin, s);
  17.     return s;
  18. }
  19.  
  20. int ReadLineWithNumber() {
  21.     int result;
  22.     cin >> result;
  23.     ReadLine();
  24.     return result;
  25. }
  26.  
  27. vector<string> SplitIntoWords(const string& text) {
  28.     vector<string> words;
  29.     string word;
  30.     for (const char c : text) {
  31.         if (c == ' ') {
  32.             if (!word.empty()) {
  33.                 words.push_back(word);
  34.                 word.clear();
  35.             }
  36.         } else {
  37.             word += c;
  38.         }
  39.     }
  40.     if (!word.empty()) {
  41.         words.push_back(word);
  42.     }
  43.  
  44.     return words;
  45. }
  46.  
  47. struct Document {
  48.     int id;
  49.     double relevance;
  50.     int rating;
  51. };
  52.  
  53. enum class DocumentStatus {
  54.     ACTUAL,
  55.     IRRELEVANT,
  56.     BANNED,
  57.     REMOVED,
  58. };
  59.  
  60. class SearchServer {
  61. public:
  62.     void SetStopWords(const string& text) {
  63.         for (const string& word : SplitIntoWords(text)) {
  64.             stop_words_.insert(word);
  65.         }
  66.     }
  67.  
  68.     tuple<vector<string>, DocumentStatus> MatchDocument(const string& raw_query, int document_id) const{
  69.         vector<string>match_document;
  70.         auto query = ParseQuery(raw_query);
  71.         for(const auto& word: query.plus_words){
  72.             if(word_to_document_freqs_.count(word)==0){
  73.                 continue;
  74.             }
  75.             if(word_to_document_freqs_.at(word).count(document_id)){
  76.                 match_document.push_back(word);
  77.             }
  78.         }
  79.  
  80.         for(const auto& word: query.minus_words){
  81.             if(word_to_document_freqs_.count(word) == 0){
  82.                 continue;
  83.             }
  84.             if(word_to_document_freqs_.at(word).count(document_id)){
  85.                 match_document.clear();
  86.                 break;
  87.             }
  88.         }
  89.  
  90.         return {match_document, documents_.at(document_id).status};
  91.  
  92.     }
  93.  
  94.     int GetDocumentCount() const{
  95.         return documents_.size();
  96.     }
  97.  
  98.     void AddDocument(int document_id, const string& document, DocumentStatus status,
  99.                      const vector<int>& ratings) {
  100.         const vector<string> words = SplitIntoWordsNoStop(document);
  101.         const double inv_word_count = 1.0 / words.size();
  102.         for (const string& word : words) {
  103.             word_to_document_freqs_[word][document_id] += inv_word_count;
  104.         }
  105.         documents_.emplace(document_id, DocumentData{ComputeAverageRating(ratings), status});
  106.     }
  107.  
  108.     vector<Document> FindTopDocuments(const string& raw_query,
  109.                                       DocumentStatus status = DocumentStatus::ACTUAL) const {
  110.         const Query query = ParseQuery(raw_query);
  111.         auto matched_documents = FindAllDocuments(query, status);
  112.  
  113.         sort(matched_documents.begin(), matched_documents.end(),
  114.              [](const Document& lhs, const Document& rhs) {
  115.                  return lhs.relevance > rhs.relevance;
  116.              });
  117.         if (matched_documents.size() > MAX_RESULT_DOCUMENT_COUNT) {
  118.             matched_documents.resize(MAX_RESULT_DOCUMENT_COUNT);
  119.         }
  120.         return matched_documents;
  121.     }
  122.  
  123. private:
  124.     struct DocumentData {
  125.         int rating;
  126.         DocumentStatus status;
  127.     };
  128.  
  129.     set<string> stop_words_;
  130.     map<string, map<int, double>> word_to_document_freqs_;
  131.     map<int, DocumentData> documents_;
  132.  
  133.     bool IsStopWord(const string& word) const {
  134.         return stop_words_.count(word) > 0;
  135.     }
  136.  
  137.     vector<string> SplitIntoWordsNoStop(const string& text) const {
  138.         vector<string> words;
  139.         for (const string& word : SplitIntoWords(text)) {
  140.             if (!IsStopWord(word)) {
  141.                 words.push_back(word);
  142.             }
  143.         }
  144.         return words;
  145.     }
  146.  
  147.     static int ComputeAverageRating(const vector<int>& ratings) {
  148.         if (ratings.empty()) {
  149.             return 0;
  150.         }
  151.         int rating_sum = 0;
  152.         for (const int rating : ratings) {
  153.             rating_sum += rating;
  154.         }
  155.         return rating_sum / static_cast<int>(ratings.size());
  156.     }
  157.  
  158.     struct QueryWord {
  159.         string data;
  160.         bool is_minus;
  161.         bool is_stop;
  162.     };
  163.  
  164.     QueryWord ParseQueryWord(string text) const {
  165.         bool is_minus = false;
  166.         // Word shouldn't be empty
  167.         if (text[0] == '-') {
  168.             is_minus = true;
  169.             text = text.substr(1);
  170.         }
  171.         return {text, is_minus, IsStopWord(text)};
  172.     }
  173.  
  174.     struct Query {
  175.         set<string> plus_words;
  176.         set<string> minus_words;
  177.     };
  178.  
  179.     Query ParseQuery(const string& text) const {
  180.         Query query;
  181.         for (const string& word : SplitIntoWords(text)) {
  182.             const QueryWord query_word = ParseQueryWord(word);
  183.             if (!query_word.is_stop) {
  184.                 if (query_word.is_minus) {
  185.                     query.minus_words.insert(query_word.data);
  186.                 } else {
  187.                     query.plus_words.insert(query_word.data);
  188.                 }
  189.             }
  190.         }
  191.         return query;
  192.     }
  193.  
  194.     // Existence required
  195.     double ComputeWordInverseDocumentFreq(const string& word) const {
  196.         return log(documents_.size() * 1.0 / word_to_document_freqs_.at(word).size());
  197.     }
  198.  
  199.     vector<Document> FindAllDocuments(const Query& query, DocumentStatus status) const {
  200.         map<int, double> document_to_relevance;
  201.         for (const string& word : query.plus_words) {
  202.             if (word_to_document_freqs_.count(word) == 0) {
  203.                 continue;
  204.             }
  205.             const double inverse_document_freq = ComputeWordInverseDocumentFreq(word);
  206.             for (const auto [document_id, term_freq] : word_to_document_freqs_.at(word)) {
  207.                 if (documents_.at(document_id).status == status) {
  208.                     document_to_relevance[document_id] += term_freq * inverse_document_freq;
  209.                 }
  210.             }
  211.         }
  212.  
  213.         for (const string& word : query.minus_words) {
  214.             if (word_to_document_freqs_.count(word) == 0) {
  215.                 continue;
  216.             }
  217.             for (const auto [document_id, _] : word_to_document_freqs_.at(word)) {
  218.                 document_to_relevance.erase(document_id);
  219.             }
  220.         }
  221.  
  222.         vector<Document> matched_documents;
  223.         for (const auto [document_id, relevance] : document_to_relevance) {
  224.             matched_documents.push_back(
  225.                 {document_id, relevance, documents_.at(document_id).rating});
  226.         }
  227.         return matched_documents;
  228.     }
  229. };
  230.  
  231.  
  232. void PrintMatchDocumentResult(int document_id, const vector<string>& words, DocumentStatus status) {
  233.     cout << "{ "s
  234.          << "document_id = "s << document_id << ", "s
  235.          << "status = "s << static_cast<int>(status) << ", "s
  236.          << "words ="s;
  237.     for (const string& word : words) {
  238.         cout << ' ' << word;
  239.     }
  240.     cout << "}"s << endl;
  241. }
  242. int main() {
  243.     setlocale(LC_ALL, "Russian");
  244.     SearchServer search_server;
  245.     search_server.SetStopWords("и в на"s);
  246.     search_server.AddDocument(0, "белый кот и модный ошейник"s,        DocumentStatus::ACTUAL, {8, -3});
  247.     search_server.AddDocument(1, "пушистый кот пушистый хвост"s,       DocumentStatus::ACTUAL, {7, 2, 7});
  248.     search_server.AddDocument(2, "ухоженный пёс выразительные глаза"s, DocumentStatus::ACTUAL, {5, -12, 2, 1});
  249.     search_server.AddDocument(3, "ухоженный скворец евгений"s,         DocumentStatus::BANNED, {9});
  250.     const int document_count = search_server.GetDocumentCount();
  251.     for (int document_id = 0; document_id < document_count; ++document_id) {
  252.         const auto [words, status] = search_server.MatchDocument("пушистый кот"s, document_id);
  253.         PrintMatchDocumentResult(document_id, words, status);
  254.     }
  255. }
  256.  
Advertisement
Add Comment
Please, Sign In to add comment
Advertisement