Advertisement
chevengur

СПРИНТ № 2 | Числовые типы | Урок 7: Перечислимые типы 1/2

Oct 11th, 2023 (edited)
249
0
Never
Not a member of Pastebin yet? Sign Up, it unlocks many cool features!
C++ 7.86 KB | None | 0 0
  1. #include <algorithm>
  2. #include <cmath>
  3. #include <iostream>
  4. #include <map>
  5. #include <set>
  6. #include <string>
  7. #include <utility>
  8. #include <vector>
  9.  
  10. using namespace std;
  11.  
  12. const int MAX_RESULT_DOCUMENT_COUNT = 5;
  13.  
  14. string ReadLine() {
  15.     string s;
  16.     getline(cin, s);
  17.     return s;
  18. }
  19.  
  20. int ReadLineWithNumber() {
  21.     int result;
  22.     cin >> result;
  23.     ReadLine();
  24.     return result;
  25. }
  26.  
  27. vector<string> SplitIntoWords(const string& text) {
  28.     vector<string> words;
  29.     string word;
  30.     for (const char c : text) {
  31.         if (c == ' ') {
  32.             words.push_back(word);
  33.             word = "";
  34.         } else {
  35.             word += c;
  36.         }
  37.     }
  38.     words.push_back(word);
  39.  
  40.     return words;
  41. }
  42.  
  43. struct Document {
  44.     int id;
  45.     double relevance;
  46.     int rating;
  47. };
  48.  
  49. enum class DocumentStatus{
  50.     ACTUAL,
  51.     IRRELEVANT,
  52.     BANNED,
  53.     REMOVED
  54. };
  55.  
  56.  
  57. class SearchServer {
  58. public:
  59.     void SetStopWords(const string& text) {
  60.         for (const string& word : SplitIntoWords(text)) {
  61.             stop_words_.insert(word);
  62.         }
  63.     }
  64.  
  65.     void AddDocument(int document_id, const string& document, DocumentStatus status, const vector<int>& ratings) {
  66.         const vector<string> words = SplitIntoWordsNoStop(document);
  67.  
  68.         const double inv_word_count = 1.0 / words.size();
  69.         for (const string& word : words) {
  70.             word_to_document_freqs_[word][document_id] += inv_word_count;
  71.         }
  72.         document_.emplace(document_id, DocumentInfo{status, ComputeAverageRating(ratings)});
  73.  
  74.     }
  75.  
  76.     vector<Document> FindTopDocuments(const string& raw_query, DocumentStatus status) const {
  77.         const Query query = ParseQuery(raw_query);
  78.         auto matched_documents = FindAllDocuments(query, status);
  79.  
  80.         sort(matched_documents.begin(), matched_documents.end(),
  81.              [](const Document& lhs, const Document& rhs) {
  82.                  return lhs.relevance > rhs.relevance;
  83.              });
  84.         if (matched_documents.size() > MAX_RESULT_DOCUMENT_COUNT) {
  85.             matched_documents.resize(MAX_RESULT_DOCUMENT_COUNT);
  86.         }
  87.         return matched_documents;
  88.     }
  89.  
  90. private:
  91.  
  92.     struct DocumentInfo{                                        // добавлена структура
  93.         DocumentStatus status;
  94.         int rating;
  95.     };
  96.  
  97.     set<string> stop_words_;
  98.     map<string, map<int, double>> word_to_document_freqs_;
  99.     map<int, DocumentInfo> document_;                           // изменена сигнатура контейнера
  100.  
  101.     bool IsStopWord(const string& word) const {
  102.         return stop_words_.count(word) > 0;
  103.     }
  104.  
  105.  
  106.     vector<string> SplitIntoWordsNoStop(const string& text) const {
  107.         vector<string> words;
  108.         for (const string& word : SplitIntoWords(text)) {
  109.             if (!IsStopWord(word)) {
  110.                 words.push_back(word);
  111.             }
  112.         }
  113.         return words;
  114.     }
  115.  
  116.     static int ComputeAverageRating(const vector<int>& ratings) {
  117.         int rating_sum = 0;
  118.         for (const int rating : ratings) {
  119.             rating_sum += rating;
  120.         }
  121.         return rating_sum / static_cast<int>(ratings.size());
  122.     }
  123.  
  124.     struct QueryWord {
  125.         string data;
  126.         bool is_minus;
  127.         bool is_stop;
  128.     };
  129.  
  130.     QueryWord ParseQueryWord(string text) const {
  131.         bool is_minus = false;
  132.         // Word shouldn't be empty
  133.         if (text[0] == '-') {
  134.             is_minus = true;
  135.             text = text.substr(1);
  136.         }
  137.         return {
  138.             text,
  139.             is_minus,
  140.             IsStopWord(text)
  141.         };
  142.     }
  143.  
  144.     struct Query {
  145.         set<string> plus_words;
  146.         set<string> minus_words;
  147.     };
  148.  
  149.     Query ParseQuery(const string& text) const {
  150.         Query query;
  151.         for (const string& word : SplitIntoWords(text)) {
  152.             const QueryWord query_word = ParseQueryWord(word);
  153.             if (!query_word.is_stop) {
  154.                 if (query_word.is_minus) {
  155.                     query.minus_words.insert(query_word.data);
  156.                 } else {
  157.                     query.plus_words.insert(query_word.data);
  158.                 }
  159.             }
  160.         }
  161.         return query;
  162.     }
  163.  
  164.     // Existence required
  165.     double ComputeWordInverseDocumentFreq(const string& word) const {
  166.         return log(document_.size() * 1.0 / word_to_document_freqs_.at(word).size());
  167.     }
  168.  
  169.     vector<Document> FindAllDocuments(const Query& query, DocumentStatus status) const {
  170.         map<int, double> document_to_relevance;
  171.         for (const string& word : query.plus_words) {
  172.             if (word_to_document_freqs_.count(word) == 0) {
  173.                 continue;
  174.             }
  175.             const double inverse_document_freq = ComputeWordInverseDocumentFreq(word);
  176.             for (const auto [document_id, term_freq] : word_to_document_freqs_.at(word)) {
  177.                 if(document_.at(document_id).status == status){                                     // добавлено условие по статусу
  178.                     document_to_relevance[document_id] += term_freq * inverse_document_freq;
  179.                 }
  180.             }
  181.         }
  182.  
  183.         for (const string& word : query.minus_words) {
  184.             if (word_to_document_freqs_.count(word) == 0) {
  185.                 continue;
  186.             }
  187.             for (const auto [document_id, _] : word_to_document_freqs_.at(word)) {
  188.                 document_to_relevance.erase(document_id);
  189.             }
  190.         }
  191.  
  192.         vector<Document> matched_documents;
  193.         for (const auto [document_id, relevance] : document_to_relevance) {
  194.             matched_documents.push_back({
  195.                 document_id,
  196.                 relevance,
  197.                 document_.at(document_id).rating            // добавлен по новому rating
  198.             });
  199.         }
  200.         return matched_documents;
  201.     }
  202. };
  203.  
  204.  
  205. SearchServer CreateSearchServer() {
  206.     SearchServer search_server;
  207.     search_server.SetStopWords(ReadLine());
  208.  
  209.     const int document_count = ReadLineWithNumber();
  210.     for (int document_id = 0; document_id < document_count; ++document_id) {
  211.         const string document = ReadLine();
  212.         int ratings_size;
  213.         cin >> ratings_size;
  214.  
  215.         // создали вектор размера ratings_size из нулей
  216.         vector<int> ratings(ratings_size, 0);
  217.  
  218.         // считали каждый элемент с помощью ссылки
  219.         for (int& rating : ratings) {
  220.             cin >> rating;
  221.         }
  222.  
  223.         search_server.AddDocument(document_id, document, DocumentStatus::ACTUAL, ratings);
  224.         ReadLine();
  225.     }
  226.  
  227.     return search_server;
  228. }
  229.  
  230.  
  231. void PrintDocument(const Document& document) {
  232.     cout << "{ "s
  233.          << "document_id = "s << document.id << ", "s
  234.          << "relevance = "s << document.relevance << ", "s
  235.          << "rating = "s << document.rating
  236.          << " }"s << endl;
  237. }
  238. int main() {
  239.     SearchServer search_server;
  240.     search_server.SetStopWords("и в на"s);
  241.     search_server.AddDocument(0, "белый кот и модный ошейник"s,        DocumentStatus::ACTUAL, {8, -3});
  242.     search_server.AddDocument(1, "пушистый кот пушистый хвост"s,       DocumentStatus::ACTUAL, {7, 2, 7});
  243.     search_server.AddDocument(2, "ухоженный пёс выразительные глаза"s, DocumentStatus::ACTUAL, {5, -12, 2, 1});
  244.     search_server.AddDocument(3, "ухоженный скворец евгений"s,         DocumentStatus::BANNED, {9});
  245.     cout << "ACTUAL:"s << endl;
  246.     for (const Document& document : search_server.FindTopDocuments("пушистый ухоженный кот"s, DocumentStatus::ACTUAL)) {
  247.         PrintDocument(document);
  248.     }
  249.     cout << "BANNED:"s << endl;
  250.     for (const Document& document : search_server.FindTopDocuments("пушистый ухоженный кот"s, DocumentStatus::BANNED)) {
  251.         PrintDocument(document);
  252.     }
  253.     return 0;
  254. }
  255.  
Advertisement
Add Comment
Please, Sign In to add comment
Advertisement