Advertisement
Alaricy

сервер в 4-м спринте

Dec 9th, 2022 (edited)
173
0
Never
Not a member of Pastebin yet? Sign Up, it unlocks many cool features!
C++ 12.03 KB | None | 0 0
  1. #include <algorithm>
  2. #include <cmath>
  3. #include <iostream>
  4. #include <map>
  5. #include <set>
  6. #include <string>
  7. #include <utility>
  8. #include <vector>
  9.  
  10. using namespace std;
  11.  
  12. const int MAX_RESULT_DOCUMENT_COUNT = 5;
  13.  
  14. string ReadLine() {
  15.     string s;
  16.     getline(cin, s);
  17.     return s;
  18. }
  19.  
  20. int ReadLineWithNumber() {
  21.     int result;
  22.     cin >> result;
  23.     ReadLine();
  24.     return result;
  25. }
  26.  
  27.  
  28. bool No_doubleminus(const string& text)
  29. {
  30.     int sizetxt = text.size();
  31.     if (sizetxt > 1)
  32.     {
  33.         for (int i = 0; i < sizetxt; i++) //цикл проверки на два минуса и минус в конце
  34.         {
  35.  
  36.             if (i > 0)
  37.             {
  38.                 if ((text[i] == '-') && (text[i - 1] == '-'))
  39.                 {
  40.                     return false;
  41.                 }
  42.                 if ((text[i] == '-') && (i == sizetxt - 1))
  43.                 {
  44.                     return false;
  45.                 }
  46.             }
  47.         } // обработка закончена.
  48.  
  49.     }
  50.     return true;
  51. }
  52.  
  53. vector<string> SplitIntoWords(const string& text) {
  54.     vector<string> words;
  55.     string word;
  56.     for (const char c : text) {
  57.         if (c == ' ') {
  58.             if (!word.empty()) {
  59.                 words.push_back(word);
  60.                 word.clear();
  61.             }
  62.         }
  63.         else {
  64.             word += c;
  65.         }
  66.     }
  67.     if (!word.empty()) {
  68.         words.push_back(word);
  69.     }
  70.  
  71.     return words;
  72. }
  73.  
  74. struct Document {
  75.     Document() = default;
  76.  
  77.     Document(int id, double relevance, int rating)
  78.         : id(id)
  79.         , relevance(relevance)
  80.         , rating(rating) {
  81.     }
  82.  
  83.     int id = 0;
  84.     double relevance = 0.0;
  85.     int rating = 0;
  86. };
  87.  
  88. template <typename StringContainer>
  89. set<string> MakeUniqueNonEmptyStrings(const StringContainer& strings) {
  90.     set<string> non_empty_strings;
  91.     for (const string& str : strings) {
  92.         if (!str.empty()) {
  93.             non_empty_strings.insert(str);
  94.         }
  95.     }
  96.     return non_empty_strings;
  97. }
  98.  
  99. enum class DocumentStatus {
  100.     ACTUAL,
  101.     IRRELEVANT,
  102.     BANNED,
  103.     REMOVED,
  104. };
  105.  
  106. class SearchServer {
  107. public:
  108.     inline static constexpr int INVALID_DOCUMENT_ID = -1;
  109.     template <typename StringContainer>
  110.     explicit SearchServer(const StringContainer& stop_words)
  111.         : stop_words_(MakeUniqueNonEmptyStrings(stop_words)) {
  112.     }
  113.  
  114.     explicit SearchServer(const string& stop_words_text)
  115.         : SearchServer(
  116.             SplitIntoWords(stop_words_text))  // Invoke delegating constructor from string container
  117.     {
  118.     }
  119.  
  120.     [[nodiscard]] bool AddDocument(int document_id, const string& document, DocumentStatus status,
  121.         const vector<int>& ratings) {
  122.        
  123.         if (((uniq_ids_store_.count(document_id) !=0)||(!IsValidWord(document)))||(document_id<0)) {
  124.             return false;
  125.         }
  126.         uniq_ids_store_.insert(document_id);
  127.         count_to_id_[count_to_id_.size()] = document_id;
  128.         const vector<string> words = SplitIntoWordsNoStop(document);
  129.         const double inv_word_count = 1.0 / words.size();
  130.         for (const string& word : words) {
  131.             word_to_document_freqs_[word][document_id] += inv_word_count;
  132.         }
  133.         documents_.emplace(document_id, DocumentData{ ComputeAverageRating(ratings), status });
  134.         return true;
  135.     }
  136.  
  137.     template <typename DocumentPredicate>
  138.     bool FindTopDocuments(const string& raw_query,
  139.         DocumentPredicate document_predicate,
  140.         vector<Document>& result) const {
  141.         if (No_doubleminus(raw_query) && IsValidWord(raw_query)) {
  142.  
  143.             const Query query = ParseQuery(raw_query);
  144.             auto matched_documents = FindAllDocuments(query, document_predicate);
  145.  
  146.             sort(matched_documents.begin(), matched_documents.end(),
  147.                 [](const Document& lhs, const Document& rhs) {
  148.                     if (abs(lhs.relevance - rhs.relevance) < 1e-6) {
  149.                         return lhs.rating > rhs.rating;
  150.                     }
  151.                     else {
  152.                         return lhs.relevance > rhs.relevance;
  153.                     }
  154.                 });
  155.             if (matched_documents.size() > MAX_RESULT_DOCUMENT_COUNT) {
  156.                 matched_documents.resize(MAX_RESULT_DOCUMENT_COUNT);
  157.             }
  158.             result = matched_documents;
  159.             return true;
  160.         }
  161.         return false;
  162.     }
  163.  
  164.     [[nodiscard]] bool FindTopDocuments(const string& raw_query, DocumentStatus status, vector<Document>& result) const {
  165.         return FindTopDocuments(
  166.             raw_query, [status](int document_id, DocumentStatus document_status, int rating) {
  167.                 return document_status == status;
  168.             }, result);
  169.     }
  170.  
  171.     [[nodiscard]] bool FindTopDocuments(const string& raw_query, vector<Document>& result) const {
  172.         return FindTopDocuments(raw_query, DocumentStatus::ACTUAL, result);
  173.     }
  174.  
  175.     int GetDocumentCount() const {
  176.         return documents_.size();
  177.     }
  178.  
  179.     [[nodiscard]] bool MatchDocument(const string& raw_query,
  180.         int document_id, tuple<vector<string>, DocumentStatus>& result) const {
  181.         vector<string> matched_words;
  182.         const Query query = ParseQuery(raw_query);
  183.         if (No_doubleminus(raw_query) && IsValidWord(raw_query)) {
  184.         for (const string& word : query.plus_words) {
  185.             if (word_to_document_freqs_.count(word) == 0) {
  186.                 continue;
  187.             }
  188.             if (word_to_document_freqs_.at(word).count(document_id)) {
  189.                 matched_words.push_back(word);
  190.             }
  191.         }
  192.         for (const string& word : query.minus_words) {
  193.             if (word_to_document_freqs_.count(word) == 0) {
  194.                 continue;
  195.             }
  196.             if (word_to_document_freqs_.at(word).count(document_id)) {
  197.                 matched_words.clear();
  198.                 break;
  199.             }
  200.         }
  201.         result = { matched_words, documents_.at(document_id).status };
  202.  
  203.         return true;}
  204.         return false;
  205.  
  206.     }
  207.     map<int, int> count_to_id_;
  208.     int GetDocumentId(int count) {
  209.         if (count >= 0 && count <= GetDocumentCount()) {
  210.             return count_to_id_[count];
  211.         }
  212.         return SearchServer::INVALID_DOCUMENT_ID;
  213.     }
  214. private:
  215.     struct DocumentData {
  216.         int rating;
  217.         DocumentStatus status;
  218.     };
  219.     const set<string> stop_words_;
  220.     map<string, map<int, double>> word_to_document_freqs_;
  221.     map<int, DocumentData> documents_;
  222.     set<int> uniq_ids_store_;
  223.  
  224.     static bool IsValidWord(const string& word) {
  225.         // A valid word must not contain special characters
  226.         return none_of(word.begin(), word.end(), [](char c) {
  227.             return c >= '\0' && c <= '\31';
  228.             });
  229.     }
  230.     bool IsStopWord(const string& word) const {
  231.         return stop_words_.count(word) > 0;
  232.     }
  233.  
  234.     vector<string> SplitIntoWordsNoStop(const string& text) const {
  235.         vector<string> words;
  236.         for (const string& word : SplitIntoWords(text)) {
  237.             if (!IsStopWord(word)) {
  238.                 words.push_back(word);
  239.             }
  240.         }
  241.         return words;
  242.     }
  243.  
  244.     static int ComputeAverageRating(const vector<int>& ratings) {
  245.         if (ratings.empty()) {
  246.             return 0;
  247.         }
  248.         int rating_sum = 0;
  249.         for (const int rating : ratings) {
  250.             rating_sum += rating;
  251.         }
  252.         return rating_sum / static_cast<int>(ratings.size());
  253.     }
  254.  
  255.     struct QueryWord {
  256.         string data;
  257.         bool is_minus;
  258.         bool is_stop;
  259.     };
  260.  
  261.     QueryWord ParseQueryWord(string text) const {
  262.         bool is_minus = false;
  263.         // Word shouldn't be empty
  264.         if (text[0] == '-') {
  265.             is_minus = true;
  266.             text = text.substr(1);
  267.         }
  268.         return { text, is_minus, IsStopWord(text) };
  269.     }
  270.  
  271.     struct Query {
  272.         set<string> plus_words;
  273.         set<string> minus_words;
  274.     };
  275.  
  276.     Query ParseQuery(const string& text) const {
  277.         Query query;
  278.         for (const string& word : SplitIntoWords(text)) {
  279.             const QueryWord query_word = ParseQueryWord(word);
  280.             if (!query_word.is_stop) {
  281.                 if (query_word.is_minus) {
  282.                    query.minus_words.insert(query_word.data);
  283.                 }
  284.                 else {
  285.                     query.plus_words.insert(query_word.data);
  286.                 }
  287.             }
  288.         }
  289.         return query;
  290.     }
  291.  
  292.     // Existence required
  293.     double ComputeWordInverseDocumentFreq(const string& word) const {
  294.         return log(GetDocumentCount() * 1.0 / word_to_document_freqs_.at(word).size());
  295.     }
  296.  
  297.     template <typename DocumentPredicate>
  298.     vector<Document> FindAllDocuments(const Query& query,
  299.         DocumentPredicate document_predicate) const {
  300.         map<int, double> document_to_relevance;
  301.         for (const string& word : query.plus_words) {
  302.             if (word_to_document_freqs_.count(word) == 0) {
  303.                 continue;
  304.             }
  305.             const double inverse_document_freq = ComputeWordInverseDocumentFreq(word);
  306.             for (const auto [document_id, term_freq] : word_to_document_freqs_.at(word)) {
  307.                 const auto& document_data = documents_.at(document_id);
  308.                 if (document_predicate(document_id, document_data.status, document_data.rating)) {
  309.                     document_to_relevance[document_id] += term_freq * inverse_document_freq;
  310.                 }
  311.             }
  312.         }
  313.  
  314.         for (const string& word : query.minus_words) {
  315.             if (word_to_document_freqs_.count(word) == 0) {
  316.                 continue;
  317.             }
  318.             for (const auto [document_id, _] : word_to_document_freqs_.at(word)) {
  319.                 document_to_relevance.erase(document_id);
  320.             }
  321.         }
  322.  
  323.         vector<Document> matched_documents;
  324.         for (const auto [document_id, relevance] : document_to_relevance) {
  325.             matched_documents.push_back(
  326.                 { document_id, relevance, documents_.at(document_id).rating });
  327.         }
  328.         return matched_documents;
  329.     }
  330.  
  331. };
  332.  
  333. // ==================== для примера =========================
  334.  
  335. void PrintDocument(const Document& document) {
  336.     cout << "{ "s
  337.         << "document_id = "s << document.id << ", "s
  338.         << "relevance = "s << document.relevance << ", "s
  339.         << "rating = "s << document.rating << " }"s << endl;
  340. }
  341.  
  342. int main() {
  343.     setlocale(LC_ALL, "RU");
  344.     SearchServer search_server("и в на"s);
  345.     // Явно игнорируем результат метода AddDocument, чтобы избежать предупреждения
  346.     // о неиспользуемом результате его вызова
  347.     (void)search_server.AddDocument(1, "пушистый кот пушистый хвост"s, DocumentStatus::ACTUAL, { 7, 2, 7 });
  348.     if (!search_server.AddDocument(1, "пушистый пёс и модный ошейник"s, DocumentStatus::ACTUAL, { 1, 2 })) {
  349.         cout << "Документ не был добавлен, так как его id совпадает с уже имеющимся"s << endl;
  350.     }
  351.     if (!search_server.AddDocument(-1, "пушистый пёс и модный ошейник"s, DocumentStatus::ACTUAL, { 1, 2 })) {
  352.         cout << "Документ не был добавлен, так как его id отрицательный"s << endl;
  353.     }
  354.     if (!search_server.AddDocument(3, "большой пёс скво\x12рец"s, DocumentStatus::ACTUAL, { 1, 3, 2 })) {
  355.         cout << "Документ не был добавлен, так как содержит спецсимволы"s << endl;
  356.     }
  357.     vector<Document> documents;
  358.     if (search_server.FindTopDocuments("--пушистый"s, documents)) {
  359.         for (const Document& document : documents) {
  360.             PrintDocument(document);
  361.         }
  362.     }
  363.     else {
  364.         cout << "Ошибка в поисковом запросе"s << endl;
  365.     }
  366. }
Advertisement
Add Comment
Please, Sign In to add comment
Advertisement