Advertisement
Alaricy

сервер с оптионал победил

Dec 10th, 2022 (edited)
149
0
Never
Not a member of Pastebin yet? Sign Up, it unlocks many cool features!
C++ 11.92 KB | None | 0 0
  1. #include <algorithm>
  2. #include <cmath>
  3. #include <iostream>
  4. #include <map>
  5. #include <set>
  6. #include <string>
  7. #include <utility>
  8. #include <vector>
  9. #include <optional>
  10.  
  11. using namespace std;
  12.  
  13. const int MAX_RESULT_DOCUMENT_COUNT = 5;
  14.  
  15. string ReadLine() {
  16.     string s;
  17.     getline(cin, s);
  18.     return s;
  19. }
  20.  
  21. int ReadLineWithNumber() {
  22.     int result;
  23.     cin >> result;
  24.     ReadLine();
  25.     return result;
  26. }
  27.  
  28.  
  29. bool No_doubleminus(const string& text)
  30. {
  31.     int sizetxt = text.size();
  32.     if (sizetxt > 1)
  33.     {
  34.         for (int i = 0; i < sizetxt; i++) //цикл проверки на два минуса и минус в конце
  35.         {
  36.  
  37.             if (i > 0)
  38.             {
  39.                 if ((text[i] == '-') && (text[i - 1] == '-'))
  40.                 {
  41.                     return false;
  42.                 }
  43.                 if ((text[i] == '-') && (i == sizetxt - 1))
  44.                 {
  45.                     return false;
  46.                 }
  47.             }
  48.         } // обработка закончена.
  49.  
  50.     }
  51.     return true;
  52. }
  53.  
  54. vector<string> SplitIntoWords(const string& text) {
  55.     vector<string> words;
  56.     string word;
  57.     for (const char c : text) {
  58.         if (c == ' ') {
  59.             if (!word.empty()) {
  60.                 words.push_back(word);
  61.                 word.clear();
  62.             }
  63.         }
  64.         else {
  65.             word += c;
  66.         }
  67.     }
  68.     if (!word.empty()) {
  69.         words.push_back(word);
  70.     }
  71.  
  72.     return words;
  73. }
  74.  
  75. struct Document {
  76.     Document() = default;
  77.  
  78.     Document(int id, double relevance, int rating)
  79.         : id(id)
  80.         , relevance(relevance)
  81.         , rating(rating) {
  82.     }
  83.  
  84.     int id = 0;
  85.     double relevance = 0.0;
  86.     int rating = 0;
  87. };
  88.  
  89. template <typename StringContainer>
  90. set<string> MakeUniqueNonEmptyStrings(const StringContainer& strings) {
  91.     set<string> non_empty_strings;
  92.     for (const string& str : strings) {
  93.         if (!str.empty()) {
  94.             non_empty_strings.insert(str);
  95.         }
  96.     }
  97.     return non_empty_strings;
  98. }
  99.  
  100. enum class DocumentStatus {
  101.     ACTUAL,
  102.     IRRELEVANT,
  103.     BANNED,
  104.     REMOVED,
  105. };
  106.  
  107. class SearchServer {
  108. public:
  109.     inline static constexpr int INVALID_DOCUMENT_ID = -1;
  110.     template <typename StringContainer>
  111.     explicit SearchServer(const StringContainer& stop_words)
  112.         : stop_words_(MakeUniqueNonEmptyStrings(stop_words)) {
  113.     }
  114.  
  115.     explicit SearchServer(const string& stop_words_text)
  116.         : SearchServer(
  117.             SplitIntoWords(stop_words_text))  // Invoke delegating constructor from string container
  118.     {
  119.     }
  120.  
  121.     [[nodiscard]] bool AddDocument(int document_id, const string& document, DocumentStatus status,
  122.         const vector<int>& ratings) {
  123.  
  124.         if ((documents_.count(document_id) > 0 || (!IsValidWord(document))) || (document_id < 0)) {
  125.             return false;
  126.         }
  127.         uniq_ids_store_.insert(document_id);
  128.         count_to_id_[count_to_id_.size()] = document_id;
  129.         const vector<string> words = SplitIntoWordsNoStop(document);
  130.         const double inv_word_count = 1.0 / words.size();
  131.         for (const string& word : words) {
  132.             word_to_document_freqs_[word][document_id] += inv_word_count;
  133.         }
  134.         documents_.emplace(document_id, DocumentData{ ComputeAverageRating(ratings), status });
  135.         return true;
  136.     }
  137.  
  138.     template <typename DocumentPredicate>
  139.     optional<vector<Document>> FindTopDocuments(const string& raw_query,
  140.         DocumentPredicate document_predicate) const {
  141.         if (No_doubleminus(raw_query) && IsValidWord(raw_query)) {
  142.  
  143.             const Query query = ParseQuery(raw_query);
  144.             auto matched_documents = FindAllDocuments(query, document_predicate);
  145.  
  146.             sort(matched_documents.begin(), matched_documents.end(),
  147.                 [](const Document& lhs, const Document& rhs) {
  148.                     if (abs(lhs.relevance - rhs.relevance) < 1e-6) {
  149.                         return lhs.rating > rhs.rating;
  150.                     }
  151.                     else {
  152.                         return lhs.relevance > rhs.relevance;
  153.                     }
  154.                 });
  155.             if (matched_documents.size() > MAX_RESULT_DOCUMENT_COUNT) {
  156.                 matched_documents.resize(MAX_RESULT_DOCUMENT_COUNT);
  157.             }
  158.             return matched_documents;
  159.         }
  160.         return nullopt;
  161.     }
  162.  
  163.     optional<vector<Document>> FindTopDocuments(const string& raw_query, DocumentStatus status) const {
  164.         return FindTopDocuments(
  165.             raw_query, [status](int document_id, DocumentStatus document_status, int rating) {
  166.                 return document_status == status;
  167.             });
  168.     }
  169.  
  170.     optional<vector<Document>> FindTopDocuments(const string& raw_query) const {
  171.         return FindTopDocuments(raw_query, DocumentStatus::ACTUAL);
  172.     }
  173.  
  174.     int GetDocumentCount() const {
  175.         return documents_.size();
  176.     }
  177.  
  178.     optional<tuple<vector<string>, DocumentStatus>> MatchDocument(const string& raw_query,
  179.         int document_id) const {
  180.        
  181.         vector<string> matched_words;
  182.         const Query query = ParseQuery(raw_query);
  183.         if (No_doubleminus(raw_query) && IsValidWord(raw_query)) {
  184.             for (const string& word : query.plus_words) {
  185.                 if (word_to_document_freqs_.count(word) == 0) {
  186.                     continue;
  187.                 }
  188.                 if (word_to_document_freqs_.at(word).count(document_id)) {
  189.                     matched_words.push_back(word);
  190.                 }
  191.             }
  192.             for (const string& word : query.minus_words) {
  193.                 if (word_to_document_freqs_.count(word) == 0) {
  194.                     continue;
  195.                 }
  196.                 if (word_to_document_freqs_.at(word).count(document_id)) {
  197.                     matched_words.clear();
  198.                     break;
  199.                 }
  200.             }
  201.             return tuple{ matched_words, documents_.at(document_id).status };
  202.  
  203.         }
  204.         return nullopt;
  205.  
  206.     }
  207.     map<int, int> count_to_id_;
  208.     int GetDocumentId(int count) {
  209.         if (count >= 0 && count <= GetDocumentCount()) {
  210.             return count_to_id_[count];
  211.         }
  212.         return SearchServer::INVALID_DOCUMENT_ID;
  213.     }
  214. private:
  215.     struct DocumentData {
  216.         int rating;
  217.         DocumentStatus status;
  218.     };
  219.     const set<string> stop_words_;
  220.     map<string, map<int, double>> word_to_document_freqs_;
  221.     map<int, DocumentData> documents_;
  222.     set<int> uniq_ids_store_;
  223.  
  224.     static bool IsValidWord(const string& word) {
  225.         // A valid word must not contain special characters
  226.         return none_of(word.begin(), word.end(), [](char c) {
  227.             return c >= '\0' && c <= '\31';
  228.             });
  229.     }
  230.     bool IsStopWord(const string& word) const {
  231.         return stop_words_.count(word) > 0;
  232.     }
  233.  
  234.     vector<string> SplitIntoWordsNoStop(const string& text) const {
  235.         vector<string> words;
  236.         for (const string& word : SplitIntoWords(text)) {
  237.             if (!IsStopWord(word)) {
  238.                 words.push_back(word);
  239.             }
  240.         }
  241.         return words;
  242.     }
  243.  
  244.     static int ComputeAverageRating(const vector<int>& ratings) {
  245.         if (ratings.empty()) {
  246.             return 0;
  247.         }
  248.         int rating_sum = 0;
  249.         for (const int rating : ratings) {
  250.             rating_sum += rating;
  251.         }
  252.         return rating_sum / static_cast<int>(ratings.size());
  253.     }
  254.  
  255.     struct QueryWord {
  256.         string data;
  257.         bool is_minus;
  258.         bool is_stop;
  259.     };
  260.  
  261.     QueryWord ParseQueryWord(string text) const {
  262.         bool is_minus = false;
  263.         // Word shouldn't be empty
  264.         if (text[0] == '-') {
  265.             is_minus = true;
  266.             text = text.substr(1);
  267.         }
  268.         return { text, is_minus, IsStopWord(text) };
  269.     }
  270.  
  271.     struct Query {
  272.         set<string> plus_words;
  273.         set<string> minus_words;
  274.     };
  275.  
  276.     Query ParseQuery(const string& text) const {
  277.         Query query;
  278.         for (const string& word : SplitIntoWords(text)) {
  279.             const QueryWord query_word = ParseQueryWord(word);
  280.             if (!query_word.is_stop) {
  281.                 if (query_word.is_minus) {
  282.                     query.minus_words.insert(query_word.data);
  283.                 }
  284.                 else {
  285.                     query.plus_words.insert(query_word.data);
  286.                 }
  287.             }
  288.         }
  289.         return query;
  290.     }
  291.  
  292.     // Existence required
  293.     double ComputeWordInverseDocumentFreq(const string& word) const {
  294.         return log(GetDocumentCount() * 1.0 / word_to_document_freqs_.at(word).size());
  295.     }
  296.  
  297.     template <typename DocumentPredicate>
  298.     vector<Document> FindAllDocuments(const Query& query,
  299.         DocumentPredicate document_predicate) const {
  300.         map<int, double> document_to_relevance;
  301.         for (const string& word : query.plus_words) {
  302.             if (word_to_document_freqs_.count(word) == 0) {
  303.                 continue;
  304.             }
  305.             const double inverse_document_freq = ComputeWordInverseDocumentFreq(word);
  306.             for (const auto [document_id, term_freq] : word_to_document_freqs_.at(word)) {
  307.                 const auto& document_data = documents_.at(document_id);
  308.                 if (document_predicate(document_id, document_data.status, document_data.rating)) {
  309.                     document_to_relevance[document_id] += term_freq * inverse_document_freq;
  310.                 }
  311.             }
  312.         }
  313.  
  314.         for (const string& word : query.minus_words) {
  315.             if (word_to_document_freqs_.count(word) == 0) {
  316.                 continue;
  317.             }
  318.             for (const auto [document_id, _] : word_to_document_freqs_.at(word)) {
  319.                 document_to_relevance.erase(document_id);
  320.             }
  321.         }
  322.  
  323.         vector<Document> matched_documents;
  324.         for (const auto [document_id, relevance] : document_to_relevance) {
  325.             matched_documents.push_back(
  326.                 { document_id, relevance, documents_.at(document_id).rating });
  327.         }
  328.         return matched_documents;
  329.     }
  330.  
  331. };
  332.  
  333. // ==================== для примера =========================
  334.  
  335. void PrintDocument(const Document& document) {
  336.     cout << "{ "s
  337.         << "document_id = "s << document.id << ", "s
  338.         << "relevance = "s << document.relevance << ", "s
  339.         << "rating = "s << document.rating << " }"s << endl;
  340. }
  341.  
  342. int main() {
  343.     setlocale(LC_ALL, "RU");
  344.     SearchServer search_server("и в на"s);
  345.     // Явно игнорируем результат метода AddDocument, чтобы избежать предупреждения
  346.     // о неиспользуемом результате его вызова
  347.     (void)search_server.AddDocument(1, "пушистый кот пушистый хвост"s, DocumentStatus::ACTUAL, { 7, 2, 7 });
  348.     if (!search_server.AddDocument(1, "пушистый пёс и модный ошейник"s, DocumentStatus::ACTUAL, { 1, 2 })) {
  349.         cout << "Документ не был добавлен, так как его id совпадает с уже имеющимся"s << endl;
  350.     }
  351.     if (!search_server.AddDocument(-1, "пушистый пёс и модный ошейник"s, DocumentStatus::ACTUAL, { 1, 2 })) {
  352.         cout << "Документ не был добавлен, так как его id отрицательный"s << endl;
  353.     }
  354.     if (!search_server.AddDocument(3, "большой пёс скво\x12рец"s, DocumentStatus::ACTUAL, { 1, 3, 2 })) {
  355.         cout << "Документ не был добавлен, так как содержит спецсимволы"s << endl;
  356.     }
  357.     vector<Document> documents;
  358.     if (search_server.FindTopDocuments("пушистый-gh\31"s)) {
  359.         for (const Document& document : documents) {
  360.             PrintDocument(document);
  361.         }
  362.     }
  363.     else {
  364.         cout << "Ошибка в поисковом запросе"s << endl;
  365.     }
  366. }
Advertisement
Add Comment
Please, Sign In to add comment
Advertisement