Advertisement
Alaricy

сервер спринт 4 почти допилил

Dec 14th, 2022 (edited)
170
0
Never
Not a member of Pastebin yet? Sign Up, it unlocks many cool features!
C++ 12.39 KB | None | 0 0
  1. #include <algorithm>
  2. #include <cmath>
  3. #include <iostream>
  4. #include <map>
  5. #include <set>
  6. #include <string>
  7. #include <utility>
  8. #include <vector>
  9. #include <optional>
  10. #include <stdexcept>
  11.  
  12. using namespace std;
  13.  
  14. const int MAX_RESULT_DOCUMENT_COUNT = 5;
  15.  
  16. string ReadLine() {
  17.     string s;
  18.     getline(cin, s);
  19.     return s;
  20. }
  21.  
  22. int ReadLineWithNumber() {
  23.     int result;
  24.     cin >> result;
  25.     ReadLine();
  26.     return result;
  27. }
  28.  
  29. bool No_doubleminus(const string& text)
  30. {
  31.     int sizetxt = text.size();
  32.     if (sizetxt > 1)
  33.     {
  34.         for (int i = 0; i < sizetxt; i++) //цикл проверки на два минуса и минус в конце
  35.         {
  36.  
  37.             if (i > 0)
  38.             {
  39.                 if ((text[i] == '-') && (text[i - 1] == '-'))
  40.                 {
  41.                     return false;
  42.                 }
  43.                 if ((text[i] == '-') && (i == sizetxt - 1))
  44.                 {
  45.                     return false;
  46.                 }
  47.             }
  48.         } // обработка закончена.
  49.  
  50.     }
  51.     return true;
  52. }
  53.  
  54. vector<string> SplitIntoWords(const string& text) {
  55.     vector<string> words;
  56.     string word;
  57.     for (const char c : text) {
  58.         if (c == ' ') {
  59.             if (!word.empty()) {
  60.                 words.push_back(word);
  61.                 word.clear();
  62.             }
  63.         }
  64.         else {
  65.             word += c;
  66.         }
  67.     }
  68.     if (!word.empty()) {
  69.         words.push_back(word);
  70.     }
  71.  
  72.     return words;
  73. }
  74.  
  75. struct Document {
  76.     Document() = default;
  77.  
  78.     Document(int id, double relevance, int rating)
  79.         : id(id)
  80.         , relevance(relevance)
  81.         , rating(rating) {
  82.     }
  83.  
  84.     int id = 0;
  85.     double relevance = 0.0;
  86.     int rating = 0;
  87. };
  88.  
  89. template <typename StringContainer>
  90. set<string> MakeUniqueNonEmptyStrings(const StringContainer& strings) {
  91.     set<string> non_empty_strings;
  92.     for (const string& str : strings) {
  93.         if (!str.empty()) {
  94.             non_empty_strings.insert(str);
  95.         }
  96.     }
  97.     return non_empty_strings;
  98. }
  99.  
  100. enum class DocumentStatus {
  101.     ACTUAL,
  102.     IRRELEVANT,
  103.     BANNED,
  104.     REMOVED,
  105. };
  106.  
  107. class SearchServer {
  108. public:
  109.    // inline static constexpr int INVALID_DOCUMENT_ID = -1;
  110.     template <typename StringContainer>
  111.     explicit SearchServer(StringContainer stop_words)
  112.         : stop_words_(MakeUniqueNonEmptyStrings(stop_words))
  113.     {
  114.         for (string word : stop_words)
  115.         {
  116.             if (!IsValidWord(word)) {
  117.                 stop_words_.clear();
  118.                 throw invalid_argument("Косячные символы или минусы");                
  119.             }
  120.         }
  121.     }
  122.  
  123.     explicit SearchServer(string stop_words_text)
  124.         : SearchServer(
  125.             SplitIntoWords(stop_words_text))  // Invoke delegating constructor from string container
  126.     {
  127.    
  128.     for (string word : SplitIntoWords(stop_words_text))
  129.         {
  130.                       if (!IsValidWord(word)) {
  131.                 stop_words_.clear();
  132.                 throw invalid_argument("Косячные символы или минусы");                
  133.             }
  134.         }
  135.            
  136.     }
  137.  
  138.     void AddDocument(int document_id, const string& document, DocumentStatus status,
  139.         const vector<int>& ratings) {
  140.  
  141.         if ((documents_.count(document_id) > 0 || (!IsValidWord(document))) || (document_id < 0)) {
  142.             throw invalid_argument("Косячные символы или минусы в документе или номеры косые");
  143.         }
  144.         uniq_ids_store_.insert(document_id);
  145.         count_to_id_[count_to_id_.size()] = document_id;
  146.         const vector<string> words = SplitIntoWordsNoStop(document);
  147.         const double inv_word_count = 1.0 / words.size();
  148.         for (const string& word : words) {
  149.             word_to_document_freqs_[word][document_id] += inv_word_count;
  150.         }
  151.         documents_.emplace(document_id, DocumentData{ ComputeAverageRating(ratings), status });
  152.     }
  153.  
  154.     template <typename DocumentPredicate>
  155.     vector<Document> FindTopDocuments(const string& raw_query,
  156.         DocumentPredicate document_predicate) const {
  157.         if (No_doubleminus(raw_query) && IsValidWord(raw_query)) {
  158.  
  159.             const Query query = ParseQuery(raw_query);
  160.             auto matched_documents = FindAllDocuments(query, document_predicate);
  161.  
  162.             sort(matched_documents.begin(), matched_documents.end(),
  163.                 [](const Document& lhs, const Document& rhs) {
  164.                     if (abs(lhs.relevance - rhs.relevance) < 1e-6) {
  165.                         return lhs.rating > rhs.rating;
  166.                     }
  167.                     else {
  168.                         return lhs.relevance > rhs.relevance;
  169.                     }
  170.                 });
  171.             if (matched_documents.size() > MAX_RESULT_DOCUMENT_COUNT) {
  172.                 matched_documents.resize(MAX_RESULT_DOCUMENT_COUNT);
  173.             }
  174.             return matched_documents;
  175.         }
  176.         throw invalid_argument("Косячные символы или минусы в запросе");
  177.     }
  178.  
  179.     vector<Document> FindTopDocuments(const string& raw_query, DocumentStatus status) const {
  180.         return FindTopDocuments(
  181.             raw_query, [status](int document_id, DocumentStatus document_status, int rating) {
  182.                 return document_status == status;
  183.             });
  184.     }
  185.  
  186.     vector<Document> FindTopDocuments(const string& raw_query) const {
  187.         return FindTopDocuments(raw_query, DocumentStatus::ACTUAL);
  188.     }
  189.  
  190.     int GetDocumentCount() const {
  191.         return documents_.size();
  192.     }
  193.  
  194.     tuple<vector<string>, DocumentStatus> MatchDocument(const string& raw_query,
  195.         int document_id) const {
  196.  
  197.         vector<string> matched_words;
  198.         const Query query = ParseQuery(raw_query);
  199.         if (No_doubleminus(raw_query) && IsValidWord(raw_query)) {
  200.             for (const string& word : query.plus_words) {
  201.                 if (word_to_document_freqs_.count(word) == 0) {
  202.                     continue;
  203.                 }
  204.                 if (word_to_document_freqs_.at(word).count(document_id)) {
  205.                     matched_words.push_back(word);
  206.                 }
  207.             }
  208.             for (const string& word : query.minus_words) {
  209.                 if (word_to_document_freqs_.count(word) == 0) {
  210.                     continue;
  211.                 }
  212.                 if (word_to_document_freqs_.at(word).count(document_id)) {
  213.                     matched_words.clear();
  214.                     break;
  215.                 }
  216.             }
  217.             return tuple{ matched_words, documents_.at(document_id).status };
  218.  
  219.         }
  220.         throw invalid_argument("Косячные символы или минусы в запросе");
  221.  
  222.     }
  223.     map<int, int> count_to_id_;
  224.     int GetDocumentId(int count) {
  225.         if (count >= 0 && count <= GetDocumentCount()) {
  226.             return count_to_id_[count];
  227.         }
  228.         throw out_of_range("косячный номер");
  229.     }
  230. private:
  231.     struct DocumentData {
  232.         int rating;
  233.         DocumentStatus status;
  234.     };
  235.     set<string> stop_words_;
  236.     map<string, map<int, double>> word_to_document_freqs_;
  237.     map<int, DocumentData> documents_;
  238.     set<int> uniq_ids_store_;
  239.  
  240.     static bool IsValidWord(const string& word) {
  241.         // A valid word must not contain special characters
  242.         return none_of(word.begin(), word.end(), [](char c) {
  243.             return c >= '\0' && c < ' ';
  244.             });
  245.     }
  246.     bool IsStopWord(const string& word) const {
  247.         return stop_words_.count(word) > 0;
  248.     }
  249.  
  250.     vector<string> SplitIntoWordsNoStop(const string& text) const {
  251.         vector<string> words;
  252.         for (const string& word : SplitIntoWords(text)) {
  253.             if (!IsStopWord(word)) {
  254.                 words.push_back(word);
  255.             }
  256.         }
  257.         return words;
  258.     }
  259.  
  260.     static int ComputeAverageRating(const vector<int>& ratings) {
  261.         if (ratings.empty()) {
  262.             return 0;
  263.         }
  264.         int rating_sum = 0;
  265.         for (const int rating : ratings) {
  266.             rating_sum += rating;
  267.         }
  268.         return rating_sum / static_cast<int>(ratings.size());
  269.     }
  270.  
  271.     struct QueryWord {
  272.         string data;
  273.         bool is_minus;
  274.         bool is_stop;
  275.     };
  276.  
  277.     QueryWord ParseQueryWord(string text) const {
  278.         bool is_minus = false;
  279.         // Word shouldn't be empty
  280.         if (text[0] == '-') {
  281.             is_minus = true;
  282.             text = text.substr(1);
  283.         }
  284.         return { text, is_minus, IsStopWord(text) };
  285.     }
  286.  
  287.     struct Query {
  288.         set<string> plus_words;
  289.         set<string> minus_words;
  290.     };
  291.  
  292.     Query ParseQuery(const string& text) const {
  293.         Query query;
  294.         for (const string& word : SplitIntoWords(text)) {
  295.             const QueryWord query_word = ParseQueryWord(word);
  296.             if (!query_word.is_stop) {
  297.                 if (query_word.is_minus) {
  298.                     query.minus_words.insert(query_word.data);
  299.                 }
  300.                 else {
  301.                     query.plus_words.insert(query_word.data);
  302.                 }
  303.             }
  304.         }
  305.         return query;
  306.     }
  307.  
  308.     // Existence required
  309.     double ComputeWordInverseDocumentFreq(const string& word) const {
  310.         return log(GetDocumentCount() * 1.0 / word_to_document_freqs_.at(word).size());
  311.     }
  312.  
  313.     template <typename DocumentPredicate>
  314.     vector<Document> FindAllDocuments(const Query& query,
  315.         DocumentPredicate document_predicate) const {
  316.         map<int, double> document_to_relevance;
  317.         for (const string& word : query.plus_words) {
  318.             if (word_to_document_freqs_.count(word) == 0) {
  319.                 continue;
  320.             }
  321.             const double inverse_document_freq = ComputeWordInverseDocumentFreq(word);
  322.             for (const auto [document_id, term_freq] : word_to_document_freqs_.at(word)) {
  323.                 const auto& document_data = documents_.at(document_id);
  324.                 if (document_predicate(document_id, document_data.status, document_data.rating)) {
  325.                     document_to_relevance[document_id] += term_freq * inverse_document_freq;
  326.                 }
  327.             }
  328.         }
  329.  
  330.         for (const string& word : query.minus_words) {
  331.             if (word_to_document_freqs_.count(word) == 0) {
  332.                 continue;
  333.             }
  334.             for (const auto [document_id, _] : word_to_document_freqs_.at(word)) {
  335.                 document_to_relevance.erase(document_id);
  336.             }
  337.         }
  338.  
  339.         vector<Document> matched_documents;
  340.         for (const auto [document_id, relevance] : document_to_relevance) {
  341.             matched_documents.push_back(
  342.                 { document_id, relevance, documents_.at(document_id).rating });
  343.         }
  344.         return matched_documents;
  345.     }
  346.  
  347. };
  348.  
  349. // ==================== для примера =========================
  350.  
  351. void PrintDocument(const Document& document) {
  352.     cout << "{ "s
  353.         << "document_id = "s << document.id << ", "s
  354.         << "relevance = "s << document.relevance << ", "s
  355.         << "rating = "s << document.rating << " }"s << endl;
  356. }
  357.  
  358. int main() {
  359.     setlocale(LC_ALL, "RU");
  360.    
  361.    
  362.     try
  363.     {
  364.  
  365.         SearchServer search_server("и в на"s);
  366.         (void)search_server.AddDocument(1, "пушистый пёс и модный ошейник"s, DocumentStatus::ACTUAL, { 1, 2 });
  367.         (void)search_server.AddDocument(2, "пушистый пёс и модный ошейник"s, DocumentStatus::ACTUAL, { 1, 2 });
  368.         (void)search_server.AddDocument(3, "большой пёс скворец"s, DocumentStatus::ACTUAL, { 1, 3, 2 });
  369.  
  370.         // Явно игнорируем результат метода AddDocument, чтобы избежать предупреждения
  371.         // о неиспользуемом результате его вызова
  372.         (void)search_server.AddDocument(4, "пушистый кот пушистый хвост"s, DocumentStatus::ACTUAL, { 7, 2, 7 });
  373.  
  374.         vector<Document> documents = search_server.FindTopDocuments("пушистый"s);
  375.             for (const Document& document : documents) {
  376.                 PrintDocument(document);
  377.             }
  378.  
  379.     }
  380.     catch (const invalid_argument& e) {
  381.         cout << "Ошибка: "s << e.what() << endl;
  382.     }
  383.    
  384.    
  385.  
  386.    
  387.     vector<Document> documents;
  388.  
  389. }
Advertisement
Add Comment
Please, Sign In to add comment
Advertisement