Advertisement
Alaricy

инициализация сервера

Dec 6th, 2022 (edited)
151
0
Never
Not a member of Pastebin yet? Sign Up, it unlocks many cool features!
C++ 9.55 KB | None | 0 0
  1. #include <algorithm>
  2. #include <cmath>
  3. #include <iostream>
  4. #include <map>
  5. #include <set>
  6. #include <string>
  7. #include <utility>
  8. #include <vector>
  9.  
  10.  
  11. using namespace std;
  12.  
  13. const int MAX_RESULT_DOCUMENT_COUNT = 5;
  14. const double PREСISION = 1e-6;
  15.  
  16. string ReadLine() {
  17.     string s;
  18.     getline(cin, s);
  19.     return s;
  20. }
  21.  
  22. int ReadLineWithNumber() {
  23.     int result;
  24.     cin >> result;
  25.     ReadLine();
  26.     return result;
  27. }
  28.  
  29. vector<string> SplitIntoWords(const string& text) {
  30.     vector<string> words;
  31.     string word;
  32.     for (const char c : text) {
  33.         if (c == ' ') {
  34.             if (!word.empty()) {
  35.                 words.push_back(word);
  36.                 word.clear();
  37.             }
  38.         }
  39.         else {
  40.             word += c;
  41.         }
  42.     }
  43.     if (!word.empty()) {
  44.         words.push_back(word);
  45.     }
  46.  
  47.     return words;
  48. }
  49.  
  50. struct Document {
  51.     int id = 0;
  52.     double relevance = 0.0;
  53.     int rating = 0;
  54.     Document(int idd, double rell, int rtt) {
  55.         id = idd;
  56.         relevance = rell;
  57.         rating=rtt;
  58.     }
  59.     Document() = default;
  60. };
  61.  
  62. enum class DocumentStatus {
  63.     ACTUAL,
  64.     IRRELEVANT,
  65.     BANNED,
  66.     REMOVED,
  67. };
  68.  
  69. vector<Document> SortVector(vector<Document> vector) {
  70.     sort(vector.begin(), vector.end(),
  71.         [](const Document& lhs, const Document& rhs) {
  72.             if (abs(lhs.relevance - rhs.relevance) < PREСISION) {
  73.                 return lhs.rating > rhs.rating;
  74.             }
  75.             else {
  76.                 return lhs.relevance > rhs.relevance;
  77.             }
  78.         });
  79.     if (vector.size() > MAX_RESULT_DOCUMENT_COUNT) {
  80.         vector.resize(MAX_RESULT_DOCUMENT_COUNT);
  81.     }
  82.  
  83.     return vector;
  84. }
  85.  
  86. class SearchServer {
  87. public:
  88.     SearchServer(const string& text)
  89.     {
  90.         for (string word : SplitIntoWords(text)) {
  91.             stop_words_.insert(word);
  92.         }
  93.     }
  94.     SearchServer(const vector<string>& textv)
  95.     {
  96.         for (string word : textv) {
  97.             stop_words_.insert(word);
  98.         }
  99.     }
  100.     SearchServer(const set<string>& texts)
  101.     {
  102.         for (string word : texts) {
  103.             stop_words_.insert(word);
  104.         }
  105.     }
  106.  
  107.  
  108.     template <typename Predicate>
  109.     vector<Document> FindTopDocuments(const string& raw_query,
  110.         Predicate predicate) const {
  111.         const Query query = ParseQuery(raw_query);
  112.         auto matched_documents = FindAllDocuments(query, predicate);
  113.         return SortVector(matched_documents);
  114.     }
  115.  
  116.     vector<Document> FindTopDocuments(const string& raw_query, DocumentStatus status = DocumentStatus::ACTUAL) const {
  117.         return FindTopDocuments(raw_query, [status](int document_id, DocumentStatus stat, int rating) { return status == stat; });
  118.     }
  119.  
  120.     void SetStopWords(const string& text) {
  121.         for (const string& word : SplitIntoWords(text)) {
  122.             stop_words_.insert(word);
  123.         }
  124.     }
  125.  
  126.     void AddDocument(int document_id, const string& document, DocumentStatus status,
  127.         const vector<int>& ratings) {
  128.         const vector<string> words = SplitIntoWordsNoStop(document);
  129.         const double inv_word_count = 1.0 / words.size();
  130.         for (const string& word : words) {
  131.             word_to_document_freqs_[word][document_id] += inv_word_count;
  132.         }
  133.         documents_.emplace(document_id, DocumentData{ ComputeAverageRating(ratings), status });
  134.     }
  135.  
  136.  
  137.  
  138.     int GetDocumentCount() const {
  139.         return documents_.size();
  140.     }
  141.  
  142.     tuple<vector<string>, DocumentStatus> MatchDocument(const string& raw_query,
  143.         int document_id) const {
  144.         const Query query = ParseQuery(raw_query);
  145.         vector<string> matched_words;
  146.         for (const string& word : query.plus_words) {
  147.             if (word_to_document_freqs_.count(word) == 0) {
  148.                 continue;
  149.             }
  150.             if (word_to_document_freqs_.at(word).count(document_id)) {
  151.                 matched_words.push_back(word);
  152.             }
  153.         }
  154.         for (const string& word : query.minus_words) {
  155.             if (word_to_document_freqs_.count(word) == 0) {
  156.                 continue;
  157.             }
  158.             if (word_to_document_freqs_.at(word).count(document_id)) {
  159.                 matched_words.clear();
  160.                 break;
  161.             }
  162.         }
  163.         return { matched_words, documents_.at(document_id).status };
  164.     }
  165.  
  166. private:
  167.     struct DocumentData {
  168.         int rating = 0;
  169.         DocumentStatus status = DocumentStatus::ACTUAL;
  170.     };
  171.  
  172.     set<string> stop_words_;
  173.     map<string, map<int, double>> word_to_document_freqs_;
  174.     map<int, DocumentData> documents_;
  175.  
  176.     bool IsStopWord(const string& word) const {
  177.         return stop_words_.count(word) > 0;
  178.     }
  179.  
  180.     vector<string> SplitIntoWordsNoStop(const string& text) const {
  181.         vector<string> words;
  182.         for (const string& word : SplitIntoWords(text)) {
  183.             if (!IsStopWord(word)) {
  184.                 words.push_back(word);
  185.             }
  186.         }
  187.         return words;
  188.     }
  189.  
  190.     static int ComputeAverageRating(const vector<int>& ratings) {
  191.         if (ratings.empty()) {
  192.             return 0;
  193.         }
  194.         int rating_sum = 0;
  195.         for (const int rating : ratings) {
  196.             rating_sum += rating;
  197.         }
  198.         return rating_sum / static_cast<int>(ratings.size());
  199.     }
  200.  
  201.     struct QueryWord {
  202.         string data;
  203.         bool is_minus;
  204.         bool is_stop;
  205.     };
  206.  
  207.     QueryWord ParseQueryWord(string text) const {
  208.         bool is_minus = false;
  209.         // Word shouldn't be empty
  210.         if (text[0] == '-') {
  211.             is_minus = true;
  212.             text = text.substr(1);
  213.         }
  214.         return { text, is_minus, IsStopWord(text) };
  215.     }
  216.  
  217.     struct Query {
  218.         set<string> plus_words;
  219.         set<string> minus_words;
  220.     };
  221.  
  222.     Query ParseQuery(const string& text) const {
  223.         Query query;
  224.         for (const string& word : SplitIntoWords(text)) {
  225.             const QueryWord query_word = ParseQueryWord(word);
  226.             if (!query_word.is_stop) {
  227.                 if (query_word.is_minus) {
  228.                     query.minus_words.insert(query_word.data);
  229.                 }
  230.                 else {
  231.                     query.plus_words.insert(query_word.data);
  232.                 }
  233.             }
  234.         }
  235.         return query;
  236.     }
  237.  
  238.     // Existence required
  239.     double ComputeWordInverseDocumentFreq(const string& word) const {
  240.         return log(GetDocumentCount() * 1.0 / word_to_document_freqs_.at(word).size());
  241.     }
  242.  
  243.     template <typename Predicate>
  244.     vector<Document> FindAllDocuments(const Query& query, Predicate predicat) const {
  245.         map<int, double> document_to_relevance;
  246.         for (const string& word : query.plus_words) {
  247.             if (word_to_document_freqs_.count(word) == 0) {
  248.                 continue;
  249.             }
  250.             const double inverse_document_freq = ComputeWordInverseDocumentFreq(word);
  251.             for (const auto [document_id, term_freq] : word_to_document_freqs_.at(word)) {
  252.                 if (predicat(document_id, documents_.at(document_id).status, documents_.at(document_id).rating)) {
  253.                     document_to_relevance[document_id] += term_freq * inverse_document_freq;
  254.                 }
  255.             }
  256.         }
  257.  
  258.         for (const string& word : query.minus_words) {
  259.             if (word_to_document_freqs_.count(word) == 0) {
  260.                 continue;
  261.             }
  262.             for (const auto [document_id, _] : word_to_document_freqs_.at(word)) {
  263.                 document_to_relevance.erase(document_id);
  264.             }
  265.         }
  266.  
  267.         vector<Document> matched_documents;
  268.         for (const auto [document_id, relevance] : document_to_relevance) {
  269.             matched_documents.push_back(
  270.                 { document_id, relevance, documents_.at(document_id).rating });
  271.         }
  272.         return matched_documents;
  273.     }
  274. };
  275.  
  276. // ==================== для примера =========================
  277.  
  278. void PrintDocument(const Document& document) {
  279.     cout << "{ "s
  280.         << "document_id = "s << document.id << ", "s
  281.         << "relevance = "s << document.relevance << ", "s
  282.         << "rating = "s << document.rating << " }"s << endl;
  283. }
  284. int main() {
  285.     const set<string> stop_words_set = {};
  286.     setlocale(LC_ALL, "Russian");
  287.     SearchServer search_server("и в на"s);
  288.     // search_server.SetStopWords("и в на"s);
  289.     search_server.AddDocument(0, "белый кот и модный ошейник"s, DocumentStatus::ACTUAL, { 8, -3 });
  290.     search_server.AddDocument(1, "пушистый кот пушистый хвост"s, DocumentStatus::ACTUAL, { 7, 2, 7 });
  291.     search_server.AddDocument(2, "ухоженный пёс выразительные глаза"s, DocumentStatus::ACTUAL, { 5, -12, 2, 1 });
  292.     search_server.AddDocument(3, "ухоженный скворец евгений"s, DocumentStatus::BANNED, { 9 });
  293.     cout << "ACTUAL by default:"s << endl;
  294.     for (const Document& document : search_server.FindTopDocuments("пушистый ухоженный кот"s)) {
  295.         PrintDocument(document);
  296.     }
  297.     cout << "BANNED:"s << endl;
  298.     for (const Document& document : search_server.FindTopDocuments("пушистый ухоженный кот"s, DocumentStatus::BANNED)) {
  299.         PrintDocument(document);
  300.     }
  301.     cout << "Even ids:"s << endl;
  302.     for (const Document& document : search_server.FindTopDocuments("пушистый ухоженный кот"s, [](int document_id, DocumentStatus status, int rating) { return document_id % 2 == 0; })) {
  303.         PrintDocument(document);
  304.     }
  305.     return 0;
  306. }
Advertisement
Add Comment
Please, Sign In to add comment
Advertisement