Advertisement
nicuf

remove watermark pdf -pages

May 8th, 2024
417
0
Never
Not a member of Pastebin yet? Sign Up, it unlocks many cool features!
Python 1.70 KB | None | 0 0
  1. import os
  2. import fitz  # PyMuPDF
  3.  
  4. def remove_watermark_and_empty_pages(input_pdf, output_pdf):
  5.     # Deschide fișierul PDF de intrare
  6.     doc = fitz.open(input_pdf)
  7.  
  8.     # Creați un nou document PDF gol pentru ieșire
  9.     output_doc = fitz.open()
  10.  
  11.     # Parcurge fiecare pagină a documentului de intrare
  12.     for page_number in range(len(doc)):
  13.         # Încarcă pagina curentă
  14.         page = doc.load_page(page_number)
  15.  
  16.         # Curăță conținutul paginii pentru a îndepărta elementele grafice
  17.         page.clean_contents()
  18.  
  19.         # Verifică dacă pagina este goală
  20.         # Dacă pagina conține text sau elemente grafice, o adăugăm în documentul de ieșire
  21.         if page.get_text().strip() or page.search_for_images(full=True):
  22.             output_doc.insert_pdf(doc, from_page=page_number, to_page=page_number)
  23.  
  24.     # Salvează documentul PDF modificat în output_pdf
  25.     output_doc.save(output_pdf)
  26.  
  27.     # Închide documentele PDF
  28.     doc.close()
  29.     output_doc.close()
  30.  
  31. # Directorul unde se află fișierele PDF
  32. directory = "D:/test"
  33.  
  34. # Parcurge fiecare fișier PDF din director
  35. for filename in os.listdir(directory):
  36.     if filename.endswith(".pdf"):
  37.         # Calea completă a fișierului PDF de intrare
  38.         input_pdf = os.path.join(directory, filename)
  39.  
  40.         # Calea completă a fișierului PDF de ieșire
  41.         output_pdf = os.path.join(directory, filename.replace(".pdf", "_removed.pdf"))
  42.  
  43.         # Elimină watermark-ul și paginile goale din fișierul PDF
  44.         remove_watermark_and_empty_pages(input_pdf, output_pdf)
  45.  
  46. print("Eliminarea watermark-ului și paginilor goale a fost completată pentru toate fișierele PDF din directorul specificat.")
  47.  
Advertisement
Add Comment
Please, Sign In to add comment
Advertisement