Advertisement
Not a member of Pastebin yet?
Sign Up,
it unlocks many cool features!
- #1) Скачать XML файл https://drive.google.com/file/d/1_TNSX3RAzlhUx-CabYZznyQrwnsGsoGL/view?usp=sharing
- #1.1) Спарсить все категории товаров и сохранить в отдельный текстовый файл
- import xml.etree.ElementTree as ET
- file_path = "C:/Users/TRAVK/Downloads/lite_yafbs_prices.ext.xml"
- #Укажите свой путь к файлу
- tree = ET.parse(file_path)
- root = tree.getroot()
- with open("categories.txt", "w", encoding='utf-8') as f:
- for category in root.iter('category'):
- f.write(category.text + "\n")
- #1.2) Спарсить всю информацию о товарах offers (все вложенные теги и атрибуты) и сохранить в отдельный текстовый файл
- import xml.etree.ElementTree as ET
- file_path = "C:/Users/TRAVK/Downloads/lite_yafbs_prices.ext.xml"
- #Укажите свой путь к файлу
- tree = ET.parse(file_path)
- root = tree.getroot()
- with open("offers_info.txt", "w", encoding='utf-8') as f:
- for offer in root.iter('offer'):
- f.write(f"Offer ID: {offer.attrib['id']}\n")
- for child in offer:
- if child.text is not None:
- f.write(f"{child.tag}: {child.text}\n")
- else:
- f.write(f"{child.tag}: \n")
- for key, value in child.attrib.items():
- f.write(f" - {key}: {value}\n")
- f.write("\n")
- #2) Скачать JSON файл https://drive.google.com/file/d/1kLJJLlCbRgZy23lRauFDsIkgDUQts4cm/view?usp=sharing
- #Спарсить всю информацию о первых 100 товарах и сохранить её в отдельный текстовый файл
- with open('data.json', 'r', encoding='utf-8') as f:
- data = f.readlines()
- products = []
- count = 0
- for product_str in data:
- if count < 1000:
- product_data = {}
- for item in product_str.strip().split(','):
- if ':' in item:
- key, value = item.split(':', 1)
- key = key.strip()
- value = value.strip()
- product_data[key] = value
- products.append(product_data)
- count += 1
- with open('products_data.txt', 'w', encoding='utf-8') as f:
- for product in products:
- for key, value in product.items():
- f.write(f"{key}: {value}\n")
- f.write('---\n')
Advertisement
Add Comment
Please, Sign In to add comment
Advertisement