Not a member of Pastebin yet?
Sign Up,
it unlocks many cool features!
- import re
- """
- Esta función recibe un archivo de texto y una expresión regular.
- Todas las frases del libro "War of the Worlds" que contienen la palabra war o la palabra worlds.
- Todas las frases de "Moby Dick" que contienen palabras que empiecen por whal.
- En ambos casos, será necesario que los patrones no tengan en cuenta mayúsculas y minúsculas. Por tanto, habrá que devolver las frases que contengan "worlds" y también las que contengan Worlds o wORLdS.
- Como parte del ejercicio, deberá separarse el texto en frases. Éste es un tema que puede llegar a ser muy complejo y por tanto en este ejercicio trabajaremos con una simplificación. En concreto, consideraremos que las frases terminarán siempre con un punto "." o con un símbolo de interrogación "?". Adicionalmente, el texto ha sido simplificado para no contener algunos símbolos conflictivos como los puntos suspensivos. Nótese que muchas de las frases están repartidas en más de una línea de texto. Las frases que se devuelven deben incluir, en todo caso, el símbolo de final de frase (punto "." o "?").
- """
- def process_book(input_file, regular_exp):
- output = []
- data = ""
- with open(input_file, "r") as file:
- data = file.read().rstrip()
- data = re.split(r'[.?]', data)
- #data = list(map(lambda x: x.strip(), data))
- data = list(map(lambda x: x[1:] if len(x) > 0 and x[0]=="\n" else x, data))
- for line in data:
- #Aplicar patron
- if re.search(regular_exp, line, re.IGNORECASE):
- if line[-1] != '.' and line[-1] != '?':
- line += "."
- output.append(line)
- return output
- pattern = r'\b(?:war|worlds)\b'
- ret = process_book("warworlds.txt", pattern)
- assert(len(ret) == 15), "Incorrect Number Of Sentences"
- assert(" I, THE EVE OF THE WAR." in ret), "Missing A sentence "
- assert("No one gave a thought to the older worlds of space as \
- sources\nof human danger, or thought of them only to dismiss \
- the idea of life\nupon them as impossible or improbable \
- ." in ret), "Missing A sentence "
- print("Code run without problems")
Add Comment
Please, Sign In to add comment