# Univerzitet u Novom Sadu, Fakultet tehničkih nauka, Novi Sad, Srbija
# Studijski program OAS Informacioni inženjering
# Predmet Metode i tehnike nauke o podacima

# Pomoćni sadržaj


# %% Biblioteke i korpusi

import nltk
nltk.download("udhr2")
from nltk.corpus import udhr2
nltk.download("punkt")
from nltk.tokenize import sent_tokenize


# %% Rad nad tekstom

print("Datoteke u korpusu:")
print(udhr2.fileids())
odabrana_datoteka = "srp_cyrl.txt"

tekst = udhr2.raw(odabrana_datoteka)
print("------------------------------------------------------------")
print("Celokupan tekst:\n")
print(tekst)

tokeni = sent_tokenize(tekst)
print("------------------------------------------------------------")
print("Celokupan tekst kao rečenice:\n")
print(tokeni)

početna_pozicija = tokeni.index("Члан 26.")
završna_pozicija = tokeni.index("Члан 27.")

deo = tokeni[početna_pozicija:završna_pozicija]
print("------------------------------------------------------------")
print("Izdvojeni deo teksta:\n")
print("\n\n".join(deo))

print("------------------------------------------------------------")

