2024 m. sausio 28 d., sekmadienis

Hansas Kristijonas Andersenas

 Puiki biografinė knyga apie garsų Danų rašytoją, dramaturgą ir poetą Hansa Kristianą Anderseną. Puikiai atpasakota žmogaus istorija su visais jo privalumais ir trūkumais. tai viena iš tų knygų kurias turėtų perskaityti jauni žmonės kažko siekiantys gyvenimo kelyje.



2024 m. sausio 6 d., šeštadienis

Paslaptingas augalų gyvenimas

 Senai parašyta, tačiau vis dar išliekanti svarbi Peterio Tompkinso ir Kristoferio Birdo knyga, apie keistus reiškinius augaluose. Šiuo metu nemaža šių reiškinių dalis jau nebėra keista, tačiau kai kurie dalykai nepaaiškinti lig šiol.




Darbas su PDF failais. Žodžių skaičiavimas visoje knygoje.

Praeitos programos pratęsimas. Ši programa suskaičiuoja žodžių pasikartojimą visoje knygoje.

# prijungiama reikalinga biblioteka

import PyPDF2

 

# sukuriamas failo objektas

pdfFileObj = open('Failo_vardas.pdf', 'rb')

 

# sukuriamas skaitymo objektas

pdfReader = PyPDF2.PdfReader(pdfFileObj)

 

# atspausdinamas puslapių skaičius

print(len(pdfReader.pages))

 

# sukuriamas puslapio objektas

m=[]

for i in pdfReader.pages:

    m.append(i)

#pageObj = pdfReader.pages[10]

 

# ištraukiamas tekstas, ištraukimo metu sussumuojami puslapių tekstai į vieną tekstą.


k=''

for i in m:

    k+=i.extract_text()


#print(k)

# uždaromas skaitymo objektas

pdfFileObj.close()


k=k.casefold()

u={")","(","'",",",".",":","`",'_',';','+','-','*','/','"','—',"“"}

for i in u:

    k=k.replace(i,"")

k1=k.split()

del(k)


print('----------------')


k2=[]

for i in k1:

    if i.isnumeric():

        pass

    else:

        k2.append(i)


del(k1)


s=set(k2)



# sukuriame žodyną    

dik={}    

print('žodžių skaičius tekste =',len(k2))

print('žodžių esančių tekste sąrašas =',len(s))

print('----------------')


# užpildome žodyną

for i in s:

#    print(i,'=',k2.count(i))

    dik.update({i:k2.count(i)})

    

del(s)

del(k2)


w=dik.items()


# skaičiuoja žodžius nuo raidžių skaičiaus n1 iki n2

n1=1000

n2=10000

for i,j in w:

    if j<n2 and j>n1:

        print(i,"=",j)

del(dik)

del(w)


2024 m. sausio 4 d., ketvirtadienis

Darbas su PDF failais. Žodžių skaičiavimas pasirinktame knygos puslapyje.

 Apačioje pateikiamas pavyzdys kaip suskaičiuoti vienodus žodžius PDF byloje. Ši programa sukaičiuoja žodžius viename pasirinktame PDF puslapyje. Tiesa tam jums reikės įsidiegti PyPDF2 biblioteką:

 

# importuojama reikalinga darbui su PDF biblioteka. Įprastoje Python distribucijoje jos nėra, taigi teks įsidiegti.
import PyPDF2

# sukuriamas failo objektas.
pdfFileObj = open('bylos vardas.pdf', 'rb')
 
# sukuriamas skaitymo objektas
pdfReader = PyPDF2.PdfReader(pdfFileObj)
 
# atspausdinamas puslapių skaičius
print('Puslapių skaičius =',len(pdfReader.pages))

e=int(input("įveskite puslapį ="))-1
 
# sukuriamas puslapio objektas
m=[]
for i in pdfReader.pages:
    m.append(i)
pageObj=m[e]
#pageObj = pdfReader.pages[10]
 
# ištraukiamas tekstas
k=pageObj.extract_text()

#print(k)
# uždaromas skaitymo objektas
pdfFileObj.close()

k=k.casefold()

# Sudaroma ženklų kuriuos reikia pašalinti seka.
r=(',',')','(','"',"'",'.','_',':','^','?','!','-','+','/','*')

#Metodo "replace" pagalba pašalinami nereikalingi ženklai.
for i in r:
    k=k.replace(i,"")

# Tekstas paverčiamas į sarašą sudarytą iš žodžių.
k1=k.split()

# Atminties taupymo tikslais ištrinamas nebenaudojamas sąrašas.       
del[k]

# Pašalinami skaičiai
k2=[]
for i in k1:
    if i.isnumeric():
        pass
    else:
        k2.append(i)
# Atminties taupymo tikslais ištrinamas nebenaudojamas sąrašas.       
del[k1]

# Sukuriama aibė:
k3=set(k2)
 
# Pasižiūrėjimui atsipausdiname sąrašo ir aibės ilgius.
print(len(k2),len(k3))

#Atspausdiname kiek konkretaus žodžio pasitaikymą tekste.
for i in k3:
    print(i,'=',k2.count(i))

 




Atmosferos elektra

"Žaibas trenkiantis išdebesies į Žemės paviršių bendru elektros požiūriu. Tai yra plazmos, esančios Žemės paviršiuje, pavyzdys. Paprast...