Izdvojeno > Tutorijali za izradu titlova
Hrvatska OCR skripta za Subtitle Edit
ameo:
Lijep pozdrav svim prevoditeljima.
Od danas (22.7.2015.) sa novijom (3.4.7.) verzijom programa Subtitle Edit dolaze dvije skripte.
I u tome je značajna promjena za hrvatsko/srpsko područje (tržište :P)
Sa prvom su neki od vas već jako dobro upoznati, i to je Milanova OCR skripta koja
popravlja greške u srpskom i hrvatskom jeziku, a koja je do sad bila dostupna samo za Subtitle Workshop.
No sada je naravno dostupna i od ove verzije programa SE - tj. ugrađena je u njega.
Ona je ugrađena u obje verzije, hrvatsku i srpsku, pošto je univerzalna.
No, što se tiče ispravljanja riječi ona je tek mali dio svega ovog.
Pomoću moćnih regularnih izraza, skripta nalazi i mijenja sve padeže/konjugacije uključenih riječi.
No, ona je specifično hrvatska, i ne služi samo mijenjanju hrvatskih riječi, nego i srpskih, i kao takva ne može se koristiti u srpskom jeziku - očito.
To je jedna od glavnijih uključenih značajki, koje sam želio postići - lakše konvertiranje srpskih titlova u hrvatske.
tako npr. lečenje i lječenje - dvije pogrešno napisane riječi - postaju liječenje [bilo da su pisane velikim ili malim slovima.
--- Kod: ---<RegEx find="([lL])j?ečenj(a|e|u|em|ima)" replaceWith="$1iječenj$2" />
--- Kraj koda ---
Od vas se traži
1. dobra volja u prijavljivanju svih mogućih pogrešaka koje se mogu desiti pri njenom korištenju,
a nesumnjivo je da će ih biti, pošto je ovo tek prva verzija.
2. ovisno o broju linija, malo strpljenja dok skripta prođe kroz cijeli titl i prepravi sve.
Najčešće minuta/minuta i po, no ovisi i o brzini vašeg računala.
Naravno, ako ste super prevoditelj, na kraju sve pregledavate kroz Hascheck (hrvatski akademski spelling checker)
kao i obično, da vidite što gdje fali i što ste zaboravili.
Mislim da je to sve za sada.
Mogao bih staviti i paypal donate button, ako tko želi donirati za nemalo utrošeno vrijeme, no možda i ne.
Greške možete prijavljivati preko privatne poruke ili ovdje ako vam se baš da.
Ako ste kojim slučajem na githubu, možete i preko Gittera
Kako vam god odgovara
Subtitle Edit možete preuzeti|skinuti|downloadati ovdje: :ono-kao
Živili! :volim
p.s. kako će skripta biti nadograđivana, i obnavljana ne morate čekati sljedeću verziju SE, nego možete otići na link sa sličice, kliknuti na Raw i prekopirati u svoju verziju na kompu. Do nje možete doći preko Spell Check menua - Get Dictionaries - Open Dictionaries Folder - hrv_OCRFixReplaceList.xml
MilanRS:
Svaka čast za implementaciju skripte.
Što se tiče ovog drugog - prebacivanja sa jednog jezika na drugi - tu sam veliki protivnik. Nemoguće je da program savršeno uradi, čak je nemoguće tako nešto i da se napravi. Može djelimično, ali onda se dobije nešto što nije ni srpski ni hrvatski, pa je veća šteta od koristi. I takve prevode ne prihvatamo.
Npr.
Lijepo je imati veliku obitelj. Obitelj. Bez obitelji.
Porodicu. Porodica. Porodice.
Sigurno postoji sličan slučaj i za prebacivanje sa srpskog na hrvatski.
Prije 6-7 godina sam pokušao da napravim takvu skriptu i odustao.
A titl biram po kvalitetu prevoda, nebitno da li je prevod na srpski ili hrvatski.
ameo:
--- Citat: MilanRS - 22.07.2015. 12:32:01 ---Nemoguće je da program savršeno uradi, čak je nemoguće tako nešto i da se napravi.
Može djelimično, ali onda se dobije nešto što nije ni srpski ni hrvatski, pa je veća šteta od koristi. I takve prevode ne prihvatamo.
Npr.
Lijepo je imati veliku obitelj. Obitelj. Bez obitelji.
Porodicu. Porodica. Porodice.
--- Kraj citata ---
evo primjer kako se skripta nosi s tim:
--- Kod: ---
<Word from="porodica" to="obitelj" /> <Word from="porodice" to="obitelji" /> <Word from="porodici" to="obitelji" /> <Word from="porodicu" to="obitelj" />
--- Kraj koda ---
Znači, nije sve u regexu, koji jest da svašta može, no ovakve iznimke mogu se pisati izvan regexa u listu riječi, i sve će biti dobro.
Istina, trenutno nema verzije za velika slova, no sve se može nadodati.
Potpuno se slažem da skripta nije svemoćna i da na kraju krajeva prevoditelji i obrađivači moraju gledati što rade,
jer ne može skripta promijeniti sve fraze i način govora koji se razlikuje u srpskom i hrvatskom.
Ona je pomoćno sredstvo i po meni, ako netko želi nešto obraditi sa srpskog na hrvatski, prvo ode i klikne na nju,
ona mu promijeni mnoštvo riječi, zatim gleda gdje se dalje treba prepravljati. I na kraju svega - Hascheck.
znači [sa srpskog na hrvatski] a -> b -> c skripta -> čovjek - > provjera kroz Hascheck
provjera hrvatskih titlova: čovjek -> skripta -> provjera kroz Hascheck.
p.s. ako je nekom dovoljna samo Milanova, može samo izabrati verziju za srpski jezik i naći će ju tamo u cijelosti.
(pošto je, kako već rekoh, a znam jer mi je rekao - univerzalna).
ameo:
Updejtano, ako je koga briga, tj. ako itko odavde koristi ovo:
skalice.united:
--- Citat: ameo - 01.08.2015. 13:49:51 ---Updejtano, ako je koga briga, tj. ako itko odavde koristi ovo:
--- Kraj citata ---
kako da pokrenem skriptu u programu i provjerim pravopis
Navigacija
[0] Lista Poruka
Idi na punu verziju