Izdvojeno > Tutorijali za izradu titlova

Hrvatska OCR skripta za Subtitle Edit

(1/3) > >>

ameo:


Lijep pozdrav svim prevoditeljima.
Od danas (22.7.2015.) sa novijom (3.4.7.) verzijom programa Subtitle Edit dolaze dvije skripte.
I u tome je značajna promjena za hrvatsko/srpsko područje (tržište  :P)

Sa prvom su neki od vas već jako dobro upoznati, i to je Milanova OCR skripta koja
popravlja greške u srpskom i hrvatskom jeziku, a koja je do sad bila dostupna samo za Subtitle Workshop.

No sada je naravno dostupna i od ove verzije programa SE - tj. ugrađena je u njega.
Ona je ugrađena u obje verzije, hrvatsku i srpsku, pošto je univerzalna.

No, što se tiče ispravljanja riječi ona je tek mali dio svega ovog.

Pomoću moćnih regularnih izraza, skripta nalazi i mijenja sve padeže/konjugacije uključenih riječi.

No, ona je specifično hrvatska, i ne služi samo mijenjanju hrvatskih riječi, nego i srpskih, i kao takva ne može se koristiti u srpskom jeziku - očito.
To je jedna od glavnijih uključenih značajki, koje sam želio postići - lakše konvertiranje srpskih titlova u hrvatske.

tako npr. lečenje i lječenje - dvije pogrešno napisane riječi - postaju liječenje [bilo da su pisane velikim ili malim slovima.


--- Kod: ---<RegEx find="([lL])j?ečenj(a|e|u|em|ima)" replaceWith="$1iječenj$2" />
--- Kraj koda ---


Od vas se traži
1. dobra volja u prijavljivanju svih mogućih pogrešaka koje se mogu desiti pri njenom korištenju,
a nesumnjivo je da će ih biti, pošto je ovo tek prva verzija.

2. ovisno o broju linija, malo strpljenja dok skripta prođe kroz cijeli titl i prepravi sve.
Najčešće minuta/minuta i po, no ovisi i o brzini vašeg računala.

Naravno, ako ste super prevoditelj, na kraju sve pregledavate kroz Hascheck (hrvatski akademski spelling checker)
kao i obično, da vidite što gdje fali i što ste zaboravili.

Mislim da je to sve za sada.
Mogao bih staviti i paypal donate button, ako tko želi donirati za nemalo utrošeno vrijeme, no možda i ne.

Greške možete prijavljivati preko privatne poruke ili ovdje ako vam se baš da.
Ako ste kojim slučajem na githubu, možete i preko Gittera
Kako vam god odgovara

Subtitle Edit možete preuzeti|skinuti|downloadati ovdje:  :ono-kao


Živili!  :volim


p.s. kako će skripta biti nadograđivana, i obnavljana ne morate čekati sljedeću verziju SE, nego možete otići na link sa sličice, kliknuti na Raw i prekopirati u svoju verziju na kompu. Do nje možete doći preko Spell Check menua - Get Dictionaries - Open Dictionaries Folder - hrv_OCRFixReplaceList.xml

MilanRS:
Svaka čast za implementaciju skripte.

Što se tiče ovog drugog - prebacivanja sa jednog jezika na drugi - tu sam veliki protivnik. Nemoguće je da program savršeno uradi, čak je nemoguće tako nešto i da se napravi. Može djelimično, ali onda se dobije nešto što nije ni srpski ni hrvatski, pa je veća šteta od koristi. I takve prevode ne prihvatamo.
Npr.
Lijepo je imati veliku obitelj. Obitelj. Bez obitelji.
Porodicu. Porodica. Porodice.

Sigurno postoji sličan slučaj i za prebacivanje sa srpskog na hrvatski.
Prije 6-7 godina sam pokušao da napravim takvu skriptu i odustao.
A titl biram po kvalitetu prevoda, nebitno da li je prevod na srpski ili hrvatski.

ameo:

--- Citat: MilanRS - 22.07.2015. 12:32:01 ---Nemoguće je da program savršeno uradi, čak je nemoguće tako nešto i da se napravi.
Može djelimično, ali onda se dobije nešto što nije ni srpski ni hrvatski, pa je veća šteta od koristi. I takve prevode ne prihvatamo.
Npr.
Lijepo je imati veliku obitelj. Obitelj. Bez obitelji.
Porodicu. Porodica. Porodice.

--- Kraj citata ---


evo primjer kako se skripta nosi s tim:

--- Kod: ---

    <Word from="porodica" to="obitelj" />    <Word from="porodice" to="obitelji" />    <Word from="porodici" to="obitelji" />    <Word from="porodicu" to="obitelj" />

--- Kraj koda ---


Znači, nije sve u regexu, koji jest da svašta može, no ovakve iznimke mogu se pisati izvan regexa u listu riječi, i sve će biti dobro.
Istina, trenutno nema verzije za velika slova, no sve se može nadodati.


Potpuno se slažem da skripta nije svemoćna i da na kraju krajeva prevoditelji i obrađivači moraju gledati što rade,
jer ne može skripta promijeniti sve fraze i način govora koji se razlikuje u srpskom i hrvatskom.


Ona je pomoćno sredstvo i po meni, ako netko želi nešto obraditi sa srpskog na hrvatski, prvo ode i klikne na nju,
ona mu promijeni mnoštvo riječi, zatim gleda gdje se dalje treba prepravljati. I na kraju svega - Hascheck.


znači [sa srpskog na hrvatski] a -> b -> c   skripta -> čovjek - > provjera kroz Hascheck


provjera hrvatskih titlova: čovjek -> skripta -> provjera kroz Hascheck.




p.s. ako je nekom dovoljna samo Milanova, može samo izabrati verziju za srpski jezik i naći će ju tamo u cijelosti.
(pošto je, kako već rekoh, a znam jer mi je rekao - univerzalna).

ameo:
Updejtano, ako je koga briga, tj. ako itko odavde koristi ovo:


skalice.united:

--- Citat: ameo - 01.08.2015. 13:49:51 ---Updejtano, ako je koga briga, tj. ako itko odavde koristi ovo:




--- Kraj citata ---

kako da pokrenem skriptu u programu i provjerim pravopis

Navigacija

[0] Lista Poruka

[#] Slijedeća stranica

Idi na punu verziju