Prijevodi - Online

Izdvojeno => Tutorijali za izradu titlova => Autor teme: ameo - 22.07.2015. 12:22:48

Naslov: Hrvatska OCR skripta za Subtitle Edit
Autor: ameo - 22.07.2015. 12:22:48
(https://img.shields.io/badge/SUBTITLE%20EDIT-hrvatska%20ocr%20fix%2Freplace%20lista-63B8FF.svg) (http://git.io/vtMyW)


Lijep pozdrav svim prevoditeljima.
Od danas (22.7.2015.) sa novijom (3.4.7.) verzijom programa Subtitle Edit dolaze dvije skripte.
I u tome je značajna promjena za hrvatsko/srpsko područje (tržište  :P)

Sa prvom su neki od vas već jako dobro upoznati, i to je Milanova OCR skripta koja
popravlja greške u srpskom i hrvatskom jeziku, a koja je do sad bila dostupna samo za Subtitle Workshop.

No sada je naravno dostupna i od ove verzije programa SE - tj. ugrađena je u njega.
Ona je ugrađena u obje verzije, hrvatsku i srpsku, pošto je univerzalna.

No, što se tiče ispravljanja riječi ona je tek mali dio svega ovog.

Pomoću moćnih regularnih izraza, skripta nalazi i mijenja sve padeže/konjugacije uključenih riječi.

No, ona je specifično hrvatska, i ne služi samo mijenjanju hrvatskih riječi, nego i srpskih, i kao takva ne može se koristiti u srpskom jeziku - očito.
To je jedna od glavnijih uključenih značajki, koje sam želio postići - lakše konvertiranje srpskih titlova u hrvatske.

tako npr. lečenje i lječenje - dvije pogrešno napisane riječi - postaju liječenje [bilo da su pisane velikim ili malim slovima.

<RegEx find="([lL])j?ečenj(a|e|u|em|ima)" replaceWith="$1iječenj$2" />

Od vas se traži
1. dobra volja u prijavljivanju svih mogućih pogrešaka koje se mogu desiti pri njenom korištenju,
a nesumnjivo je da će ih biti, pošto je ovo tek prva verzija.


2. ovisno o broju linija, malo strpljenja dok skripta prođe kroz cijeli titl i prepravi sve.
Najčešće minuta/minuta i po, no ovisi i o brzini vašeg računala.

Naravno, ako ste super prevoditelj, na kraju sve pregledavate kroz Hascheck (hrvatski akademski spelling checker)
kao i obično, da vidite što gdje fali i što ste zaboravili.

Mislim da je to sve za sada.
Mogao bih staviti i paypal donate button, ako tko želi donirati za nemalo utrošeno vrijeme, no možda i ne.

Greške možete prijavljivati preko privatne poruke ili ovdje ako vam se baš da.
Ako ste kojim slučajem na githubu, možete i preko Gittera (http://gitter.im/diomed)
Kako vam god odgovara

Subtitle Edit možete preuzeti|skinuti|downloadati ovdje:  :ono-kao
(https://img.shields.io/badge/SUBTITLE%20EDIT-download-blue.svg) (https://github.com/SubtitleEdit/subtitleedit/releases/latest)

Živili!  :volim


p.s. kako će skripta biti nadograđivana, i obnavljana ne morate čekati sljedeću verziju SE, nego možete otići na link sa sličice, kliknuti na Raw i prekopirati u svoju verziju na kompu. Do nje možete doći preko Spell Check menua - Get Dictionaries - Open Dictionaries Folder - hrv_OCRFixReplaceList.xml
Naslov: Odg: Hrvatska OCR skripta za Subtitle Edit
Autor: MilanRS - 22.07.2015. 12:32:01
Svaka čast za implementaciju skripte.

Što se tiče ovog drugog - prebacivanja sa jednog jezika na drugi - tu sam veliki protivnik. Nemoguće je da program savršeno uradi, čak je nemoguće tako nešto i da se napravi. Može djelimično, ali onda se dobije nešto što nije ni srpski ni hrvatski, pa je veća šteta od koristi. I takve prevode ne prihvatamo.
Npr.
Lijepo je imati veliku obitelj. Obitelj. Bez obitelji.
Porodicu. Porodica. Porodice.

Sigurno postoji sličan slučaj i za prebacivanje sa srpskog na hrvatski.
Prije 6-7 godina sam pokušao da napravim takvu skriptu i odustao.
A titl biram po kvalitetu prevoda, nebitno da li je prevod na srpski ili hrvatski.
Naslov: Odg: Hrvatska OCR skripta za Subtitle Edit
Autor: ameo - 22.07.2015. 16:08:11
Nemoguće je da program savršeno uradi, čak je nemoguće tako nešto i da se napravi.
Može djelimično, ali onda se dobije nešto što nije ni srpski ni hrvatski, pa je veća šteta od koristi. I takve prevode ne prihvatamo.
Npr.
Lijepo je imati veliku obitelj. Obitelj. Bez obitelji.
Porodicu. Porodica. Porodice.



evo primjer kako se skripta nosi s tim:


    <Word from="porodica" to="obitelj" />    <Word from="porodice" to="obitelji" />    <Word from="porodici" to="obitelji" />    <Word from="porodicu" to="obitelj" />


Znači, nije sve u regexu, koji jest da svašta može, no ovakve iznimke mogu se pisati izvan regexa u listu riječi, i sve će biti dobro.
Istina, trenutno nema verzije za velika slova, no sve se može nadodati.


Potpuno se slažem da skripta nije svemoćna i da na kraju krajeva prevoditelji i obrađivači moraju gledati što rade,
jer ne može skripta promijeniti sve fraze i način govora koji se razlikuje u srpskom i hrvatskom.


Ona je pomoćno sredstvo i po meni, ako netko želi nešto obraditi sa srpskog na hrvatski, prvo ode i klikne na nju,
ona mu promijeni mnoštvo riječi, zatim gleda gdje se dalje treba prepravljati. I na kraju svega - Hascheck.


znači [sa srpskog na hrvatski] a -> b -> c   skripta -> čovjek - > provjera kroz Hascheck


provjera hrvatskih titlova: čovjek -> skripta -> provjera kroz Hascheck.




p.s. ako je nekom dovoljna samo Milanova, može samo izabrati verziju za srpski jezik i naći će ju tamo u cijelosti.
(pošto je, kako već rekoh, a znam jer mi je rekao - univerzalna).

Naslov: Odg: Hrvatska OCR skripta za Subtitle Edit
Autor: ameo - 01.08.2015. 13:49:51
Updejtano, ako je koga briga, tj. ako itko odavde koristi ovo:


(https://img.shields.io/badge/Subtitle%20Edit%20OCR-HR%200.3-FFA500.svg) (http://git.io/vtMyW)
Naslov: Odg: Hrvatska OCR skripta za Subtitle Edit
Autor: skalice.united - 01.08.2015. 14:42:20
Updejtano, ako je koga briga, tj. ako itko odavde koristi ovo:


(https://img.shields.io/badge/Subtitle%20Edit%20OCR-HR%200.3-FFA500.svg) (http://git.io/vtMyW)

kako da pokrenem skriptu u programu i provjerim pravopis
Naslov: Odg: Hrvatska OCR skripta za Subtitle Edit
Autor: ameo - 01.08.2015. 17:09:37
Subtitle Edit ima gumb [ikonu], ne znam da li se automatski pojavljuje ili ne - uglavnom može se u postavkama namjestiti:


Zove se Fix Common Errors [Popravi Uobičajene Pogreške].
Klikneš na njega, odabereš hr i Next [Naprijed]


Prvo ti izlista ispravke, potom klikneš na [Apply Selected Fixes] Primijeni ispravke  i OK.



Naslov: Odg: Hrvatska OCR skripta za Subtitle Edit
Autor: suadnovic - 26.08.2015. 19:08:39
Ne znam je li šta popravljano, evo nekih mojih ispravki za srpski

https://www.mediafire.com/?183s31kcae5wqm5
Naslov: Odg: Hrvatska OCR skripta za Subtitle Edit
Autor: alfred - 27.08.2015. 11:31:08
Malo pitanje.
Kako iskopirati tu listu ,pokušavam ali ne ide.Stisnem raw kako je rečeno zaplavim text nađem onu datoteku u programu a kada se otvori ,otvori mi je u IE i ne da mi zalijepiti.
Hvala unaprijed

P.S. namješteno je da se otvara sa XML editorom
Naslov: Odg: Hrvatska OCR skripta za Subtitle Edit
Autor: ameo - 27.08.2015. 15:35:28
Kad taj fajl lociraš u Dictionaries folderu klikni na njega desnim klikom i Open with - Notepad [npr.]


Idealno bi bilo da imaš neki editor za otvaranje takvih fajlova kao što je notepad++ ili Atom
Ja  npr. koristim Sublime Text. No za kopiranje ti je dosta i običan notepad.

Updejtano nedavno:
(https://img.shields.io/badge/Subtitle%20Edit%20OCR-HR%200.5-7851A9.svg) (http://git.io/vtMyW)
Naslov: Odg: Hrvatska OCR skripta za Subtitle Edit
Autor: alfred - 27.08.2015. 16:17:57
Kad sam napisao text onda sam i skužio da bi ga mogao otvoriti i kao najobičniji text i prekopirati.
Hvala enivej
Naslov: Odg: Hrvatska OCR skripta za Subtitle Edit
Autor: ameo - 09.11.2015. 11:16:33

Od izlaska 3.4.10 nakupilo se još nekoliko sitnica, pa tko koristi, neka si updejta  :u-lala
(https://img.shields.io/badge/Subtitle%20Edit%20OCR-HR%201.0-brightgreen.svg) (http://git.io/vtMyW)
Naslov: Odg: Hrvatska OCR skripta za Subtitle Edit
Autor: ameo - 06.08.2016. 22:06:41
Skripta e updejtana i optimizirana  - pokriva više riječi:

(https://img.shields.io/badge/Subtitle%20Edit%20OCR-1.5-f5fffa.png) (http://git.io/vtMyW)
Naslov: Odg: Hrvatska OCR skripta za Subtitle Edit
Autor: Zolala - 07.08.2016. 11:06:10
Ček bre, el neko plaćen za ovo dodavanje reči? Zanima me kako funkcioniše to

Inače oću smajlov  ovakav :volim samo umesto PO da bidne SE, pa da osnujemo sektu  :andjelak
Naslov: Odg: Hrvatska OCR skripta za Subtitle Edit
Autor: ameo - 18.12.2017. 20:33:10

(https://img.shields.io/badge/Subtitle%20Edit%20OCR-HR%202.0-a91717.svg) (http://git.io/vtMyW)


Skripta je obnovljena nedavno, obnavljam ju svaki mjesec u biti, ima sad već oko 2500 linija ispravaka, pa može preuzet tko želi. :u-lala
Odlučio sam ne gnjaviti previše, pa evo, ovo je ovogodišnji post za ovu temu. Pa tko želi neka preuzme.


I ne, nitko nije plaćen za to.