Autor Tema: Hrvatska OCR skripta za Subtitle Edit  (Posjeta: 4582 )

0 članova i 1 Gost pregledava ovu temu.

Offline ameo

  • Regularni forumaš
  • *
  • Postova: 93
  • Spol: Muški
  • I can't count the reasons I should stay.
Hrvatska OCR skripta za Subtitle Edit
« : 22.07.2015. 12:22:48 »


Lijep pozdrav svim prevoditeljima.
Od danas (22.7.2015.) sa novijom (3.4.7.) verzijom programa Subtitle Edit dolaze dvije skripte.
I u tome je značajna promjena za hrvatsko/srpsko područje (tržište  :P)

Sa prvom su neki od vas već jako dobro upoznati, i to je Milanova OCR skripta koja
popravlja greške u srpskom i hrvatskom jeziku, a koja je do sad bila dostupna samo za Subtitle Workshop.

No sada je naravno dostupna i od ove verzije programa SE - tj. ugrađena je u njega.
Ona je ugrađena u obje verzije, hrvatsku i srpsku, pošto je univerzalna.

No, što se tiče ispravljanja riječi ona je tek mali dio svega ovog.

Pomoću moćnih regularnih izraza, skripta nalazi i mijenja sve padeže/konjugacije uključenih riječi.

No, ona je specifično hrvatska, i ne služi samo mijenjanju hrvatskih riječi, nego i srpskih, i kao takva ne može se koristiti u srpskom jeziku - očito.
To je jedna od glavnijih uključenih značajki, koje sam želio postići - lakše konvertiranje srpskih titlova u hrvatske.

tako npr. lečenje i lječenje - dvije pogrešno napisane riječi - postaju liječenje [bilo da su pisane velikim ili malim slovima.

<RegEx find="([lL])j?ečenj(a|e|u|em|ima)" replaceWith="$1iječenj$2" />

Od vas se traži
1. dobra volja u prijavljivanju svih mogućih pogrešaka koje se mogu desiti pri njenom korištenju,
a nesumnjivo je da će ih biti, pošto je ovo tek prva verzija.


2. ovisno o broju linija, malo strpljenja dok skripta prođe kroz cijeli titl i prepravi sve.
Najčešće minuta/minuta i po, no ovisi i o brzini vašeg računala.

Naravno, ako ste super prevoditelj, na kraju sve pregledavate kroz Hascheck (hrvatski akademski spelling checker)
kao i obično, da vidite što gdje fali i što ste zaboravili.

Mislim da je to sve za sada.
Mogao bih staviti i paypal donate button, ako tko želi donirati za nemalo utrošeno vrijeme, no možda i ne.

Greške možete prijavljivati preko privatne poruke ili ovdje ako vam se baš da.
Ako ste kojim slučajem na githubu, možete i preko Gittera
Kako vam god odgovara

Subtitle Edit možete preuzeti|skinuti|downloadati ovdje:  :ono-kao


Živili!  :volim


p.s. kako će skripta biti nadograđivana, i obnavljana ne morate čekati sljedeću verziju SE, nego možete otići na link sa sličice, kliknuti na Raw i prekopirati u svoju verziju na kompu. Do nje možete doći preko Spell Check menua - Get Dictionaries - Open Dictionaries Folder - hrv_OCRFixReplaceList.xml
« Zadnja izmjena: 20.08.2015. 00:38:58 ameo »
⋆"Preklinjem te pet kuna, bako!
- Ma tko te rodi pohlepnog tako?"⋆



:volim
Titlovi se nisu postavili

Offline MilanRS

  • ...
  • Administrator
  • Izuzetak
  • *****
  • Postova: 10669
  • Spol: Muški
Odg: Hrvatska OCR skripta za Subtitle Edit
« Odgovor #1 : 22.07.2015. 12:32:01 »
Svaka čast za implementaciju skripte.

Što se tiče ovog drugog - prebacivanja sa jednog jezika na drugi - tu sam veliki protivnik. Nemoguće je da program savršeno uradi, čak je nemoguće tako nešto i da se napravi. Može djelimično, ali onda se dobije nešto što nije ni srpski ni hrvatski, pa je veća šteta od koristi. I takve prevode ne prihvatamo.
Npr.
Lijepo je imati veliku obitelj. Obitelj. Bez obitelji.
Porodicu. Porodica. Porodice.

Sigurno postoji sličan slučaj i za prebacivanje sa srpskog na hrvatski.
Prije 6-7 godina sam pokušao da napravim takvu skriptu i odustao.
A titl biram po kvalitetu prevoda, nebitno da li je prevod na srpski ili hrvatski.
... -> Better Call Saul s2 -> Billions s3 -> Bosch s2 -> Westworld s2 -> The Mick s2 -> The Crossing s1 -> The Affair s4 -> Sharp Objects -> You're the Worst s4 -> Silicon Valley s4 -> Luther s5 -> trenutno: CSI: CSI s13 / Cuckoo s1 / The Comeback s1 / Northern Exposure s1 / Criminal Minds s11 / Quantico s2 / The Simpsons s29 / Veep s5 / Gomorra s2 / Peaky Blinders s4 -> Fargo s3 -> Billions s4



#sfns

Offline ameo

  • Regularni forumaš
  • *
  • Postova: 93
  • Spol: Muški
  • I can't count the reasons I should stay.
Odg: Hrvatska OCR skripta za Subtitle Edit
« Odgovor #2 : 22.07.2015. 16:08:11 »
Nemoguće je da program savršeno uradi, čak je nemoguće tako nešto i da se napravi.
Može djelimično, ali onda se dobije nešto što nije ni srpski ni hrvatski, pa je veća šteta od koristi. I takve prevode ne prihvatamo.
Npr.
Lijepo je imati veliku obitelj. Obitelj. Bez obitelji.
Porodicu. Porodica. Porodice.



evo primjer kako se skripta nosi s tim:


    <Word from="porodica" to="obitelj" />    <Word from="porodice" to="obitelji" />    <Word from="porodici" to="obitelji" />    <Word from="porodicu" to="obitelj" />


Znači, nije sve u regexu, koji jest da svašta može, no ovakve iznimke mogu se pisati izvan regexa u listu riječi, i sve će biti dobro.
Istina, trenutno nema verzije za velika slova, no sve se može nadodati.


Potpuno se slažem da skripta nije svemoćna i da na kraju krajeva prevoditelji i obrađivači moraju gledati što rade,
jer ne može skripta promijeniti sve fraze i način govora koji se razlikuje u srpskom i hrvatskom.


Ona je pomoćno sredstvo i po meni, ako netko želi nešto obraditi sa srpskog na hrvatski, prvo ode i klikne na nju,
ona mu promijeni mnoštvo riječi, zatim gleda gdje se dalje treba prepravljati. I na kraju svega - Hascheck.


znači [sa srpskog na hrvatski] a -> b -> c   skripta -> čovjek - > provjera kroz Hascheck


provjera hrvatskih titlova: čovjek -> skripta -> provjera kroz Hascheck.




p.s. ako je nekom dovoljna samo Milanova, može samo izabrati verziju za srpski jezik i naći će ju tamo u cijelosti.
(pošto je, kako već rekoh, a znam jer mi je rekao - univerzalna).

« Zadnja izmjena: 24.07.2015. 11:05:15 ameo »
⋆"Preklinjem te pet kuna, bako!
- Ma tko te rodi pohlepnog tako?"⋆



:volim
Titlovi se nisu postavili

Offline ameo

  • Regularni forumaš
  • *
  • Postova: 93
  • Spol: Muški
  • I can't count the reasons I should stay.
Odg: Hrvatska OCR skripta za Subtitle Edit
« Odgovor #3 : 01.08.2015. 13:49:51 »
Updejtano, ako je koga briga, tj. ako itko odavde koristi ovo:


⋆"Preklinjem te pet kuna, bako!
- Ma tko te rodi pohlepnog tako?"⋆



:volim
Titlovi se nisu postavili

Offline skalice.united

  • Član plus
  • Senior član
  • ***
  • Postova: 1157
Odg: Hrvatska OCR skripta za Subtitle Edit
« Odgovor #4 : 01.08.2015. 14:42:20 »
Updejtano, ako je koga briga, tj. ako itko odavde koristi ovo:




kako da pokrenem skriptu u programu i provjerim pravopis

Offline ameo

  • Regularni forumaš
  • *
  • Postova: 93
  • Spol: Muški
  • I can't count the reasons I should stay.
Odg: Hrvatska OCR skripta za Subtitle Edit
« Odgovor #5 : 01.08.2015. 17:09:37 »
Subtitle Edit ima gumb [ikonu], ne znam da li se automatski pojavljuje ili ne - uglavnom može se u postavkama namjestiti:


Zove se Fix Common Errors [Popravi Uobičajene Pogreške].
Klikneš na njega, odabereš hr i Next [Naprijed]


Prvo ti izlista ispravke, potom klikneš na [Apply Selected Fixes] Primijeni ispravke  i OK.



⋆"Preklinjem te pet kuna, bako!
- Ma tko te rodi pohlepnog tako?"⋆



:volim
Titlovi se nisu postavili

Offline suadnovic

  • Član
  • ***
  • Postova: 755
Odg: Hrvatska OCR skripta za Subtitle Edit
« Odgovor #6 : 26.08.2015. 19:08:39 »
Ne znam je li šta popravljano, evo nekih mojih ispravki za srpski

https://www.mediafire.com/?183s31kcae5wqm5

Offline alfred

  • Mlađi član
  • **
  • Postova: 105
  • Spol: Muški
  • series rules
Odg: Hrvatska OCR skripta za Subtitle Edit
« Odgovor #7 : 27.08.2015. 11:31:08 »
Malo pitanje.
Kako iskopirati tu listu ,pokušavam ali ne ide.Stisnem raw kako je rečeno zaplavim text nađem onu datoteku u programu a kada se otvori ,otvori mi je u IE i ne da mi zalijepiti.
Hvala unaprijed

P.S. namješteno je da se otvara sa XML editorom

Offline ameo

  • Regularni forumaš
  • *
  • Postova: 93
  • Spol: Muški
  • I can't count the reasons I should stay.
Odg: Hrvatska OCR skripta za Subtitle Edit
« Odgovor #8 : 27.08.2015. 15:35:28 »
Kad taj fajl lociraš u Dictionaries folderu klikni na njega desnim klikom i Open with - Notepad [npr.]


Idealno bi bilo da imaš neki editor za otvaranje takvih fajlova kao što je notepad++ ili Atom
Ja  npr. koristim Sublime Text. No za kopiranje ti je dosta i običan notepad.

Updejtano nedavno:
« Zadnja izmjena: 27.08.2015. 15:37:53 ameo »
⋆"Preklinjem te pet kuna, bako!
- Ma tko te rodi pohlepnog tako?"⋆



:volim
Titlovi se nisu postavili

Offline alfred

  • Mlađi član
  • **
  • Postova: 105
  • Spol: Muški
  • series rules
Odg: Hrvatska OCR skripta za Subtitle Edit
« Odgovor #9 : 27.08.2015. 16:17:57 »
Kad sam napisao text onda sam i skužio da bi ga mogao otvoriti i kao najobičniji text i prekopirati.
Hvala enivej

Offline ameo

  • Regularni forumaš
  • *
  • Postova: 93
  • Spol: Muški
  • I can't count the reasons I should stay.
Odg: Hrvatska OCR skripta za Subtitle Edit
« Odgovor #10 : 09.11.2015. 11:16:33 »

Od izlaska 3.4.10 nakupilo se još nekoliko sitnica, pa tko koristi, neka si updejta  :u-lala
⋆"Preklinjem te pet kuna, bako!
- Ma tko te rodi pohlepnog tako?"⋆



:volim
Titlovi se nisu postavili

Offline ameo

  • Regularni forumaš
  • *
  • Postova: 93
  • Spol: Muški
  • I can't count the reasons I should stay.
Odg: Hrvatska OCR skripta za Subtitle Edit
« Odgovor #11 : 06.08.2016. 22:06:41 »
Skripta e updejtana i optimizirana  - pokriva više riječi:

⋆"Preklinjem te pet kuna, bako!
- Ma tko te rodi pohlepnog tako?"⋆



:volim
Titlovi se nisu postavili

Offline Zolala

  • Prevoditelj početnik
  • Član
  • ***
  • Postova: 112
  • Spol: Muški
    • Artnit
Odg: Hrvatska OCR skripta za Subtitle Edit
« Odgovor #12 : 07.08.2016. 11:06:10 »
Ček bre, el neko plaćen za ovo dodavanje reči? Zanima me kako funkcioniše to

Inače oću smajlov  ovakav :volim samo umesto PO da bidne SE, pa da osnujemo sektu  :andjelak

Offline ameo

  • Regularni forumaš
  • *
  • Postova: 93
  • Spol: Muški
  • I can't count the reasons I should stay.
Odg: Hrvatska OCR skripta za Subtitle Edit
« Odgovor #13 : 18.12.2017. 20:33:10 »




Skripta je obnovljena nedavno, obnavljam ju svaki mjesec u biti, ima sad već oko 2500 linija ispravaka, pa može preuzet tko želi. :u-lala
Odlučio sam ne gnjaviti previše, pa evo, ovo je ovogodišnji post za ovu temu. Pa tko želi neka preuzme.


I ne, nitko nije plaćen za to.
⋆"Preklinjem te pet kuna, bako!
- Ma tko te rodi pohlepnog tako?"⋆



:volim
Titlovi se nisu postavili