Autor Tema: OCR skripta za SW  (Posjeta: 178571 )

0 članova i 3 gostiju pregledava ovu temu.

Offline Shomac

  • Novi član
  • *
  • Postova: 5
Odg: OCR skripta za SW
« Odgovor #90 : 17.02.2009. 23:36:58 »
@pejafor3 Jbt koji si ti lik. Lijepo zamolim za pomoc a ti se pravis pametan i GALAMIS na ljude sto nije lijepo.
Ja nisam htio skriptu koju cu koristiti za sve prevode nego samo za one u kojima primjetim da ima ovakvih gresaka. Pascal funkcije ne trebaju meni nego jednom liku na drugom forumu pa sam mislio da bi mogao neko da mi pomogne oko toga jer ih na sajtu URUsofta nisam nasao.

U pravu si stace nam pascal ili ocr skripte lakse je bez njih  ;D

Hvala na pomoci.

PS. Izvinjavam se ako sam spamovao temu mozete slobodno da obrisete moje postove.

Offline MilanRS

  • ...
  • Administrator
  • Izuzetak
  • *****
  • Postova: 10706
  • Spol: Muški
Odg: OCR skripta za SW
« Odgovor #91 : 19.02.2009. 23:07:13 »
Osvježio sam post br. 2 poslije skoro 10 mjeseci. Dodao sam linkove do skripte, da se ne mučite sa copy/paste pa snimanje kao UTF8, sad samo snimite skriptu u odgovarajući folder i uživate.

Offline Cata

  • Likušo!
  • Old staff
  • Heroj član
  • *****
  • Postova: 3356
  • Spol: Ženski
Odg: OCR skripta za SW
« Odgovor #92 : 19.02.2009. 23:24:31 »
Ma Milane, šta bi mi bez tebe!  ;D

U ime oca i sina i Sv. Googla. Enter
I love you, not for what you are,
but for what I am, when I am with you.

Offline kanda

  • Prevoditelj extra
  • Mlađi član
  • *****
  • Postova: 409
  • Spol: Muški
Odg: OCR skripta za SW
« Odgovor #93 : 19.02.2009. 23:36:43 »
Osvježio sam post br. 2 poslije skoro 10 mjeseci. Dodao sam linkove do skripte, da se ne mučite sa copy/paste pa snimanje kao UTF8, sad samo snimite skriptu u odgovarajući folder i uživate.

Ako se ne varam, oba linka su ti do iste skripte. Usput, puno hvala!  clapp clapp

Offline MilanRS

  • ...
  • Administrator
  • Izuzetak
  • *****
  • Postova: 10706
  • Spol: Muški
Odg: OCR skripta za SW
« Odgovor #94 : 19.02.2009. 23:45:04 »
Hvala na informaciji. Išao sam copy/paste pa zaboravio 1 zamijeniti sa 2.

Napomena: Koristite ovo na svoju odgovornost! (Da me neko poslije ne tuži ;D )

Offline Strider

  • Regularni forumaš
  • *
  • Postova: 50
  • Spol: Muški
    • Few little things...
Odg: OCR skripta za SW
« Odgovor #95 : 20.02.2009. 22:52:54 »
Milane, ovo je "perverzija" i nepotrebno. Pogledaj B3S SubTranslator. Ako ti treba iz HR u SR, promijeni rječnike. Puno, puno jednostavnije, brže i preciznije, nego da "bildaš" ispravke ovako u OCR skripti.
P.S. ...za modere... program je "džaba", free, besplatan, našeg čovika, tako da nije reklama ni link za neku "nepodopštinu"  ;)

Offline noodleshr

  • Novi član
  • *
  • Postova: 13
Odg: OCR skripta za SW
« Odgovor #96 : 01.03.2009. 19:46:09 »
Milane, ako želiš pomogni!

Koristim jednu super igračku za gledanje filmova, a zove se ICIDU Media player.
To je zapravo eksterni hard s media playerom i hrpetinu izlaza na poleđini (scart, hdmi, component, composite, s-video).
Čita srt i sub titlove, ali ne i ž,š,č,ć. Svaki titl moram prepravljati ručno (shift+f i replace).
Postoji li neka fora da ž,š,č,ć pretvorim u z,s,c a da ne moram utipkavati slovo po slovo?
Probao sam par ''finti'' poput find š,ž,č,ć replace with s, z,c,c, ali niš.
Btw, fala na trudu koji ulažeš u sve ovo, kao i ostala ekipa.

Offline MilanRS

  • ...
  • Administrator
  • Izuzetak
  • *****
  • Postova: 10706
  • Spol: Muški
Odg: OCR skripta za SW
« Odgovor #97 : 01.03.2009. 20:42:47 »
Otvori novi dokument u Notepad.
Ovo sve selektuj, pa Ctrl+C, pa u Notepad Ctrl+V.
Snimi kao neko_ime.ocr (ispod gdje piše Text Document prebaci na All Files)
Snimi u folder OCRScripts koji se nalazi na C: Program Files / URUSoft / Subtitle Workshop
Otvori SW, sa lijeve strane gdje piše default izaberi taj fajl koji si imenovao neko_ime.ocr i poslije toga pritisni F9 na tastaturi. Svi redovi sa šđčćž će da se zacrvene (od sramote ;D).
Pritisni F10. Poslije toga dosnimi izmjene i neće biti kvačica.

<!----------------------------------------------->
<!--     Subtitle Workshop OCR Script file     -->
<!-- ----------------------------------------- -->
<!--     Prilagodio i dodao nove opcije:       -->
<!--                  MilanRS                  -->
<!----------------------------------------------->

<SWOCR WordChars="abcčćdđefghijklmnopqrsštuvwxyžzABCČĆDEFGHIJKLMNOPQRSŠTUVWXYŽZ_">

<ERROR Find="(š)" ReplaceBy="s">
<ERROR Find="(Š)" ReplaceBy="S">
<ERROR Find="(č|ć)" ReplaceBy="c">
<ERROR Find="(Č|Ć)" ReplaceBy="C">
<ERROR Find="(ž)" ReplaceBy="z">
<ERROR Find="(Ž)" ReplaceBy="Z">
<ERROR Find="(đ)" ReplaceBy="dj">
<ERROR Find="(Đ)" ReplaceBy="Dj">

</SWOCR>

Offline magila

  • Prevoditelj
  • Regularni forumaš
  • ****
  • Postova: 66
  • Spol: Muški
Odg: OCR skripta za SW
« Odgovor #98 : 02.03.2009. 07:25:40 »
Milane, to je OK, ali me zanima, kako bi se taj OCR što briše foneme,
inaktivirao?
To jest, kako bi to radilo samo po potrebi.
Naime, ja u jednom trenutku takođe poskidam sve foneme, pa ih vraćam
tamo gde treba.(duža je priča zašto).

Offline noodleshr

  • Novi član
  • *
  • Postova: 13
Odg: OCR skripta za SW
« Odgovor #99 : 06.03.2009. 22:55:56 »
Otvori novi dokument u Notepad.
Ovo sve selektuj, pa Ctrl+C, pa u Notepad Ctrl+V.
Snimi kao neko_ime.ocr (ispod gdje piše Text Document prebaci na All Files)
Snimi u folder OCRScripts koji se nalazi na C: Program Files / URUSoft / Subtitle Workshop
Otvori SW, sa lijeve strane gdje piše default izaberi taj fajl koji si imenovao neko_ime.ocr i poslije toga pritisni F9 na tastaturi. Svi redovi sa šđčćž će da se zacrvene (od sramote ;D).
Pritisni F10. Poslije toga dosnimi izmjene i neće biti kvačica.

<!----------------------------------------------->
<!--     Subtitle Workshop OCR Script file     -->
<!-- ----------------------------------------- -->
<!--     Prilagodio i dodao nove opcije:       -->
<!--                  MilanRS                  -->
<!----------------------------------------------->

<SWOCR WordChars="abcčćdđefghijklmnopqrsštuvwxyžzABCČĆDEFGHIJKLMNOPQRSŠTUVWXYŽZ_">

<ERROR Find="(š)" ReplaceBy="s">
<ERROR Find="(Š)" ReplaceBy="S">
<ERROR Find="(č|ć)" ReplaceBy="c">
<ERROR Find="(Č|Ć)" ReplaceBy="C">
<ERROR Find="(ž)" ReplaceBy="z">
<ERROR Find="(Ž)" ReplaceBy="Z">
<ERROR Find="(đ)" ReplaceBy="dj">
<ERROR Find="(Đ)" ReplaceBy="Dj">

</SWOCR>

Dakle, Milane...svaka čast! Puno Ti hvala.

Offline MilanRS

  • ...
  • Administrator
  • Izuzetak
  • *****
  • Postova: 10706
  • Spol: Muški
Odg: OCR skripta za SW
« Odgovor #100 : 06.03.2009. 23:20:58 »
Ipak bih ti ja preporučio da probaš program AviAddXsubs, koristi se za dodavanje titla .avi snimku i onda plejeri mogu prikazati i šđčćž. Proces ubacivanja titla traje oko 2 minuta po epizodi i vrlo jednostavno je.
Ipak gledati bez kvačica nije ni približno isto doživljaju gledanja sa kvačicama.

Offline noodleshr

  • Novi član
  • *
  • Postova: 13
Odg: OCR skripta za SW
« Odgovor #101 : 14.03.2009. 20:02:08 »
Milane,
Isprobao sam program i jako sam zadovoljan. Moram još skužiti zašto mi na serijama titl baca malo u lijevo, no na filmovima je super.
Slažem se, s kvačicama je ipak bolji ugođaj. Hvala još jednom.

Offline MilanRS

  • ...
  • Administrator
  • Izuzetak
  • *****
  • Postova: 10706
  • Spol: Muški
Odg: OCR skripta za SW
« Odgovor #102 : 14.03.2009. 20:11:13 »
To je i meni bio problem tek kad sam počeo da koristim program.
Onda sam eksperimentisao sa pozicijom titla i mislim da sam dobro podesio.
Pogledaj na ovoj slici, podesi isto tako pa vidi da li je bolje.
Ako nije, vrati prvobitnu vrijednost.

Offline noodleshr

  • Novi član
  • *
  • Postova: 13
Odg: OCR skripta za SW
« Odgovor #103 : 19.03.2009. 21:51:49 »
Puno toga još ne znam, Milane. Problem sa tekstom bio je zbog 2. sezone Heroesa koja je ripana u bitrate-u 400 i nešto x 200 i nešto, a kad sam podesio to u Subtitle bitmap-u, nije se niš promijenilo. No povećavao sam vrijednosti vp-a i uspio. Sada je fakat gušt gledati.

Offline svetlanalane

  • Prevoditelj
  • Mlađi član
  • ****
  • Postova: 121
  • Spol: Ženski
    • Pravosudna mreza
Odg: OCR skripta za SW
« Odgovor #104 : 19.04.2009. 22:43:24 »
Ovih dana sam imala mnogo posla oko dodavanja kvačica na jednom filmu.
U SW sam morala da preskočim sve linije u kojima ima npr. i ć i č i c a tražila sam da promenim c u ć. Postoji li mogućnost da se nekako izdvoji svako c u tom redu (da bude bold ili crvene boje) i da se izabere koje će biti promenjeno u ć a koje neće?
Nisam sigurna da li sam baš jasno napisala šta želim.
Verujem da mnoge nervira kad nema kvačica u titlu i voljna sam da to ispravljam gde god nađem.

Offline Veleno

  • Ex prevoditelj
  • Heroj član
  • ***
  • Postova: 4750
Odg: OCR skripta za SW
« Odgovor #105 : 19.04.2009. 22:44:40 »
Nisam 100% siguran, ali mislim da nema. Teško.  :(

Offline MilanRS

  • ...
  • Administrator
  • Izuzetak
  • *****
  • Postova: 10706
  • Spol: Muški
Odg: OCR skripta za SW
« Odgovor #106 : 20.04.2009. 00:09:08 »
Spominjali su neki program yu titlovi ili tako nešto, koji nudi za svaku riječ da je zamijeni nekom drugom.
Pomoću OCR skripte je vrlo teško napraviti.

Offline kanda

  • Prevoditelj extra
  • Mlađi član
  • *****
  • Postova: 409
  • Spol: Muški
Odg: OCR skripta za SW
« Odgovor #107 : 20.04.2009. 00:13:31 »
To je program titlYU. On nudi za zamjenu za riječi koje ima u svojoj bazi, pa to nije 100%. Ja ga koristim za provjeru nakon svakog prijevoda. Uvijek mi nađe grešaka.

Offline svetlanalane

  • Prevoditelj
  • Mlađi član
  • ****
  • Postova: 121
  • Spol: Ženski
    • Pravosudna mreza
Odg: OCR skripta za SW
« Odgovor #108 : 20.04.2009. 00:35:35 »
Mogu li dobiti link za download titlYU?
A oči su mi bile uprene u Milana za OCR skriptu :\)

Offline MilanRS

  • ...
  • Administrator
  • Izuzetak
  • *****
  • Postova: 10706
  • Spol: Muški
Odg: OCR skripta za SW
« Odgovor #109 : 20.04.2009. 01:30:34 »
:)

Pokušao sam ja jednom davno da napravim skriptu koja bi popravljala riječi ali to može samo za neke slučajeve gdje se zna sigurno šta treba. Dobro dođe da skrati posao jer npr. " cu " prebaci u " ću " jer je to jedini mogući slučaj. Dok npr. "kuca" ne može jer ne znamo da li je "kuća" ili "kuca".
A to da se oboji slovo pa da biramo koje da zamijeni, to je van OCR mogućnosti :)

Offline magila

  • Prevoditelj
  • Regularni forumaš
  • ****
  • Postova: 66
  • Spol: Muški
Odg: OCR skripta za SW
« Odgovor #110 : 20.04.2009. 07:59:14 »
Probaj sa B3SSubTranslator.   http//mba.vozibrale.com
Nemoj da ovo shvate kao reklamu.

Offline svetlanalane

  • Prevoditelj
  • Mlađi član
  • ****
  • Postova: 121
  • Spol: Ženski
    • Pravosudna mreza
Odg: OCR skripta za SW
« Odgovor #111 : 20.04.2009. 11:08:41 »
Pa neka se i skrati posao, svako skraćenje je dobro. Samo ti Milane nama daj taj OCR. clapp Lako je posle ispraviti ručno manji deo.

Offline radrad

  • Stoka
  • Old staff
  • Heroj član
  • *****
  • Postova: 3094
  • Spol: Muški
Odg: OCR skripta za SW
« Odgovor #112 : 20.04.2009. 11:46:52 »
Probaj sa B3SSubTranslator.   http//mba.vozibrale.com

Kako to radi, sta to radi?

Offline Strider

  • Regularni forumaš
  • *
  • Postova: 50
  • Spol: Muški
    • Few little things...
Odg: OCR skripta za SW
« Odgovor #113 : 20.04.2009. 16:45:50 »
Evo, po 101. put da napišem šta je B3SSubtranslator... program koji je nastao na ideji SCGTitlovi... program koji prevodi SR titlove u HR (ili one za koje VI kreirate rječnike  clapp )
Ne prevodi SVE jer nema toliki rječnik, ne radi sve umjesto vas jer neke riječi treba provjeriti i sam... Da bi radio, trebate imati instaliran "Microsoft .Net Framework 2.0"

Ideja je da se prevode ispravni titlovi. Kako ispravan format .srt i .sub, tako i srpski titlovi koji su napisani književnim srpskim jezikom. Stoga, ubačene su riječi za ispravak, pod pretpostavkom da su napisane ispravno, npr. menica je ispravljena kao mjenica, a ne kao i moguća greška imenica, ili posedovali kao posjedovali, a ne kao posredovali.
Kako je dosta nepismenosti, uvedene su stavke "je->ije" i "ije->je". Ima mnogo grešaka pri pisanju, pa je uvedena "Typo" stavka, koju obvezno treba pregledati.

Isto tako, u "MultiValue" rječniku, mogu se odrediti uobičajene (default) vrijednosti. Vodilja je bila da je "default" vrijednost ona koja je češća. Ukoliko prevodite npr. SF film/seriju u kojoj je česta riječ "biće" (stvorenje) postavite je za "default" umjesto "bit će",
ili ako češće nailazite na besan kao bijesan, umjesto "besan - koji je bez sna"... odaberite sami. Isti je princip i ukoliko titlu nedostaju domaći fonemi: za riječ "braci" postavit ćete "default" riječ "braći" umjesto "braci" (hipokoristik od riječi brat).

U ovom rječniku se nalaze i poneki ispravci "Typo" grešaka za koje je bilo više mogućih ispravaka: npr. besmislenoh (besmisleno, besmislenih, besmislenog...).

KRATKE UPUTE ZA RAD S B3S SubTranslator-om

* Case sensitive - krivo sricane imenice ili napisane malim slovom, te rijetko, kratice kao ok-->OK
* Wrong Form - krivi rod te ili prethodne riječi
* OCR errors - greške nastale prilikom tzv. "rippanja" titla, kada je slovo "i" (bilo malo, bilo veliko) zamijenjeno slovom "l" i obratno
* Foreign words - strane, neprevodive riječi npr. "Mount Everest" ne može biti "Maunt Everest" kao ni "United"-->"Junajted", ili kad su obje riječi tuđice kao "šrapnel-->geler", ali je druga riječ prihvatljivija u hrvatskom jeziku
* Typo - krivo napisana riječ (po mogućnosti pregledati jer se može dogoditi više isto krivo napisanih riječi, ali drugačijeg značenja)
* missing Cro phonemes - nedostaju hrvatski fonemi, tj. slova č,ć,đ,š,ž (100% ispravno)
* wrong Cro phonemes - krivi hrvatski fonemi, tj. slova č,ć,đ,š,ž (100% ispravno)
* Apostrophe – krivo napisane riječi ili složenice s apostrofom
* Negation – negacija se piše odvojeno
* 1->2 – lako uočljiva razlika između Hrvatskog i Srpskog jezika, npr. "obavićemo"-->"obavit ćemo"
* je->ije – neki ljudi ne znaju kada treba napisati "ije"...
* ije->je – ...dok neki ljudi ne znaju pa još i pretjeruju!

* obvezno pregledati ispravljene riječi koje se nalaze pod sljedećim upozorenjima:
- Replaced/Wrong Form
u pitanju je obično krivi rod te ili prethodne riječi:
1. npr. "u prošlom deceniju"-->"u prošlom desetljeće" - treba promijeniti desetljeće-->desetljeću
2. npr. "u mojoj kancelariji"-->"u mojoj uredu" - dobro je ispravljeno kancelariji-->uredu, ali treba promijeniti mojoj-->mom
- Multi value
obvezno pregledati jer (kako i upozorenje kaže) postoji više značenja, npr:
Replaced:
1. "biće-->bit će" (npr. "bit će dobro", ali nerijetko se odnosi na neko živo stvorenje ili unutrašnju prirodu čovjeka npr. "to biće je bilo...")
2. "kuca-->kuća" (npr. "srce kuca", ali u većini slučajeva je u pitanju titl bez hrvatskih fonema pa je lakše vratiti 2-3 kuća u kuca, negoli 50ak nezamijenjenih kuca zamijeniti u kuća...)
Unreplaced:
1. "neko-->neko" (može biti i "netko" npr. "netko vrijedan", ali je u većini slučajeva "neko vrijeme" zbog čega je i ostavljeno nepromijenjeno)
2. "bili-->bili" (može biti više mogućnosti pa je stoga nepromijenjeno: bili ("bili smo"), bi li ("bi li vi htjeli") ili strano ime Billy (slučaj kod srpskih titlova, da se imena piše kako se izgovaraju, a ne kako se izvorno pišu).

Ako vam ne odgovara to što će prevoditi srpski u hrvatski, prepravite rječnike, ili izbrišite iz rječnika one riječi koje vam ne odgovaraju. Ostavite missing i wrong Cro phonemes da bi ispravilo "rijeci bez kvacica".

Nadam se da je ovo dovoljno pojašnjenje u svezi programa da biste ga počeli koristiti, a uz to još i:
1. besplatan je  8)
2. nećete gubiti živce "diveći" se nečijoj nepismenosti
3. nećete gubiti vrijeme pokušavajući dokučiti što je "pjesnik htio reći"... kuća ili kuca
4. nećete se osramotiti s vašim titlom, jer će popraviti greške koje su vam se "slučajno provukle"  :'(

Uff, autor programa će mi platit piće za ovo!!! A još mi je danas da' ver. 0.6.9.3 na beta testiranje...!

P.S. Pozdrav Magili! Kako napreduju tvoji rječnici (tj. rečnici)?!

Offline magila

  • Prevoditelj
  • Regularni forumaš
  • ****
  • Postova: 66
  • Spol: Muški
Odg: OCR skripta za SW
« Odgovor #114 : 21.04.2009. 15:42:02 »
Program je odličan, SAMO(!) još rečnik.
Ja ga još uvek pravim!

Offline Strider

  • Regularni forumaš
  • *
  • Postova: 50
  • Spol: Muški
    • Few little things...
Odg: OCR skripta za SW
« Odgovor #115 : 21.04.2009. 21:11:38 »
Program je odličan, SAMO(!) još rečnik.
Ja ga još uvek pravim!

SAMO(!)
bbq
Ajmeeeeee... sa srićon ti bilo, prika!!!
I podili ga s ekipom, bit će nam svima lakše. Možeš se javit i autoru da ga "izvisi" na stranicu, ako 'oćeš...

Offline MilanRS

  • ...
  • Administrator
  • Izuzetak
  • *****
  • Postova: 10706
  • Spol: Muški
Odg: OCR skripta za SW
« Odgovor #116 : 22.05.2009. 18:53:25 »
A oči su mi bile uprene u Milana za OCR skriptu :\)

Evo probaj ovo,
http://www.prijevodi-online.org/Tutorial/kvake.ocr
ali kad otvoriš titl u SW, lijevo izaberi "kvake", pritisni F9, klikni na prvi red, idi na F11, pogledaj da li je dobro zamijenio, ako jeste idi na F12 (prelazak na sljedeći red sa greškom), ako nije idi na Ctrl+Z (undo), pa F12 (sljedeća greška) pa F11 da je ispravi (pa provjeri da li je ispravio kako treba i tako redom.
Kad primijetiš da nešto ne ispravlja kako treba, zapiši na neki papir pa mi poslije pošalji da ispravim.
To važi za sve koji hoće da testiraju skriptu.
Ja je nisam puno koristio pa ne znam da li dobro radi i da li olakšava posao dodavanja kvačica.
Ima nekih drugih programa koje su drugi preporučivali, pa vidite šta bolje radi.

Offline magila

  • Prevoditelj
  • Regularni forumaš
  • ****
  • Postova: 66
  • Spol: Muški
Odg: OCR skripta za SW
« Odgovor #117 : 23.05.2009. 10:12:56 »
Milane care, ovo uopšte ne ispravlja kvake! Ni jednu jedinu.
Ispravlja one opšte greške, ali kvake - ne.
Tačno sam postupao po tvom uputstvu.

Offline magila

  • Prevoditelj
  • Regularni forumaš
  • ****
  • Postova: 66
  • Spol: Muški
Odg: OCR skripta za SW
« Odgovor #118 : 23.05.2009. 10:32:59 »
Preciznije: ispravlja samo ono što je konstatovao kao grešku.
(A nedostajuće kvake uopšte ne konstatuje!).
Čak ni te ocr greške, koje inače ispravlja u linijama koje  je markirao,
ne ispravlja u ostatku teksta. Iako su greške istovetne!

Offline svetlanalane

  • Prevoditelj
  • Mlađi član
  • ****
  • Postova: 121
  • Spol: Ženski
    • Pravosudna mreza
Odg: OCR skripta za SW
« Odgovor #119 : 23.05.2009. 12:16:49 »
Da, ne ispravlja kvačice, provereno, ni ostale greške, kao što reče magila.
Pravim spisak reči koje još treba uneti u skriptu, pa ću poslati kad se nakupi još.