Autor Tema: OCR skripta za SW  (Posjeta: 306658 )

0 članova i 1 Gost pregledava ovu temu.

Offline MilanRS

  • ...
  • Administrator
  • Izuzetak
  • *****
  • Postova: 10706
  • Spol: Muški
Odg: OCR skripta za SW
« Odgovor #270 : 11.02.2013. 16:48:21 »
U drugom postu ove teme nalazi se link za preuzimanje skripte MilanRS3. To je najnovija verzija, tj. preimenovao sam MilanRS2 u MilanRS3 zbog velike pauze od posljednjeg ažuriranja i većeg broja izmjena. Ako neko ne bude zadovoljan novom skriptom, uvijek može ponovo skinuti staru i/ili javiti se na PM i reći utiske i prijedloge.

Offline MilanRS

  • ...
  • Administrator
  • Izuzetak
  • *****
  • Postova: 10706
  • Spol: Muški
Odg: OCR skripta za SW
« Odgovor #271 : 31.03.2013. 15:36:24 »
Ako želite da aktivirate uklanjanje ... na početku rečenice,
otvorite skriptu MilanRS3 u Notepadu (ili Notepad++) pa na kraju skripte izbrišite ove znakove koji isključuju liniju.





Poslije toga će izgledati ovako:
<!-- Kad red počinje sa ...pa malo slovo -->
   <ERROR Find="^(\.\.\.)[a-zšđčćž\x22\x3C]" ReplaceBy="">

Offline Veleno

  • Ex prevoditelj
  • Heroj član
  • ***
  • Postova: 4750
Odg: OCR skripta za SW
« Odgovor #272 : 31.03.2013. 20:42:21 »
Hvala, Milane.  smileyNO1

Offline HeadBurn3r.

  • Prevoditelj extra
  • Senior član
  • *****
  • Postova: 1691
  • Spol: Muški
Odg: OCR skripta za SW
« Odgovor #273 : 15.08.2013. 16:06:46 »
Postavim MilanRS2 skriptu u C:\Program Files\Urusoft\Subtitle Workshop\OCRScripts, ali ne mogu da je izaberem u SW-u.  :-\ Šta li bi to moglo biti?

« Zadnja izmjena: 15.08.2013. 18:16:58 HeadBurn3r. »

Offline MilanRS

  • ...
  • Administrator
  • Izuzetak
  • *****
  • Postova: 10706
  • Spol: Muški
Odg: OCR skripta za SW
« Odgovor #274 : 20.08.2013. 19:59:07 »
Ili ti pokreće SW iz Program Files (x86) a ovo je u onom drugom ili nisi restartovao SW po ubacivanju skripte u folder.

Offline suadnovic

  • Član
  • ***
  • Postova: 862
Odg: OCR skripta za SW
« Odgovor #275 : 09.09.2013. 11:56:22 »
Pozdrav za vredne momke. Mene interesuje mogućnost pravljenja skripte koja bi uklonila sledeću anomaliju(e) u titlovima:
Često puta druga linija prevoda počinje velikim slovom, iako se u prvoj liniji rečenica nije završila, tj. nema tačke na kraju.
Takođe, često sam nailazio na grešku da nakon tačke, tj. kraja rečenice, naredna rečenica počinje malim slovom.

Dakle, može li se napisati skripta koja bi uklonila odjednom ove dve anomalije, i slične, ako usput još nešto nekome padne na pamet?
« Zadnja izmjena: 09.09.2013. 13:16:16 suadnovic »

Offline MilanRS

  • ...
  • Administrator
  • Izuzetak
  • *****
  • Postova: 10706
  • Spol: Muški
Odg: OCR skripta za SW
« Odgovor #276 : 09.09.2013. 12:30:12 »
1
Dobro došli, gospodine Andriću.
Da li imate problema sa

2
Stojanovićem
iz Duge Njive?

I ovdje bi trebalo da "s" bude malo?


1
Šta rekoste? -Pom. načelnika policije.

Ovdje bi trebalo da bude veliko "n"?

Ovi izuzeci onemogućavaju automatsko mijenjanje.
Ostaje samo da homo sapiens čita i odluči da li treba da se mijenja ili ne.

Offline suadnovic

  • Član
  • ***
  • Postova: 862
Odg: OCR skripta za SW
« Odgovor #277 : 09.09.2013. 13:23:57 »
@MilanRS
Ja za editovanje titla često koristim EmEditor, i tu postoje mogućnosti pravljenja makroa, što iskreno verujem da bi moglo biti rešenje ovog "mog problema". Probaću da kontaktiram autora aplikacije, da vidim može li se šta uraditi. Naravno, bićete obavešteni. No, Milanov odgovor me je pomalo razočarao, bio sam ubeđen da se takva skripta može naparaviti. Nisam vičan tome, ali u toj skripti bi trebali da se koriste logički operatori, te sve što ona treba da pita za liniju titla, jeste: ima li tačku na kraju i počinje li naredna linija velikim slovom. Prosto mi je neverovatno da se to ne može uraditi.
« Zadnja izmjena: 09.09.2013. 13:26:34 suadnovic »

Offline MilanRS

  • ...
  • Administrator
  • Izuzetak
  • *****
  • Postova: 10706
  • Spol: Muški
Odg: OCR skripta za SW
« Odgovor #278 : 09.09.2013. 13:40:01 »
te sve što ona treba da pita za liniju titla, jeste: ima li tačku na kraju i počinje li naredna linija velikim slovom. Prosto mi je neverovatno da se to ne može uraditi.

Kažem da se to može uraditi ali šta ćeš u slučaju da ima tačku na kraju a naredna linija ne počinje velikim slovom jer NE TREBA da počinje velikim slovom? (Kao što je navedeno u primjeru iznad)
Ako izmijeni, od ispravnog dobićemo pogrešno.

Offline suadnovic

  • Član
  • ***
  • Postova: 862
Odg: OCR skripta za SW
« Odgovor #279 : 09.09.2013. 15:01:41 »
Oprosti Milane, opet mi nije baš najjasnije. To je algoritam sa dva slučaja, u zavisnosti od toga ima li prva linija tačku na kraju ili ne. Oba ta slučaja bi trebala imati dva podslučaja, u zavisnosti od toga kako počinje naredna linija, malim ili velikim slovom. Uz još jedno izvinjenje da sam možda uporan, a ne znam prave mogućnosti jezika za pisanje scripte. Teoretski gledano, jedna skripta bi bila dovoljna za oba moja problema. :ceska:
« Zadnja izmjena: 09.09.2013. 15:07:50 suadnovic »

Offline MilanRS

  • ...
  • Administrator
  • Izuzetak
  • *****
  • Postova: 10706
  • Spol: Muški
Odg: OCR skripta za SW
« Odgovor #280 : 09.09.2013. 16:13:25 »
Hajde da pokušamo raščlaniti problem.

Znači, ako prva linija ima tačku na kraju
a druga počinje malim slovom,
treba da to početno malo slovo uvijek prebaci u veliko?

Offline suadnovic

  • Član
  • ***
  • Postova: 862
Odg: OCR skripta za SW
« Odgovor #281 : 09.09.2013. 17:02:57 »
Tako je, ako se prva linija završava tačkom, ako je prvo slovo u narednoj liniji malo, menja ga u veliko, u suprotnom ostavlja titl kakav jeste. Pod uslovom naravno da jezik razlikuje malo od velikog slova.
Ako se ne završava tačkom, onda opet gleda prvo početno slovo narednog reda, pa ako je malo, ne dira ga, a ako je veliko, pretvara ga u malo.
Stim, što tu mogu da zasmetaju crtice u drugoj liniji titla, no valjda skripra može nju da ignoriše, tj. ako je prvi karakter - da nju ignoriše i pređe na naredni simbol, ignorišući i prazan prostor po potrebi.
Loše vesti sa http://www.emeditor.com, sele se tako da na eventualni makro treba pričekati. Uzgred, ljudi bi mislim trebali da probaju EmEditor, sjajan program, da ja sad tu ne glumim reklamnog agenta. Može se skinuti zadnja verzija 13.0.4  torrentom, recimo.
« Zadnja izmjena: 09.09.2013. 17:04:37 suadnovic »

Offline PO team

  • PO fan
  • Novi član
  • *
  • Postova: 0
  • Spol: Muški
  • Volim PO
    • let's chat
Odg: OCR skripta za SW
« Odgovor #282 : 09.09.2013. 17:18:15 »
Mislim da ti je MilanRS objasnio, ali evo dva moja primjera


Dobar dan, je li tu g.
novinar Suad Nović? Moram razgovarati s njim.





Halo. Jesam li dobila
Suada Novića?



Iz ova dva primjera ti je jasno zašto ta skripta nema smisla.
Mrzim lopatare i limune

Offline MilanRS

  • ...
  • Administrator
  • Izuzetak
  • *****
  • Postova: 10706
  • Spol: Muški
Odg: OCR skripta za SW
« Odgovor #283 : 09.09.2013. 17:23:44 »
Evo i realnih primjera na koje bi se taj algoritam primijenio.
Serija: Closer S04E02.

183
00:16:51,860 --> 00:16:55,614
Ovo je njezin šef. Pom.
nač. Will Pope. -Drago mi je.

313
00:27:56,406 --> 00:28:00,661
Naš je odvjetnik zvao pom.
nač. Popea! On nije izdao nalog!

Šta bi se desilo kad bi taj algoritam naišao na ovo u titlu?

Offline suadnovic

  • Član
  • ***
  • Postova: 862
Odg: OCR skripta za SW
« Odgovor #284 : 09.09.2013. 17:54:44 »
Momci, svi ste u pravu, no morate priznati da to nisu tako česte situacije, a odavno sam naučio da kod svakog titla konačna obrada mora biti ručna. U najgorem slučaju, takvih situacija ne može biti više no u desetak redova (da ne preterah sa optimizmom). Takva skripta bila bi korisna ako naletite na titlove na nekom "egzotičnom jeziku", te ste prisiljeni koristiti prevodioca, poput Google translate, koji upravo pravi gornje anomalije, i to u svakom redu titla. Evo ja priznah da mi je motivacija za takvu skriptu vrlo lična, no osnovno pitanje ostaje: MOŽE LI SE ONA NAPRAVITI?
@LemonzOO
Tvoje se lako popravlja: U SW treba sa Search + replase, zameniti g. sa gdin, pre primene "NAŠE SKRIPTE", dok je situacija

Halo. Jesam li dobila
Suada Novića? (Otkud znaš kako se zovem?)

stvarno izuzetno retka, u svakom slučaju, pre primene skripte, treba pregledati titl.

A Search + replase bi rešio i Milanov primer, uz rizik da red bude predugačak.

Priča se vrti oko skripti, tako da nije zgore priupitati i ovo: RemoveFirstDash odlično radi svoj posao, ali samo ukoliko linija titla nije u italiku. Sa italikom je nemoćna. Može li se tu nešto popraviti kod nje?
« Zadnja izmjena: 09.09.2013. 18:14:58 suadnovic »

Offline igniss

  • E=hν
  • Prevoditelj extra
  • Heroj član
  • *****
  • Postova: 2359
  • Spol: Muški
  • This is where we fight! This is where they die!
Odg: OCR skripta za SW
« Odgovor #285 : 09.09.2013. 20:42:23 »
Da li vama radi Mr. -> g.? Meni ne.
Going to church makes you a Christian as much as going to the garage makes you a car.

Offline MilanRS

  • ...
  • Administrator
  • Izuzetak
  • *****
  • Postova: 10706
  • Spol: Muški
Odg: OCR skripta za SW
« Odgovor #286 : 09.09.2013. 21:10:37 »
Ne radi nikome jer to takođe nije sigurno uvijek pa ne može biti aktivno.
Nalazi se zakomentarisano. Otvori u Notepad++ ili običnom pa nađi sljedeće i ukloni oznake za komentar.


Ali ovo radi samo ako je ispred Mr tačka pa razmak. I opet se ne zna da li treba veliko ili malo g.
Zato bi trebalo da se ide od greške do greške i provjeri.

Ako hoćeš da ti pronalazi sve Mr., dodaj ovu liniju ispod posljednje od tih koje su isključene.
<ERROR Find=" Mr\. " ReplaceBy="g. ">

P.S. Sad vidim da je ovo gore što je isključeno zapravo neispravno. Promakla mi je tačka bez obrnute kose crte.
Treba dodati \ ispred tačke.
( Mr\. )
( Mrs\. )
( Mrs\. )

Offline igniss

  • E=hν
  • Prevoditelj extra
  • Heroj član
  • *****
  • Postova: 2359
  • Spol: Muški
  • This is where we fight! This is where they die!
Odg: OCR skripta za SW
« Odgovor #287 : 09.09.2013. 22:13:12 »
Ma uradio sam sve to i pre nego što sam postavio pitanje, ali mi ništa ne radi. Mr. Bamble ne postaje g. Bamble, iako lepo stoji
<ERROR Find="( Mr\.) " ReplaceBy="g. ">

EDIT:
Rešeno! Iako sam podesio da SW radi sa izmenjenom skriptom MilanRS3, pri ponovnom pokretanju mi je vratio MilanRS2, pa se zbog toga ništa nije dešavalo.
« Zadnja izmjena: 09.09.2013. 22:22:33 igniss »
Going to church makes you a Christian as much as going to the garage makes you a car.

Offline suadnovic

  • Član
  • ***
  • Postova: 862
Odg: OCR skripta za SW
« Odgovor #288 : 30.09.2013. 18:32:03 »
Kod adaptacije titla sa hrvatskog na srpski, najdosadniji deo posla mi je da ispravljam stvari poput ovih:
vrijeme--->vreme
počet ću --->  počeću
primit ću --->  primiću
uopšte, želeo bih skriptu koja bi
it će, at će, et će, ut će  prevodila redom u iće, aće, eće, uće
i pritom nezavisno od dužine prve reči
(valjda se mogu koristiti neki džokeri, da sad ne lupim nešto, valjda bi to trebalo da bude nešto poput
*it će, *at će, *et će, *ut će ---> *iće, *aće, *eće, *uće
a ono gore
*ije*--->*e*

Zamolih danas Milana, valjda će i on nešto uraditi. Mislim da ovo nije nikakav problem.
Ima tu i nekih problema,
 sa ijekavicom,
doživjet će ---> doživeće
(ovo je ako se dobro sećam,neka palatalizacija)
srest ću ---> srešću
a biće ih sigurno još, te bi i o tome trebalo povesti računa.

« Zadnja izmjena: 03.10.2013. 23:47:18 suadnovic »

Offline donrile86

  • Novi član
  • *
  • Postova: 44
  • Spol: Muški
  • Don
Odg: OCR skripta za SW
« Odgovor #289 : 02.10.2013. 12:23:56 »
Jedno kratko pitanje.
Iz ne znam kog razloga sam obrisao sve skripte iz foldera "OCRScripts" i "PascalScripts" ukljucujuci i one default koje vec postoje nakon instalacije SW-a. Lako cu da vratim sve "ove vase", ali interesuje me da li one default skripte imaju neku bitnu ulogu, tj da li mi trebaju ili ne? I kako ih, eventualno, vratiti?


Hvala svima.
Don Rile

Offline igor_MD

  • Prevoditelj extra
  • Mlađi član
  • *****
  • Postova: 376
  • Spol: Muški
Odg: OCR skripta za SW
« Odgovor #290 : 02.10.2013. 12:36:04 »
Ne trebaju. No te preocupes.

Namjesti sve ko šta na sajtu piše i vrati MilanRS3, CPS_petko, CPS-fix i Gap.
Ama ništa drugo ti ne treba.


(I guess  ;D)

Offline donrile86

  • Novi član
  • *
  • Postova: 44
  • Spol: Muški
  • Don
Odg: OCR skripta za SW
« Odgovor #291 : 02.10.2013. 12:37:18 »
Pretpostavljao sam da mi ne trebaju. Hvala puno.
Don Rile

Offline suadnovic

  • Član
  • ***
  • Postova: 862
Odg: OCR skripta za SW
« Odgovor #292 : 15.10.2013. 18:31:45 »
 U vezi onog mog posta malo više o zameni velikih i malih slova na početku druge linije titla, stvar se, kao što sam i pretpostavljao, može srediti EmEdior-om. Treba koristiti ovaj makro
http://www.emeditor.com/forums/topic/makro-for-subtitles/#post-17281
Testirao sam ga, radi savršeno.
Ako vas zanima šta se dešava, evo pogledajte na ovom primeru engleskog titla za film So This Is Christmas (2013)
http://www.mediafire.com/?25gpc1palhh5m6i
Propustite engleski titl kroz Automatskog prevodioca u SubtitleEdit-u, da dobijete "loš" prevod, a potom na njega primenite gornji makro. Rezultat je u drugom fajlu iz mediafire linka.
A ubeđen sam da bi se mogao napraviti i ekvivalent za Milanovu skriptu. Stvar je  tome da makro, ako je dobro napisan, nikad neće da zezne, a nažalost OCR skripte, bar kod mene, nekad rade, nekad ne rade, a da pojma nemam zašto i šta se dešava. Mogu samo da se nerviram.
« Zadnja izmjena: 15.10.2013. 18:37:37 suadnovic »

Offline suadnovic

  • Član
  • ***
  • Postova: 862
Odg: OCR skripta za SW
« Odgovor #293 : 15.10.2013. 19:03:22 »
Skinite zip sa ovog linka, biće mnogo jasnije
http://www.sk.rs/forum/showthread.php?p=1807296#post1807296

Offline daxdavor

  • Ubojica sa šerajzlinom
  • PO moderator
  • Izuzetak
  • *****
  • Postova: 5753
  • Spol: Muški
  • Ni med cvetjem ni pravice
  • Google map koordinata: Moja lokacija
Odg: OCR skripta za SW
« Odgovor #294 : 03.07.2014. 22:14:12 »
Jel bi se mogla napraviti skripta koja bi produživala trajanje linija?
Znači, da produžuje na 2 sekunde  one linije koje prekratko traju, a ne mogu se spojiti s prethodnom ili sljedećom linijom.

The snooty, snotty, toity, hoity, farty, arty, decaffeinated, fruit-flavored tea-bag, semi-skimmed cream of Gasforth elite.

Offline PO team

  • PO fan
  • Novi član
  • *
  • Postova: 0
  • Spol: Muški
  • Volim PO
    • let's chat
Odg: OCR skripta za SW
« Odgovor #295 : 03.07.2014. 22:18:15 »
Ima to već.
CTRL+L



CTRL+SHIFT+Y
 


CPS-Fix (produžava sve linije koje može ako imaju cps slabiji od 15)

Podesi ovako.
Samo što poslije ovoga uvijek moraš upotrijebiti skriptu GAP radi razmaka.
« Zadnja izmjena: 03.07.2014. 22:20:21 LemonzOO »
Mrzim lopatare i limune

Offline daxdavor

  • Ubojica sa šerajzlinom
  • PO moderator
  • Izuzetak
  • *****
  • Postova: 5753
  • Spol: Muški
  • Ni med cvetjem ni pravice
  • Google map koordinata: Moja lokacija
Odg: OCR skripta za SW
« Odgovor #296 : 03.07.2014. 23:21:02 »
Cpsfix/gap koristim redovno.
Ovo ctrl+L je to upravo ono što trebam. Hvala. smileyNO1

The snooty, snotty, toity, hoity, farty, arty, decaffeinated, fruit-flavored tea-bag, semi-skimmed cream of Gasforth elite.

Offline suadnovic

  • Član
  • ***
  • Postova: 862
Odg: OCR skripta za SW
« Odgovor #297 : 03.08.2014. 01:14:00 »
Interesuje me zašto SW ne pravi razmak svuda u titlu iza - ,iako je podešen za to.
Primer:
8
00:00:39,284 --> 00:00:42,215
Pitam se što bi tata
rekao na sve ovo. -Čudno.
Inače, pravi razmak iza -  u drugom dijalogu linije. Kako se ovo može popraviti?

Razlog je verovatno što bi se pokvarila vremena, pa bi ono gore izgledalo

8'
00:00:39,284 - - > 00:00:42,215
Pitam se što bi tata
rekao na sve ovo. - Čudno.

i titl ne bi bio valjan. Valjala bi neka skripta, koja ne bi dirala vremena.

« Zadnja izmjena: 02.09.2014. 09:17:52 suadnovic »

Offline petko

  • Shpadoinkle!
  • Administrator
  • Izuzetak
  • *****
  • Postova: 5321
  • Spol: Muški
  • Ako kaniš pobijediti, ne smiješ izgubiti.
Odg: OCR skripta za SW
« Odgovor #298 : 03.08.2014. 12:13:52 »
Ocr skripta u SW nema uticaja na linije sa tajmingom, nego samo na deo sa prevodom.




I refuse to prove that I exist, says God…
…for proof denies faith, and without faith I am nothing.
Douglas Adams
       

Offline suadnovic

  • Član
  • ***
  • Postova: 862
Odg: OCR skripta za SW
« Odgovor #299 : 03.08.2014. 12:17:42 »
Fino ako je tako, ali kako da se postigne razmak posle svake - ?