Autor Tema: OCR skripta za SW  (Posjeta: 102216 )

0 članova i 1 Gost pregledava ovu temu.

Offline ptomic

  • Regularni forumaš
  • *
  • Postova: 21
  • Spol: Muški
Odg: OCR skripta za SW
« Odgovor #30 : 27.06.2008. 22:33:30 »
2 pitanja:

1.) Da li sve ove skripte mogu da spakujem u jedan fajl i da ga ucitam u OCR Scripts, gde mi trenutno iz nekog razloga stoji Espanol ?
2.) Da li seneko seca, bio je link sa OCR skriptom za SW za CRO koji ispravlja gomilu stvari, secam se da je na tom linku bio i software za ispravljanje iz SRB->CRO ?

U slucaju da mi odgovori na pitanje 1 pozitivno, nema potrebe za odgovorom na pitanje 2.

Hvala.

Offline MilanRS

  • ...
  • Administrator
  • Izuzetak
  • *****
  • Postova: 10674
  • Spol: Muški
Odg: OCR skripta za SW
« Odgovor #31 : 28.06.2008. 12:56:06 »
2 pitanja:

1.) Da li sve ove skripte mogu da spakujem u jedan fajl i da ga ucitam u OCR Scripts, gde mi trenutno iz nekog razloga stoji Espanol ?

Ne može više skripti (svaka ima svoje zaglavlje) ići u jedan fajl.
Moraš uzeti jednu pa dodavati iz drugih šta ti treba a nema u prvoj.
Pročitaj ponovo postove iz ove teme, pa napiši šta ti precizno treba, a ja ću se potruditi da to iskombinujem i dostavim.
... -> Better Call Saul s2 -> Billions s3 -> Bosch s2 -> Westworld s2 -> The Mick s2 -> The Crossing s1 -> The Affair s4 -> Sharp Objects -> You're the Worst s4 -> Silicon Valley s4 -> Luther s5 -> trenutno: CSI: CSI s13 / Cuckoo s1 / The Comeback s1 / Northern Exposure s1 / Criminal Minds s11 / Quantico s2 / The Simpsons s29 / Veep s5 / Gomorra s2 / Peaky Blinders s4 -> Fargo s3 -> Billions s4



#sfns

Offline Strider

  • Regularni forumaš
  • *
  • Postova: 38
  • Spol: Muški
    • Few little things...
Odg: OCR skripta za SW
« Odgovor #32 : 28.06.2008. 20:56:58 »

2.) Da li seneko seca, bio je link sa OCR skriptom za SW za CRO koji ispravlja gomilu stvari, secam se da je na tom linku bio i software za ispravljanje iz SRB->CRO ?
Ta skripta o kojoj pričaš je bila na mojoj stranici, ali kako su zabranjeni linkovi 8), imaš je i na prethodnoj stranici (post koji počinje: "Evo "male" RegEx skripte za popravak na hrvatski jezik. bla bla bla ;D)
Što se tiče programa za ispravljanje SRB->CRO, program se zvao SCGTitlovi. Sad imaš bolji, B3S Subtranslator. Ako "u-google-aš" to, dobit ćeš kao prvu autorovu stranicu, a ukoliko upišeš B3SSubtitler (stari naziv programa) ili SCGTitlovi, dobit ćeš kao prvu moju stranicu (na kojoj je i ta OCR skripta za SW), pa pogledaj.
Nadam se da će ti biti od pomoći  ;)

Offline Veleno

  • Ex prevoditelj
  • Heroj član
  • ***
  • Postova: 4750
Odg: OCR skripta za SW
« Odgovor #33 : 28.06.2008. 21:52:44 »
Zamolio bih majstore koji prave OCR skripte da pogledaju mogu li namjestiti da kad koristim skriptu koja briše "-" iz prvog reda i skriptu koja briše razmak iza "-" drugog reda, da to radi i kad su italic slova u pitanju. Ovo nije baš "must have" ali bih stvarno bio zahvalan. Unaprijed VELIKO hvala.

Offline MilanRS

  • ...
  • Administrator
  • Izuzetak
  • *****
  • Postova: 10674
  • Spol: Muški
Odg: OCR skripta za SW
« Odgovor #34 : 28.06.2008. 23:13:55 »
Strider, linkovi su zabranjeni ako vode na sajt sa piratskim i nelegalnim sadržajima, nacionalističkim i sl. Ako nemaš ništa protivzakonito na sajtu, napiši link.

Veleno, provjeriću to za italic.
« Zadnja izmjena: 28.06.2008. 23:18:02 MilanRS »
... -> Better Call Saul s2 -> Billions s3 -> Bosch s2 -> Westworld s2 -> The Mick s2 -> The Crossing s1 -> The Affair s4 -> Sharp Objects -> You're the Worst s4 -> Silicon Valley s4 -> Luther s5 -> trenutno: CSI: CSI s13 / Cuckoo s1 / The Comeback s1 / Northern Exposure s1 / Criminal Minds s11 / Quantico s2 / The Simpsons s29 / Veep s5 / Gomorra s2 / Peaky Blinders s4 -> Fargo s3 -> Billions s4



#sfns

Offline MilanRS

  • ...
  • Administrator
  • Izuzetak
  • *****
  • Postova: 10674
  • Spol: Muški
Odg: OCR skripta za SW
« Odgovor #35 : 28.06.2008. 23:32:18 »
Sad sam isprobao kod sebe. Radi nezavisno od toga da li su slova kosa ili nisu. Mislim da ih OCR ignoriše, ne vidi ih pri provjeri. Daj mi neki test primjer u kojem ne vrši. Koju skriptu koristiš?
Testirao sam ovo:
<i>- Ko je došao? - Lucas.
- Otkud Lucas?

Prešlo je u:
<i>Ko je došao? -Lucas.
-Otkud Lucas?
... -> Better Call Saul s2 -> Billions s3 -> Bosch s2 -> Westworld s2 -> The Mick s2 -> The Crossing s1 -> The Affair s4 -> Sharp Objects -> You're the Worst s4 -> Silicon Valley s4 -> Luther s5 -> trenutno: CSI: CSI s13 / Cuckoo s1 / The Comeback s1 / Northern Exposure s1 / Criminal Minds s11 / Quantico s2 / The Simpsons s29 / Veep s5 / Gomorra s2 / Peaky Blinders s4 -> Fargo s3 -> Billions s4



#sfns

Offline Veleno

  • Ex prevoditelj
  • Heroj član
  • ***
  • Postova: 4750
Odg: OCR skripta za SW
« Odgovor #36 : 29.06.2008. 07:59:45 »
Skripte sam skupio sa sajta. A dogadja se sljedece.
<i>- Ko je došao? - Lucas.
- Otkud Lucas?

<i>-Ko je došao? -Lucas.
-Otkud Lucas?
Ne skida ovaj prvi (kad bolje razmislim vidim da sam krivo napisao u prvom postu. Sorry). Znaci ako su slova italic ne radi skripta koja skida prvi razmak u recenici.

Offline pejafor3

  • VIP
  • Senior član
  • *****
  • Postova: 1306
  • Spol: Muški
Odg: OCR skripta za SW
« Odgovor #37 : 29.06.2008. 11:23:06 »
Milane

Ne radi skirpta to sa italik varijantom.

Makar ova koja je postavljena ovde na sajtu.
Shave the Cheerleader, Shave the world!

Offline MilanRS

  • ...
  • Administrator
  • Izuzetak
  • *****
  • Postova: 10674
  • Spol: Muški
Odg: OCR skripta za SW
« Odgovor #38 : 29.06.2008. 12:04:18 »
Milane
Ne radi skirpta to sa italik varijantom.
Makar ova koja je postavljena ovde na sajtu.
Daj mi rečenicu za koju ne radi, da pokušam popraviti. Ovu gore rečenicu koju sam naveo odradilo je kako sam naveo. Išao sam copy/paste.
... -> Better Call Saul s2 -> Billions s3 -> Bosch s2 -> Westworld s2 -> The Mick s2 -> The Crossing s1 -> The Affair s4 -> Sharp Objects -> You're the Worst s4 -> Silicon Valley s4 -> Luther s5 -> trenutno: CSI: CSI s13 / Cuckoo s1 / The Comeback s1 / Northern Exposure s1 / Criminal Minds s11 / Quantico s2 / The Simpsons s29 / Veep s5 / Gomorra s2 / Peaky Blinders s4 -> Fargo s3 -> Billions s4



#sfns

Offline Strider

  • Regularni forumaš
  • *
  • Postova: 38
  • Spol: Muški
    • Few little things...
Odg: OCR skripta za SW
« Odgovor #39 : 29.06.2008. 13:13:26 »
Strider, linkovi su zabranjeni ako vode na sajt sa piratskim i nelegalnim sadržajima, nacionalističkim i sl. Ako nemaš ništa protivzakonito na sajtu, napiši link.
Hmpf, ne mogu stavit moj site, ima linkove za Gustava :o, ali obzirom na pravila, moga bi se stavit link za B3S Subtranslator. Nije ilegalno, ne prodaje se, nisu u pitanju ni linkovi za download, pa čak ni titlova tamo nema. Jel, Šimac? Moglo bi, jel' da?  8)

Offline Strider

  • Regularni forumaš
  • *
  • Postova: 38
  • Spol: Muški
    • Few little things...
Odg: OCR skripta za SW
« Odgovor #40 : 29.06.2008. 16:31:17 »
E, jes' čovik! ;)

Dakle, "B3S Subtranslator" (starog naziva "B3S Subtitler"), program za prevođenje srpskih titlova u hrvatske (i ispravljanje kojekakvih typo grešaka i nepismenosti), besplatan, domaći uradak, možete naći na adresi http://mba.vozibrale.com

Malo "podebljane" rječnike za isti, možete naći na onoj mojoj stranici, koju ne smin upisat  ;)

Offline Veleno

  • Ex prevoditelj
  • Heroj član
  • ***
  • Postova: 4750
Odg: OCR skripta za SW
« Odgovor #41 : 29.06.2008. 20:21:33 »
Citat:
Milan RS
Daj mi rečenicu za koju ne radi, da pokušam popraviti.

- Prestani se igrati.
- Slušaj, kasno je.
==>Originalna rečenica.

- Prestani se igrati.
- Slušaj, kasno je.
==> Skripta koja uklanja '-' iz prvog reda. Ova skripta to nije ni 'pogledala'

-Prestani se igrati.
-Slušaj, kasno je.
==> Skripta koja uklanja razmak iza drugog '-'

Offline genius

  • Mlađi član
  • **
  • Postova: 63
Odg: OCR skripta za SW
« Odgovor #42 : 29.06.2008. 20:32:06 »
Ja imam skriptu koja uklanja "-" iz prvog reda čak i ako je tekst ukošen.
Mene muči drugi problem. Koristim skriptu od MilanaRS. Ne uklanja mi "-" iz prvog reda ako rečenica počinje malim slovom.
evo pr.
- ja sam Ivan.
- Ja Marko.

Ja želim da mi ukloni "-" iz prvog reda iako rečenica počinje malim slovom.

Offline MilanRS

  • ...
  • Administrator
  • Izuzetak
  • *****
  • Postova: 10674
  • Spol: Muški
Odg: OCR skripta za SW
« Odgovor #43 : 29.06.2008. 21:35:40 »
genius, evo ti rješenje i obrazloženje.
U skripti već imaš ovo:
<!-- Brisanje crte - na početku 1. reda (i kada ima dva reda) -->
   <ERROR Find="^(- )[A-ZŠĆŽČĐ]" ReplaceBy="">
   <ERROR Find="^(-)[A-ZŠĆŽČĐ]" ReplaceBy="">

^ označava da je početak reda. Ono što je u ( i ) se mijenja onim što je na kraju pod "". U ovom slučaju ničim, tj. briše se. Ovo što je u [ i ] služi za pronalaženje, i to se ne mijenja.
Ovaj prvi red pronalazi na početku reda crticu pa razmak pa neko slovo od A do Z uključujući ŠĆŽČĐ. Znači da pronalazi ono što počinje velikim slovom. Drugi red je slično, samo što umjesto crtice pa razmaka pa velikog slova pronalazi crticu pa veliko slovo. Npr. -Ja sam Ivan.
Nisam napravio da briše crticu jer nisam računao da će rečenica početi malim slovom. U novoj verziji skripte u postu br. 2 ću staviti i to.
Trebaš samo ona tri reda zamijeniti ovim:
<!-- Brisanje crte - na početku 1. reda (i kada ima dva reda) -->
   <ERROR Find="^(- )[A-ZŠĆŽČĐa-zšćžčđ]" ReplaceBy="">
   <ERROR Find="^(-)[A-ZŠĆŽČĐa-zšćžčđ]" ReplaceBy="">
... -> Better Call Saul s2 -> Billions s3 -> Bosch s2 -> Westworld s2 -> The Mick s2 -> The Crossing s1 -> The Affair s4 -> Sharp Objects -> You're the Worst s4 -> Silicon Valley s4 -> Luther s5 -> trenutno: CSI: CSI s13 / Cuckoo s1 / The Comeback s1 / Northern Exposure s1 / Criminal Minds s11 / Quantico s2 / The Simpsons s29 / Veep s5 / Gomorra s2 / Peaky Blinders s4 -> Fargo s3 -> Billions s4



#sfns

Offline MilanRS

  • ...
  • Administrator
  • Izuzetak
  • *****
  • Postova: 10674
  • Spol: Muški
Odg: OCR skripta za SW
« Odgovor #44 : 29.06.2008. 21:42:06 »
Ne skida ovaj prvi (kad bolje razmislim vidim da sam krivo napisao u prvom postu. Sorry). Znaci ako su slova italic ne radi skripta koja skida prvi razmak u recenici.
Ovaj tvoj post mi je promakao kad sam prošli put gledao.
Ja sam testirao i druge rečenice koje si kasnije postavio i opet mi je radilo. Možda ima nešto u trenutnoj skripti koju koristim a da nije u onoj koju sam u 4. mjesecu postavio u post br. 2.
Najbolje rješenje za sve probleme: Copy/Paste skriptu koju koristiš, ovdje u ovu temu. Ja ću je preuzeti i direktno na njoj isprobati. Nisam siguran koju koristiš pa da ne bude nesporazuma. Ne može biti da jedno isto kod nekoga radi jedno, a kod drugoga drugo. :)
... -> Better Call Saul s2 -> Billions s3 -> Bosch s2 -> Westworld s2 -> The Mick s2 -> The Crossing s1 -> The Affair s4 -> Sharp Objects -> You're the Worst s4 -> Silicon Valley s4 -> Luther s5 -> trenutno: CSI: CSI s13 / Cuckoo s1 / The Comeback s1 / Northern Exposure s1 / Criminal Minds s11 / Quantico s2 / The Simpsons s29 / Veep s5 / Gomorra s2 / Peaky Blinders s4 -> Fargo s3 -> Billions s4



#sfns

Offline Strider

  • Regularni forumaš
  • *
  • Postova: 38
  • Spol: Muški
    • Few little things...
Odg: OCR skripta za SW
« Odgovor #45 : 29.06.2008. 22:16:44 »
- Prestani se igrati.
- Slušaj, kasno je.
==>Originalna rečenica.

Ako ti rečenica u SW-u izgleda ovako:
<i>- Prestani se igrati.
- Slušaj, kasno je.

...radi. Meni je rezultat:
<i>Prestani se igrati.
- Slušaj, kasno je.


Napravi posebnu skriptu:
<!----------------------------------------------->
<!--     Subtitle Workshop OCR Script file     -->
<!--       Copyright © 2001-2004 URUSoft       -->
<!--           http://www.urusoft.net          -->
<!----------------------------------------------->

<SWOCR WordChars="0123456789abcdefghijklmnopqrstuvwxyzABCDEFGHIJKLMNOPQRSTUVWXYZ_ńŃáéíóúÁÉÍÓÚäëďöü">

<!-- Brisanje crte - na početku 1. reda kada ima dva reda -->
<ERROR Find="^(- )[A-ZŠĆŽČĐa-zšćžčđ]" ReplaceBy="">
<ERROR Find="^(-)[A-ZŠĆŽČĐa-zšćžčđ]" ReplaceBy="">

</SWOCR>
pa probaj. Ako radi, problem je negdi drugo u skripti.

Offline Veleno

  • Ex prevoditelj
  • Heroj član
  • ***
  • Postova: 4750
Odg: OCR skripta za SW
« Odgovor #46 : 29.06.2008. 22:43:01 »
Ekipa: Kriv sam. Koristio sam skriptu koju je Kugi radio. Sad sam ubacio od Milan RS i sve radi samo tako.

Offline MilanRS

  • ...
  • Administrator
  • Izuzetak
  • *****
  • Postova: 10674
  • Spol: Muški
Odg: OCR skripta za SW
« Odgovor #47 : 30.06.2008. 00:58:24 »
Ekipa: Kriv sam. Koristio sam skriptu koju je Kugi radio. Sad sam ubacio od Milan RS i sve radi samo tako.
Odlično, neka smo i to riješili.
Sutra dolazi update i uputstvo za prilagođavanje.
... -> Better Call Saul s2 -> Billions s3 -> Bosch s2 -> Westworld s2 -> The Mick s2 -> The Crossing s1 -> The Affair s4 -> Sharp Objects -> You're the Worst s4 -> Silicon Valley s4 -> Luther s5 -> trenutno: CSI: CSI s13 / Cuckoo s1 / The Comeback s1 / Northern Exposure s1 / Criminal Minds s11 / Quantico s2 / The Simpsons s29 / Veep s5 / Gomorra s2 / Peaky Blinders s4 -> Fargo s3 -> Billions s4



#sfns

Offline ptomic

  • Regularni forumaš
  • *
  • Postova: 21
  • Spol: Muški
Odg: OCR skripta za SW
« Odgovor #48 : 30.06.2008. 22:31:18 »
2 pitanja:

1.) Da li sve ove skripte mogu da spakujem u jedan fajl i da ga ucitam u OCR Scripts, gde mi trenutno iz nekog razloga stoji Espanol ?

Ne može više skripti (svaka ima svoje zaglavlje) ići u jedan fajl.
Moraš uzeti jednu pa dodavati iz drugih šta ti treba a nema u prvoj.
Pročitaj ponovo postove iz ove teme, pa napiši šta ti precizno treba, a ja ću se potruditi da to iskombinujem i dostavim.

Najvise mi treba oko problema sa malim L i velikim I, eventualno blaga ispravka tipo gresaka.

Offline MilanRS

  • ...
  • Administrator
  • Izuzetak
  • *****
  • Postova: 10674
  • Spol: Muški
Odg: OCR skripta za SW
« Odgovor #49 : 30.06.2008. 23:01:07 »
U drugom postu ove teme je osvježena verzija RegEx ocr skripte.

Uputstvo za prilagođavanje najnovije verzije RegEx ocr skripte.

1. Ako ne želite da vam skripta nešto radi, a možete da prepoznate koji red u skripti vrši neželjene promjene, deaktivirajte ga na sljedeći način. Na početak tog reda stavite <!-- a na kraj -->
Obratite pažnju da nije isti skup znakova za početak i kraj, početak ima i !
Nemojte isključivati red kao što to može u C++, php i sl. sa // jer će najvjerovatnije doći do neželjenih posljedica.

2. Ako ne možete da prepoznate koji redovi rade ono što vi ne želite, ovdje pročitajte šta sve radi skripta i šta da isključite za pojedine postupke.

   <!-- ," -->
   <ERROR Find="[\w](\,\x22)[\s]" ReplaceBy="",">
   <ERROR Find="[\w](\,\x22$)" ReplaceBy="",">
   <ERROR Find="(,)[\.\.\.]" ReplaceBy="">
   <ERROR Find="(\.\.\.\,)" ReplaceBy="...">

Ova prva sekcija je zadužena za problematiku oko zareza tj. zapete.
Prvi red sa ERROR pronalazi slovo ili broj pa zarez pa navodnik pa razmak i ispravlja u navodnik pa zarez.
Primjer:
je vrlo brzo," rekao mi je.
Biće:
je vrlo brzo", rekao mi je.

Primjer:
"Prva," "druga," "treća," i "posljednja," vrata.
Biće:
"Prva", "druga", "treća", i "posljednja", vrata.

Ovo su vrlo česte greške kod titlova na engleskom, a zna se desiti i kod nas. Ako vi želite da ostane onako pogrešno, stavite oznake za komentar, prema uputstvu pod 1.

Druga linija radi isto, samo što pronalazi i ako je kraj reda iza navodnika, a ne razmak.
Treća linija briše razmak koji se nalazi ispred tri tačke.
Primjer: Otišao je, vratio se, otišao je,...
Prelazi u: Otišao je, vratio se, otišao je...
Četvrta, kao i treća, briše razmak, ali iza tri tačke.

   <!-- Replace htjeo by htio i slično  -->
Sljedeća sekcija sadrži ispravke najčešćih grešaka u pravopisu. Ako imate neku riječ koju bi trebalo dodati, molim da me obavijestite ovdje na forumu, da bi skripta bila što bolja.
I ovdje važi isto pravilo. Ako vi želite i dalje da u titlu piše samnom iako je sa mnom pravilno, vi ovaj red
<ERROR Find="(samnom)" ReplaceBy="sa mnom">
promijenite u
<!-- <ERROR Find="(samnom)" ReplaceBy="sa mnom"> -->
I tako za svaki red. Možete i više redova odjednom isključiti tako što ćete početak staviti na početak prvog, a kraj na kraj posljednjeg neželjenog reda.
Npr. ako hoćete da i dalje piše gdin. Petrović, a ne gosp. Petrović, kao i Gdin. Petrović, isključite oba reda posebno ili odjednom kao što je ovdje ispod.
<!--   <ERROR Find="(gdin\.)" ReplaceBy="gosp.">
   <ERROR Find="(gdin )" ReplaceBy="gosp. "> -->
Dodate su i neke riječi koje nepravilno imaju č umjesto ć.

Sljedeću cjelinu čine ovi redovi:
   <!-- "1 :", "2 :"... "n :" to "n:" -->
   <ERROR Find="\d( : )[^(\d)]" ReplaceBy=": ">
   <!-- ",,," or similar to "..." -->
   <ERROR UseREOnlyToFind="False" Find=",{2,}" ReplaceBy="...">
   <!-- "--" or more to "..." -->
   <ERROR UseREOnlyToFind="False" Find="-{2,}" ReplaceBy="...">
   <ERROR Find="--" ReplaceBy="...">
   <ERROR Find="[^(\.)](\.\.)[^(\.)]" ReplaceBy="...">
Prvi ERROR pronalazi broj pa razmak pa : i briše razmak. To je zadržano iz engleske skripte. Ja sam modifikovao tako da ne briše razmak ako je slučaj poređenja, npr. Omjer je 3 : 2.
Sljedeći red mijenja tri zareza u tri tačke. Dalje, dvije crtice (vrlo česte u engl. titlovima) prebacuje u tri tačke. I za kraj, dvije tačke mijenja u tri tačke. Česta greška u titlovima.

Ovaj dio <!-- Apostrophes ("\x22" is '"' character) -->
se bavi promjenom apostrofa koji su korišćeni kao navodnici. Mijenja ih u navodnike.
Ako imate nejasnoća oko ovoga, pitajte, jer ne mogu sada opisivati svaki red šta radi.

<!-- Fix zero and capital 'o' ripping mistakes -->
Ovo je iz engleske skripte. Ako se malo slovo o nađe među brojevima, promijeniće ga u broj nula. I obrnuto.

Ovo je važan dio.
   <!-- Brisanje crte - na početku 1. reda (i kada ima dva reda) -->
Ako nećete da koristite ove opcije, stavite je pod komentare, kao što je ovdje:

<!--   <ERROR Find="^(- )[A-ZŠĆŽČĐa-zšćžčđ]" ReplaceBy="">
   <ERROR Find="^(-)[A-ZŠĆŽČĐa-zšćžčđ]" ReplaceBy="">
   <ERROR Find="^(- )\.\.\." ReplaceBy="">
   <ERROR Find="^(-)\.\.\." ReplaceBy="">
   <ERROR UseREOnlyToFind="False" Find="^- \x22" ReplaceBy=""">
   <ERROR UseREOnlyToFind="False" Find="^-\x22" ReplaceBy=""">    -->
   <!-- Brisanje razmaka iza crte - na početku 2. reda -->
<!--    <ERROR Find="[\n](- )[A-ZŠĆŽČĐ\x22]" ReplaceBy="-">       -->
   <!-- Korigovanje crte - kad je u sredini prvog reda -->
 <!--   <ERROR Find="[\.\?\!\x22]( - )[A-ZŠĆŽČĐ\x22]" ReplaceBy=" -">    -->


Sljedeći dio je posvećen tački i razmaku.
   <!-- Smart space after dot -->
   <ERROR Find="[a-su-zá-úńä-ü](\.)[^(\s\n\.\*\?\!\x22)]" ReplaceBy=". "> <!-- osim kad je zadnje t (rijec kolt) -->
   <!-- Oznaka za kalibar. Npr. "Colt .45" -->
   <!-- Da bi radilo, da bi ovaj razmak bio dozvoljen, u SW idite Alt+I i odcekirajte "Razmaci ispred tacke" -->
   <ERROR Find="(t\.)[0-9][0-9]" ReplaceBy="t .">
Prvi red: Kad naiđe na malo slovo pa tačku, napravi razmak iza tačke. To se izvršava samo ako iza te tačke nema razmaka, ako nije kraj reda, ako nije druga tačka (neće napraviti razmake između ...), itd. Podešeno je da sve radi kako treba.
Postavio sam izuzetak za kolt. Npr. "Kolt .9" će ostati tako, neće biti nepotrebni razmak iza tačke.

Dio    <!-- Podešavanje oko domena -->
je posvećen ispravljanju grešaka kod razmaka iza tačke. Pošto je pravopisno nedopustivo da iza tačke nema razmaka, moraju se dodati izuzeci kod domena. Npr. Kod www.prijevodi-online.org će se onemogućiti pravljenje razmaka iza www. i .org. Dodati su najčešći domeni.

   <!-- Sredjuje zarez sa razmakom -->   
Ovdje sam koristio skriptu za razmak iza tačke da podesim slično i za zareze.
Iza zareza uvijek mora biti razmak, osim kad je kraj reda, ako već nema razmak i slično.
Ako je razmak ispred zareza, koriguje se. Npr. "Ne ,nemoj mi prići" će biti "Ne, nemoj mi prići"
Ovo ispravlja česte greške u kucanju, nenamjerne.

Ostalo do kraja je nešto iz engleske skripte što je i za nas korisno, razmak iza ... i razmak iza ! i ako je na početku reda razmak iza tri tačke, briše se razmak.
Ako su ... između dvije riječi sa razmakom i ispred i iza, tri tačke se privlače prvoj riječi.
Navodnik se privlači tački, ako je greškom napravljen razmak iza tačke, a navodnik ne pripada rečenici koja slijedi.
Posljednja dva reda privlače navodnik tekstu ako je taj navodnik posljednji znak u redu titla.

Nadam se da vam je sada jasnije šta radi koji dio i da ćete bez problema prilagoditi skriptu svom ukusu i ustaljenom načinu rada. Za sva dodatna pitanja slobodno se obratite ovdje preko foruma, preko maila ili preko lične poruke (PM).
... -> Better Call Saul s2 -> Billions s3 -> Bosch s2 -> Westworld s2 -> The Mick s2 -> The Crossing s1 -> The Affair s4 -> Sharp Objects -> You're the Worst s4 -> Silicon Valley s4 -> Luther s5 -> trenutno: CSI: CSI s13 / Cuckoo s1 / The Comeback s1 / Northern Exposure s1 / Criminal Minds s11 / Quantico s2 / The Simpsons s29 / Veep s5 / Gomorra s2 / Peaky Blinders s4 -> Fargo s3 -> Billions s4



#sfns

Offline Veleno

  • Ex prevoditelj
  • Heroj član
  • ***
  • Postova: 4750
Odg: OCR skripta za SW
« Odgovor #50 : 29.07.2008. 21:06:39 »
Milane, jeli može jedna jednostavna skripta?

Da ovo: rekao sam joj. -rekao si joj? -da, rekao sam.

u ovo: Rekao sam joj. -Rekao si joj? -Da, rekao sam.

Ili takve slične stvari, tj. da ako je prvo slovo na početku rečenice malo da ga se stavi veliko.

Offline brxxxi

  • Prevoditelj
  • Regularni forumaš
  • ****
  • Postova: 94
  • Spol: Muški
Odg: OCR skripta za SW
« Odgovor #51 : 15.08.2008. 16:03:09 »

evo jos jedne vrlo korisne skripte, c/p sa SW foruma
preporuka za one koji prevode preko eng. titla tj. samo
promijene eng. riječi s našima.

Skripta provjerava koji titlovi imaju više od 25 znakova po sekundi
(uključite mod prevođenja u SW jer tamo stavlja log za te titlove)

Cilj skripte je lakše čitanje titlova, znači da se isprave oni koji
prekratko traju/imaju previše znakova ili riječi u odnosu na trajanje

// --= CPS Comment (in translation) =--
// Add info about the Readability Rythm
// of the original sub (Characters per second)
// as a comment [...] in the Translation.
// ------------------------------------
// Made by Buzcatcher - feb.2007
// http://subtitle-spotting.blogspot.com/

program CPScomment;

// -------------------------------------

const
//FYI: 25cps = 40ms spotting for each char ; 20cps=50ms/char. etc.
  CPSlimit = 25;  //Change as you see fit.
  CRLF = ''#13''#10;

var
  i, j, n, pln, p1, p2 : Integer;
  duration, sublength, cps : Integer;
  subtxt, subtrans, report : String;

begin
  if not IsTranslatedloaded then
    exit;

  n := GetSubtitleCount-1;

  for i := 0 to n do
  begin
    subtxt := GetSubtitleText(i);
    sublength := length(subtxt);
    duration := GetSubtitleFinalTime(i) - GetSubtitleInitialTime(i);
   
    //pure stripped text length doesn't count the CRLF in 2 line subs
    pln := pos(''#13''#10, subtxt);
    if (pln>0) then
      sublength := sublength - 2;
   
    cps := round((sublength * 1000)/ duration);   //spotting spead.
   
    if (cps > CPSlimit) then
    begin
      // To update rather than double the cps info.
      subtrans := GetSubtitleTrans(i);
      p1 := pos('[*', subtrans);
      p2 := pos('*]', subtrans);
      while ((p1>0) and (p2>0)) do
         begin
           subtrans := copy(subtrans, p2+2, length(subtrans)-p2);
           p1 := pos('[*', subtrans);
           p2 := pos('*]', subtrans);
         end;
      SetSubtitleTrans(i, subtrans);
   
      //Adding [*xx C/sec*] in the translation text.
      report := '[*' + IntToStr(cps) + ' Car/s*]';
      subtrans := report + GetSubtitleTrans(i);
      SetSubtitleTrans(i, subtrans);
      j := j + 1;
    end;
 
  end;

  MsgBox(IntToStr(j) + ' Subtitles over ' + IntToStr(CPSlimit) + ' char/sec' + CRLF + 'Noted in Translation File', '&Ok', '', '', $20);
end.


Ova skripta bi meni trebala ali ja ne znam kako se u sw koriste skripte.... budite ljubazni objasnite mi postupak primene skripte u sw korak po korak molim vas. Hvala

Offline Nagy

  • Ja
  • Prevoditelj extra
  • Član
  • *****
  • Postova: 395
  • Spol: Muški
Odg: OCR skripta za SW
« Odgovor #52 : 16.08.2008. 16:28:45 »
// --= CPS Comment (in translation) =--
// Add info about the Readability Rythm
// of the original sub (Characters per second)
// as a comment [...] in the Translation.
// ------------------------------------
// Made by Buzcatcher - feb.2007
// http://subtitle-spotting.blogspot.com/

program CPScomment;

// -------------------------------------

const
//FYI: 25cps = 40ms spotting for each char ; 20cps=50ms/char. etc.
  CPSlimit = 25;  //Change as you see fit.
  CRLF = ''#13''#10;

var
  i, j, n, pln, p1, p2 : Integer;
  duration, sublength, cps : Integer;
  subtxt, subtrans, report : String;

begin
  if not IsTranslatedloaded then
    exit;

  n := GetSubtitleCount-1;

  for i := 0 to n do
  begin
    subtxt := GetSubtitleText(i);
    sublength := length(subtxt);
    duration := GetSubtitleFinalTime(i) - GetSubtitleInitialTime(i);
   
    //pure stripped text length doesn't count the CRLF in 2 line subs
    pln := pos(''#13''#10, subtxt);
    if (pln>0) then
      sublength := sublength - 2;
   
    cps := round((sublength * 1000)/ duration);   //spotting spead.
   
    if (cps > CPSlimit) then
    begin
      // To update rather than double the cps info.
      subtrans := GetSubtitleTrans(i);
      p1 := pos('[*', subtrans);
      p2 := pos('*]', subtrans);
      while ((p1>0) and (p2>0)) do
         begin
           subtrans := copy(subtrans, p2+2, length(subtrans)-p2);
           p1 := pos('[*', subtrans);
           p2 := pos('*]', subtrans);
         end;
      SetSubtitleTrans(i, subtrans);
   
      //Adding [*xx C/sec*] in the translation text.
      report := '[*' + IntToStr(cps) + ' Car/s*]';
      subtrans := report + GetSubtitleTrans(i);
      SetSubtitleTrans(i, subtrans);
      j := j + 1;
    end;
 
  end;

  MsgBox(IntToStr(j) + ' Subtitles over ' + IntToStr(CPSlimit) + ' char/sec' + CRLF + 'Noted in Translation File', '&Ok', '', '', $20);
end.

Ovo gore kopiraj u notepad i sačuvaš pod Provjera broja znakova.PAS i kopiraj taj file u C:\Program Files\URUSoft\Subtitle Workshop\PascalScripts direktorij. Otvoriš Subtitle Workshop i pod Tools--> Pascal scripts će ti se nalaziti taj "Provjera broja znakova". Da bi ova određena skripta radila svoju funkciju mora ti biti otvoren prijevod i uključen Translator mode (Ctrl-U ili Edit-->Translation-->Translator mode). Dakle, kad ti je otvoren prijevod i uključen translator mode klikom na ono "Provjera broja znakova" pod Pascal scripts pokreće se ta skripta i vidjeti ćeš poruku u kojoj ti javi koliko ti redova ima više od 25 znakova. Koji su to točno redovi vidjeti ćeš u onom desnom dijelu prijevoda gdje će ti kod svakog takvog reda pisati [*XX Car/s*]. Nadam se da si sve uspio pohvatati...
Citat: bugmenot11 - 14. 10. 2008 u 21:48:55
Mirko_Pevac je u pravu, koji kurac prijevod jos nije gotov ? ? ? ? ? ? ? ? ? ? ? ? ?



Offline brxxxi

  • Prevoditelj
  • Regularni forumaš
  • ****
  • Postova: 94
  • Spol: Muški
Odg: OCR skripta za SW
« Odgovor #53 : 16.08.2008. 21:03:24 »
Sredio sam radi tj obelezila je sve recenice, ali kad taj prevod saveujem svugde buse untranslated subtitle i prevoda nema..........

Offline Nagy

  • Ja
  • Prevoditelj extra
  • Član
  • *****
  • Postova: 395
  • Spol: Muški
Odg: OCR skripta za SW
« Odgovor #54 : 16.08.2008. 21:10:56 »
Sredio sam radi tj obelezila je sve recenice, ali kad taj prevod saveujem svugde buse untranslated subtitle i prevoda nema..........
Kad radiš u Translator modu onda imaš 2 otvorena prijevoda odjednom. Ti si sačuvao ovaj drugi prijevod, gdje ti je zapravo samo "- Untranslated subtitle -". On ti nije bitan, bitan ti je onaj prvi, onaj lijevo. Njega sačuvaš tako da ideš na Save-->Save original. Ti si vjerojatno sačuvao ovaj desni, prazni prijevod pod istim imenom kao i ovaj lijevo, pa ti je sačuvao preko postojećeg... Ovaj desni prijevod ne trebaš uopće sačuvati, kad ti izbaci onu poruku hoćeš li sačuvati ili ga sačuvaš pod nekih nebitnim imenom. Samo moraš paziti koji ti je od ta 2 prijevoda onaj pravi "Original", a koji ti je taj "Translated", odnosno onaj u koji ti skripta zapisuje te brojeve... Valjda si shvatio... :D
Citat: bugmenot11 - 14. 10. 2008 u 21:48:55
Mirko_Pevac je u pravu, koji kurac prijevod jos nije gotov ? ? ? ? ? ? ? ? ? ? ? ? ?



Offline MilanRS

  • ...
  • Administrator
  • Izuzetak
  • *****
  • Postova: 10674
  • Spol: Muški
Odg: OCR skripta za SW
« Odgovor #55 : 23.08.2008. 11:57:54 »
Milane, jeli može jedna jednostavna skripta?

Da ovo: rekao sam joj. -rekao si joj? -da, rekao sam.
u ovo: Rekao sam joj. -Rekao si joj? -Da, rekao sam.

Ili takve slične stvari, tj. da ako je prvo slovo na početku rečenice malo da ga se stavi veliko.
Izvini što nisam odgovorio ovako dugo, ali nisam aktivno učestvovao na ovom forumu skoro mjesec dana (pisao postove). Moram se i ja nekad odmoriti :)
Da li si i dalje pri ovome, da ti treba skripta za ovako nešto? Napraviću je ako ti treba, ali mislim da to pravi više štete nego koristi. Ima dosta redova koji počinju nastavkom rečenice iz prethodnog titla. Ti potvrdi, ako ti i dalje treba i dobijaš.
... -> Better Call Saul s2 -> Billions s3 -> Bosch s2 -> Westworld s2 -> The Mick s2 -> The Crossing s1 -> The Affair s4 -> Sharp Objects -> You're the Worst s4 -> Silicon Valley s4 -> Luther s5 -> trenutno: CSI: CSI s13 / Cuckoo s1 / The Comeback s1 / Northern Exposure s1 / Criminal Minds s11 / Quantico s2 / The Simpsons s29 / Veep s5 / Gomorra s2 / Peaky Blinders s4 -> Fargo s3 -> Billions s4



#sfns

Offline Veleno

  • Ex prevoditelj
  • Heroj član
  • ***
  • Postova: 4750
Odg: OCR skripta za SW
« Odgovor #56 : 23.08.2008. 12:30:14 »
Bitno je da si se (nadam se) odmorio. A skriptu sam mislio koristiti na engleskim titlovima za seriju Pretender ali sam našao bolje titlove tako da nije potrebno.
Ipak hvala. ;)

Offline MilanRS

  • ...
  • Administrator
  • Izuzetak
  • *****
  • Postova: 10674
  • Spol: Muški
Odg: OCR skripta za SW
« Odgovor #57 : 24.08.2008. 14:59:35 »
Sinoć sam instalisao paskal skriptu za 25cps i vidim da je to prava stvar. Samo, ja sam sebi povećao na 28 jer mi oni ne prolaze brzo, a morao bih puno titlova štelovati.
Nagy, hvala za objašnjenje, i meni je koristilo.
... -> Better Call Saul s2 -> Billions s3 -> Bosch s2 -> Westworld s2 -> The Mick s2 -> The Crossing s1 -> The Affair s4 -> Sharp Objects -> You're the Worst s4 -> Silicon Valley s4 -> Luther s5 -> trenutno: CSI: CSI s13 / Cuckoo s1 / The Comeback s1 / Northern Exposure s1 / Criminal Minds s11 / Quantico s2 / The Simpsons s29 / Veep s5 / Gomorra s2 / Peaky Blinders s4 -> Fargo s3 -> Billions s4



#sfns

Offline MilanRS

  • ...
  • Administrator
  • Izuzetak
  • *****
  • Postova: 10674
  • Spol: Muški
Odg: OCR skripta za SW
« Odgovor #58 : 04.10.2008. 17:34:34 »
Noah, što se tiče prelamanja redova, u SW možeš selektovati sve redove i ići Ctrl+E i on će duge redove prelomiti u dva, ali će i kratke
   Koliko komada zeli?
   -Dvadeset.
prebaciti u jedan
   Koliko komada zeli? -Dvadeset.
To nije baš poželjno.
Zato, u SW Alt+I, Napredno, Predugačka linija, tu upišeš koliko najviše karaktera smije imati linija. I uvećaš za 1. Poslije kad budeš testirao sa OCR, javiće ti koje linije su predugačke, pa ih središ na Ctrl+E, a kratke u dva reda ostaju takve.
Pročitaj postove iz ove teme, pisao sam o pretraživanju redova, metod sa F12 i F11.
Spreman sam da pojasnim sve što treba.
... -> Better Call Saul s2 -> Billions s3 -> Bosch s2 -> Westworld s2 -> The Mick s2 -> The Crossing s1 -> The Affair s4 -> Sharp Objects -> You're the Worst s4 -> Silicon Valley s4 -> Luther s5 -> trenutno: CSI: CSI s13 / Cuckoo s1 / The Comeback s1 / Northern Exposure s1 / Criminal Minds s11 / Quantico s2 / The Simpsons s29 / Veep s5 / Gomorra s2 / Peaky Blinders s4 -> Fargo s3 -> Billions s4



#sfns

Offline Noah

  • Prevoditelj
  • Senior član
  • ****
  • Postova: 652
  • Spol: Muški
Odg: OCR skripta za SW
« Odgovor #59 : 04.10.2008. 18:38:04 »
jel ima kakva opcija da se jedan redak ako je predugacak prelama u dva?