Prijevodi - Online

Izdvojeno => Tutorijali za izradu titlova => Autor teme: MilanRS - 08.03.2008. 01:10:54

Naslov: OCR skripta za SW
Autor: MilanRS - 08.03.2008. 01:10:54
Malo sam se igrao sa OCR skriptom u SW, uklonio sam redove koji su od ispravnog pravili pogrešno, npr. od ljudi -> Ijudi i slično.
Stavio sam da ispravlja neke osnovne pravopisne greške, a planiram dodavati kad primijetim da se često dešava u prevodima.
Pored osnovnih ispravki iz default skripte, dodao sam i ovo:
htjeo -> htio
smjeo -> smio
neznam -> ne znam
Neznam -> Ne znam
rijec,riječ -> riječ, riječ
Riječ!Riječ -> Riječ! Riječ
riječ.Riječ -> riječ. Riječ
nebi -> ne bi
nebih -> ne bih
ne ću -> neću
bi smo -> bismo
-- -> ...

Jedino što ne mogu pronaći je kako da mi ne javlja grešku u rečenici: ' "Danas i sutra." ' Tu hoće da napravi razmak između '.' i ' " ' EDIT: Riješio sam!!!
Ako neko u ovoj skripti pronađe kako i to dodati, neka napiše gdje šta da izmijenim.

Predlažite još šta treba. Da napravimo jednu univerzalnu skriptu. U ovoj nema nikakvih razlika za srpski i hrvatski jezik (nisam siguran za ovo "ne ću", u srpskom je jedna riječ, a u hrvatskom valjda hoće da uvedu da se piše odvojeno. Ako neko zna sigurno da je odvojeno, izbacićemo iz zajedničke skripte i ostaviti samo u srpskoj verziji - u budućnosti).
C/p OCR skripte je u sljedećem postu, radi preglednosti i budućih izmjena.
Naslov: OCR skripta za SW
Autor: MilanRS - 08.03.2008. 01:11:30
Trenutno je aktuelna treća verzija i samo se ona unapređuje.
Možete je preuzeti sa ovog linka
http://www.prijevodi-online.org/korisnici/milanrs/MilanRS3.ocr (http://www.prijevodi-online.org/korisnici/milanrs/MilanRS3.ocr)
i tu je uvijek najnovija verzija. Desni klik pa Save link as...

Ako se ne snalazite tako, evo i upakovano u .rar ali tu neće svaki put biti najnovije izdanje skripte.
http://www.prijevodi-online.org/korisnici/milanrs/MilanRS3.rar (http://www.prijevodi-online.org/korisnici/milanrs/MilanRS3.rar)

UPDATE: 18.03.2008. UPDATE: 01.04.2008.
UPDATE: 09.04.2008. UPDATE: 13.04.2008.
UPDATE: 30.06.2008. UPDATE: 19.02.2009.
UPDATE obje skripte: 4.7.2009.
MilanRS2 skripta osvježena: 25.4.2010.
MilanRS2 skripta osvježena: 11.7.2010.
MilanRS2 skripta osvježena: 2.4.2011.
MilanRS3 skripta postavljena 11. 2. 2013. http://www.prijevodi-online.org/korisnici/milanrs/MilanRS3.ocr (http://www.prijevodi-online.org/korisnici/milanrs/MilanRS3.ocr)

Evo link do dvije skripte.
Prva skripta ne dira crtice niti briše razmake iza crtice.
Druga skripta uklanja crtice na početku titla, a razmak iza ostalih crtica.

Prva skripta:
http://www.prijevodi-online.org/Tutorial/MilanRS1.ocr (http://www.prijevodi-online.org/Tutorial/MilanRS1.ocr)
Druga skripta:
http://www.prijevodi-online.org/Tutorial/MilanRS2.ocr (http://www.prijevodi-online.org/Tutorial/MilanRS2.ocr)

Desni klik na link pa klik na Save Link As ili Save Target As, pa snimite u folder na lokaciji:
C: Program Files - Urusoft - Subtitle Workshop - OCR Scripts

Poslije toga otvorite SW, pa u meniju sa lijeve strane, gdje piše default, kliknite na strelicu i izaberite MilanRS3.
Poslije toga idete F9 da vam se označe sve greške. Zatim stanete na prvu liniju titla, idete F11 da vidite šta će izmijeniti, pa F12 da pređe na sljedeću liniju koja ima grešku. Pa F11. Pa opet F12, F11 i tako ispravljate jednu po jednu liniju. To je ako želite da provjerite šta će vam skripta mijenjati a šta ne. Ako ispravi nešto što ne želite, vratite sa Undo ili Ctrl+Z.
Ako hoćete da sve ispravi odjednom, a da ne vidite šta kako mijenja, idete samo F9 pa F10.
Ako primijetite da nešto mijenja što ne želite, otvorite skriptu u Notepadu (ili Notepad++) i pokušajte isključiti neželjeni dio.
Ako ne možete to sami, napišite šta vam mijenja u šta i pošaljite mi na mail ili PM.

Pošto dugo vremena nisam postavljao osvježenu verziju a dosta toga sam mijenjao i dodavao tokom vremena, odlučio sam da je označim kao treću verziju. Ako primijetite da vam nešto mijenja što smatrate da nije ispravno, javite mi se bez ustručavanja.
Naslov: Odg: OCR skripta za SW
Autor: pejafor3 - 08.03.2008. 10:52:09
Skripta koja uklanja znak "-" iz prve linije prevoda.
(sačuvajte donju skriptu u običan fajl i prometnite ekstenziju u *.pas. Potom ubacite u
\Program Files\URUSoft\Subtitle Workshop\PascalScripts)
Primer:

NEPRAVILNO
00:01:18,480 --> 00:01:20,350
- Dobro.
- Odlično.

PRAVILNO
00:01:18,480 --> 00:01:20,350
Dobro.
- Odlično.


// by kugi

program removefirstdash;


function Remove (title : String) : String;

var
   startIndex : Integer;
   len : Integer;

begin   
   len := Length(title);
   for startIndex := 1 to len-1 do
       begin
       if((Copy(title, startIndex, 1) <> '-') and (Copy(title, startIndex, 1) <> ' ')) then break;

   if((Copy(title, startIndex, 1) = '-') or (Copy(title, startIndex, 1) = ' ')) then
      begin
      Delete(title, 1, 1);
      len := len - 1;
      startIndex := startIndex - 1;
      end;
       end;
   result := title;
end;


var
   titleIndex : Integer;
   title : String;

begin
   for titleIndex := 0 to GetSubtitleCount - 1 do

       begin
       title := GetSubtitleText(titleIndex);
       title := Remove(title);
       SetSubtitleText(titleIndex,title);
       end;
end.

Naslov: Odg: OCR skripta za SW
Autor: pesekan - 11.03.2008. 13:54:43
Evo da i ja zamolim za pomoć. :)

Srušio mi se cijeli sistem na kompu i nisam uspio spasiti skripte koje sam do sad imao a koje su mi zlata vrijedile. Pa ako se netko razumije da mi opet složi jednu skriptu bio bih mu jako zahvalan.

U postu iznad se već nalazi skripta koja uklanja prvu crticu iz prijevoda, a meni bi još uz to trebala skripta koja uklanja razmak između druge crtice i prvog slijedećeg znaka.

Dakle iz ovoga:

00:01:18,480 --> 00:01:20,350
Dobro.
- Odlično.


U ovo:

00:01:18,480 --> 00:01:20,350
Dobro.
-Odlično.


Vjerujem da neki čak već i imaju tu skriptu pa ako nije problem da se ovdje posta. Hvala.

Naslov: Odg: OCR skripta za SW
Autor: kugi001 - 11.03.2008. 15:35:20
// by kugi

program RemoveDashSpace;

// ----------------------------------------------
// procedure to remove space after dash ('-')
// and in some cases before dash

function RemoveDashSpace (title : String) : String;

var
   startIndex : Integer;
   len : Integer;

begin   
   len := Length(title);
   for startIndex := 1 to len-1 do
       begin
       if((Copy(title,startIndex,1) = '-') and (Copy(title,startIndex+1,1) = ' ')) then
               begin
           Delete(title,startIndex+1,1);
               len := len - 1;
           end;
       if((Copy(title,startIndex,1) = ' ') and (Copy(title,startIndex+1,1) = '-')) then
           begin
           if((startIndex > 1) and (Copy(title,startIndex-1,1) > #96)) then
               begin
               Delete(title,startIndex,1);
                   len := len - 1;
                   startIndex := startIndex - 1;
               end;
           end;
       end;
   result := title;
end;


// ----------------------------------------------
// main
// ----------------------------------------------

var
   titleIndex : Integer;
   title : String;

begin
   for titleIndex := 0 to GetSubtitleCount - 1 do
       begin
       title := GetSubtitleText(titleIndex);
       title := RemoveDashSpace(title);
       SetSubtitleText(titleIndex,title);
       end;
end.

Naslov: Odg: OCR skripta za SW
Autor: pesekan - 11.03.2008. 16:25:43
Kugi care, hvala! :)
Naslov: Odg: OCR skripta za SW
Autor: pejafor3 - 13.03.2008. 09:49:19
Kugi is back.
Naslov: Odg: OCR skripta za SW
Autor: kugi001 - 13.03.2008. 14:18:22

evo jos jedne vrlo korisne skripte, c/p sa SW foruma
preporuka za one koji prevode preko eng. titla tj. samo
promijene eng. riječi s našima.

Skripta provjerava koji titlovi imaju više od 25 znakova po sekundi
(uključite mod prevođenja u SW jer tamo stavlja log za te titlove)

Cilj skripte je lakše čitanje titlova, znači da se isprave oni koji
prekratko traju/imaju previše znakova ili riječi u odnosu na trajanje

// --= CPS Comment (in translation) =--
// Add info about the Readability Rythm
// of the original sub (Characters per second)
// as a comment [...] in the Translation.
// ------------------------------------
// Made by Buzcatcher - feb.2007
// http://subtitle-spotting.blogspot.com/

program CPScomment;

// -------------------------------------

const
//FYI: 25cps = 40ms spotting for each char ; 20cps=50ms/char. etc.
  CPSlimit = 25;  //Change as you see fit.
  CRLF = ''#13''#10;

var
  i, j, n, pln, p1, p2 : Integer;
  duration, sublength, cps : Integer;
  subtxt, subtrans, report : String;

begin
  if not IsTranslatedloaded then
    exit;

  n := GetSubtitleCount-1;

  for i := 0 to n do
  begin
    subtxt := GetSubtitleText(i);
    sublength := length(subtxt);
    duration := GetSubtitleFinalTime(i) - GetSubtitleInitialTime(i);
   
    //pure stripped text length doesn't count the CRLF in 2 line subs
    pln := pos(''#13''#10, subtxt);
    if (pln>0) then
      sublength := sublength - 2;
   
    cps := round((sublength * 1000)/ duration);   //spotting spead.
   
    if (cps > CPSlimit) then
    begin
      // To update rather than double the cps info.
      subtrans := GetSubtitleTrans(i);
      p1 := pos('[*', subtrans);
      p2 := pos('*]', subtrans);
      while ((p1>0) and (p2>0)) do
         begin
           subtrans := copy(subtrans, p2+2, length(subtrans)-p2);
           p1 := pos('[*', subtrans);
           p2 := pos('*]', subtrans);
         end;
      SetSubtitleTrans(i, subtrans);
   
      //Adding [*xx C/sec*] in the translation text.
      report := '[*' + IntToStr(cps) + ' Car/s*]';
      subtrans := report + GetSubtitleTrans(i);
      SetSubtitleTrans(i, subtrans);
      j := j + 1;
    end;
 
  end;

  MsgBox(IntToStr(j) + ' Subtitles over ' + IntToStr(CPSlimit) + ' char/sec' + CRLF + 'Noted in Translation File', '&Ok', '', '', $20);
end.

Naslov: Odg: OCR skripta za SW
Autor: MilanRS - 18.03.2008. 14:15:02
Da bi se ispravljala greška postojanja crtice u titlu sa jednim redom, u SW pod Alati, Informacije i greske, kliknite na Podesavanja.
Pod tabom Proveri i pod tabom Sredi
treba da bude čekirano
"-" u titlovima sa jednom linijom.
(To je u srpskom prevodu SW)

Ispravio sam neke greške koje sam napravio prošli put.
Dodao sam neke nove elemente.

Briše liniju u prvom redu titla koji ima dva reda
Npr. (isječak iz Supernaturala)
- Ravnopravnost.
-Mislim da je riječ.
Biće:
Ravnopravnost.
-Mislim da je riječ.

Uklanja i razmak iza početne crte u drugom redu:
Npr.
Ravnopravnost.
- Mislim da je riječ.
Biće:
Ravnopravnost.
-Mislim da je riječ.

Ako u titlu postoji crtica koja ne označava promjenu govornika,
nego stoji umjesto zareza, neće biti privučena tekstu.
Npr.
Doći će - rekao je.

Ako tekst drugog govornika počinje u prvom redu, takođe se koriguje crtica tako da je ispred nje razmak, a iza nje nema razmaka. Preduslovi: Tekst prvog govornika završava sa ? ili ! ili . dok tekst drugog počinje velikim slovom (logično!). Ako je razmak iza crtice, biće obrisan.
Npr.
Oh, čovječe! Stari. - To su moja
sestra i moja cura.
Biće:
Oh, čovječe! Stari. -To su moja
sestra i moja cura.

Izmijenjena skripta (update) je u postu broj 2 odozgo. Sve selektujete i kopirate, pa na kompu pod Program Files, Urusoft, SubtitleWorkshop, OCRScripts otvorite Default u Notepadu i zamijenite tekst.

Biće još dorade kad nađem vremena. Neće biti brzo. Juče sam cijelo poslijepodne potrošio na izučavanje pravila i semantike za OCR.  ;)
Naslov: Odg: OCR skripta za SW
Autor: pejafor3 - 19.03.2008. 11:22:02
Super skripta. Tenks.
Naslov: Odg: OCR skripta za SW
Autor: Veleno - 31.03.2008. 23:31:13
Ovako. Tek sam počeo koristiti te skripte za SW. Prva liga su.
Mene zanima ima li tko volje napraviti jednu jednostavnu koje će raditi sljedeće:

Prebaciti ovo:
00:00:12,370 --> 00:00:14,330
Mogu biti skinwalkers,warewolves,poltregeist...

u ovo:
00:00:12,370 --> 00:00:14,330
Mogu biti skinwalkers, warewolves, poltregeist...

Mislim samo da se ubaci taj razmak iza zareza. Znam da ovdje tražim da to neko odradi umjesto mene, međutim o tome nemam pojma a pretpostavljam da će netko sa iskustvom napraviti to u nekoliko minuta. Unaprijed hvala.
Naslov: Odg: OCR skripta za SW
Autor: MilanRS - 31.03.2008. 23:42:39
Pa to radi "moja" skripta. ;) Drugi post odozgo.

Sutra predveče ću postaviti novu verziju skripte sa dodatnim opcijama i ispravkama. Ova sada mijenja je l' u je I' (zbog engleskog pravopisa) ali to sam sredio u novoj verziji.
Naslov: Odg: OCR skripta za SW
Autor: MilanRS - 01.04.2008. 00:46:47
Svakako sam planirao da sutra postavim update OCR skripte, ali evo odmah sam napravio posebno samo za razmake iza zareza. Default skripta (drugi post u ovoj temi) zna ponekad da mijenja i što ne treba, npr. znam." u znam. " To će tako biti dok ne saznam kako da riješim taj problem. EDIT: Riješio sam.
Ako ne želiš da ti mijenja išta drugo, osim zarez-problem, uradi ovako...
Ovaj kod copy/paste u Notepad, snimi kao zarez_razmak.ocr ili biloKojeIme.ocr, pod:
C:\Program Files\URUSoft\Subtitle Workshop\OCRScripts
Ako ti je pokrenut SW, isključi ga pa ponovo pokreni.
U lijevom panelu u SW, Ispod EastEurope, ispod ANSI, u popUp meniju odaberes zarez_razmak i pritisneš na F9. Označiće sve redove u kojima nema razmaka iza zareza. Ako hoćeš da gledaš kako ispravlja, klikneš na red sa greškom i pritisneš F11. Tako će ispraviti samo taj red. I tako jedan po jedan. Ako hoćeš da ispraviš sve odjednom, nakon F9 pritisneš F10 i napraviće razmak iza svakog zareza.
P.S. Nadam se da se nećeš uvrijediti što ovako detaljno opisujem ako zapravo nisi apsolutni početnik u SW, ali ovo pišem s ciljem da bude od pomoći i drugim prijateljima na sajtu i forumu.
Zadovoljstvo mi je biti od pomoći. Uživajte. Obavezno javite ako se desi neki problem. EDIT: Dodao sam i naša slova u karaktere. Do sada nije ispravljalo npr. puž,danas. Sada je riješeno.
MilanRS
Citat:
<!----------------------------------------------->
<!--     Subtitle Workshop OCR Script file     -->
<!--       Copyright © 2001-2004 URUSoft       -->
<!--           http://www.urusoft.net          -->
<!--     Od ideje do realizacije: MilanRS      -->
<!----------------------------------------------->

<SWOCR WordChars="0123456789abcdefghijklmnopqrstuvwxyzABCDEFGHIJKLMNOPQRSTUVWXYZ_ńŃáéíóúÁÉÍÓÚäëďöü">
   
   <!-- Smart space after zarez -->
   <ERROR Find="[A-ZŽĆČŠĐa-zžčćšđá-úńä-ü](\,)[^(\s\n\,\?\!)]" ReplaceBy=", ">
</SWOCR>
Naslov: Odg: OCR skripta za SW
Autor: Veleno - 01.04.2008. 11:45:17
Svaka čast na ovoj skripti. Hvala.
Naslov: Odg: OCR skripta za SW
Autor: MilanRS - 01.04.2008. 18:58:48
- Više neće javljati da je Je l' pogrešno i tražiti Je I' (zaostatak iz engleske skripte).
- jel' će prijavljivati i nuditi je l'. Isto važi i za Jel', jel, Jel.
- mjenjati, promjeniti, želila "goes to": mijenjati, promijeniti, željela.
- Sada ispravlja grešku i kada je iza crtice razmak pa ŠČĆŽÐ, a do sada je radio samo za A-Z.
- Domeni pisani malim slovima: napraviće razmak iza svake tačke. Npr.
ime.domen.co.aa će biti
ime. domen. co. aa
U suprotnom bi kada neko počne rečenicu malim slovom, obrisao razmak ispred. Npr.
...nisu došli. da li su zvali? Neće promijeniti u
...nisu došli.da li su zvali? Sigurno je češći slučaj da "kucači" rečenicu napišu malim slovom nego što se pojavljuju domeni. Zato bolje da domen bude sa razmacima nego rečenice bez.
- Izuzetak su razmaci iza www. i između . i com/net/org/yu/hr
Tako da, ako napišete www.prijevodi-online.org, neće javiti grešku da nema razmaka iza tačke.
Isto važi i za www.majstorbata.com i phpbb3.majstorbata.com i za mailove, npr. pesekan@hotmail.com
Ako naletim na neke domene koji se često javljaju na kraju u prevodima, a nisu .com/net/org/yu/hr, mogu ih dodati u izuzetke.

Javite mi ako ima nešto što vam "smeta" a javlja se često u prevodima i lako se može ispraviti preko skripte. Ja ne mogu da se sjetim svega. Kad gledam neku seriju, ako primijetim da se nešto često ponavlja pogrešno, zapišem na papir pa poslije dogradim u skriptu. Tako ćemo vremenom imati sve bolju skriptu.
Update skripte je u drugom postu odozgo.
Naslov: Odg: OCR skripta za SW
Autor: Nagy - 05.04.2008. 21:18:52
Imam problem s tvojom novom skriptom, očita mi kao OCR error ono što stara skripta nije, recimo ovo:

Citat:
Rob što to radiš?
- Ništa.

I kada odem na Fix, ne dogodi se ništa, ne popravi ništa, pri slijedećem pregledu ponovno to zacrveni kao OCR grešku. A ona stara OCR skipta to ne smatra greškom. Sad, ja ne vidim u ovome ništa pogrešno, znači da ti se negdje u skripti potkrala greška.
Naslov: Odg: OCR skripta za SW
Autor: MilanRS - 08.04.2008. 18:49:11
Neko je predložio da se greškom smatra razmak iza crtice tako da ovdje vjerovatno predlaže da bude:
Rob što to radiš?
-Ništa.

Otvori skriptu i obriši ova dva reda:
<!-- Brisanje crte - na početku 2. reda -->
   <ERROR Find="[\n](- )[A-ZŠĆŽČĐ]" ReplaceBy="-">
Dosnimi izmjene i provjeri da li sada javlja grešku.
Večeras ili sutra ću postaviti novi update sa dodatim ispravkama riječi.
Naslov: Odg: OCR skripta za SW
Autor: genius - 12.04.2008. 15:40:04
Ima li tko skriptu koja će mi raditi razmak između "-" i rečenice.

Npr
Ja sam Marko
-Ja sam Ivan

da napravi ovo

Ja sam Marko
- Ja sam Ivan

Ali ako postoje rečenice u titlu između kojih postoji razmak između "-" i rečenice da mi ne napravi dupli razmak.
Naslov: Odg: OCR skripta za SW
Autor: MilanRS - 13.04.2008. 12:40:53
Po nekom standardu ne treba da bude razmak nakon crtice (tj. po ugledu na titlove HRT, RTL, NOVA, i drugih), a to sve zato da se uštedi jedan karakter u titlu pa da mogu biti veća slova.
Pošto ti želiš drugačije, treba da uradiš sljedeće.

Ako koristiš moju skriptu, pronađi ove redove i obriši ih.
   
   <!-- Brisanje razmaka iza crte - na početku 2. reda -->
   <ERROR Find="[\n](- )[A-ZŠĆŽČĐ\x22]" ReplaceBy="-">
   <!-- Korigovanje crte - kad je u sredini prvog reda -->
   <ERROR Find="[\.\?\!\x22]( - )[A-ZŠĆŽČĐ\x22]" ReplaceBy=" -">

Umjesto njih postavi ovo:
   <!-- Razmak iza crte - na početku 2. reda -->
   <ERROR Find="[\n](-)[A-ZŠĆŽČĐ\x22]" ReplaceBy="- ">
   <!-- Korigovanje crte - kad je u sredini prvog reda -->
   <ERROR Find="[\.\?\!\x22]( -)[A-ZŠĆŽČĐ\x22]" ReplaceBy=" - ">

Ako ne koristiš moju skriptu, nego default koja je došla zajedno sa programom, ili ne koristiš nijednu, a hoćeš samo tu za crte, možeš ovaj kod ispod prekopirati u notepad i snimiti kao crta.ocr i postaviti ga u C:\Program Files\URUSoft\Subtitle Workshop\OCRScripts
Nakon toga, u SW ideš na Alati, Informacije i greške, OCR skripte i odabereš 'crta'.
Pri ispravljanju razmaka, ako želiš da posmatraš kako će šta promijeniti, pritisni CTRL+I. Prikazaće ti sve greške. Klikni na prvu dva puta. Kad je pronađe u titlu, pritisni F11 i promijeniće je. Zatim idi na F12 da se selektuje sljedeći titl sa greškom. Opet F11 itd.
Kad se uvjeriš da skripta radi sve kako treba (ako ne radi, javi mi), ne moraš mijenjati red po red, nego samo kad otvoriš titl, klikneš na F9 pa F10 i ispraviće sve.

P.S. Ako koristiš default skriptu SW, ona će ti kvariti titl na nekoliko mjesta jer je prilagođena engleskom jeziku. Npr. Je l' će biti Je I' zbog njihovog pravopisa I've i sl. Tako isto i ljudi će biti Ijudi. Ja sam to sve korigovao u novoj skripti koja je u drugom postu u ovoj temi.
P.P.S. Možeš i koristiti moju skriptu bez mijenjanja ovih redova, pa nakon što ona obriše razmake iza - i uradi još neke odlične promjene, pokreneš ovu skriptu 'crta' koja će vratiti razmake iza -, ali će titl
ostati poboljšan što se tiče gramatike i pravopisa.

crta.ocr
<!----------------------------------------------->
<!--     Subtitle Workshop OCR Script file     -->
<!--               MilanRS                     -->
<!----------------------------------------------->

<SWOCR

WordChars="0123456789abcdefghijklmnopqrstuvwxyzABCDEFGHIJKLMNOPQRSTUVWXY

Z_ńŃáéíóúÁÉÍÓÚäëďöü">

<!-- Razmak iza crte - na početku 2. reda -->
<ERROR Find="[\n](-)[A-ZŠĆŽČĐ\x22]" ReplaceBy="- ">
<!-- Korigovanje crte - kad je u sredini prvog reda -->
<ERROR Find="[\.\?\!\x22]( -)[A-ZŠĆŽČĐ\x22]" ReplaceBy=" - ">
</SWOCR>
Naslov: Odg: OCR skripta za SW
Autor: MilanRS - 13.04.2008. 12:49:56
Nova promjena default skripte koja se nalazi u drugom postu ove teme.
- ispravio sam neke greške
- podešavao sam razmak iza ... i kad je ..." i da procijeni da li " pripada rečenici koja je završena ili onoj koja počinje, ako su obje u istom redu a ispred i iza " ima razmak.
- dodao sam i " pri pronalasku nepotrebnih razmaka u titlu.
Npr.
- "Ne treba razmak u ovom titlu".
biće
"Ne treba razmak u ovom titlu".
Tako isto i kod titlova sa dva reda. Briše razmak na početku drugog reda koji počinje navodnicima.

Svi prijedlozi i kritike su poželjni i dobrodošli.

P.S. U pripremi je skripta koja djelimično prebacuje titl na srpski jezik, ima preko 100 najčešćih riječi i automatsko prebacivanje glagola na ...it će. Npr. Uradit će, Napisat će, ... Uradiće, Napisaće. (uz potpuno poštovanje ravnopravnosti jezika i zahvalnost prevodiocima).
:)
Naslov: Odg: OCR skripta za SW
Autor: genius - 25.05.2008. 15:27:34
Ima li netko neku skriptu koja će detektirati svaki ponovljeni titl bez obzira koliko su razmaknuti.

Npr. SW popravi duple titlove ako je slučaj ovakav:

00:00:01,000 --> 00:00:01,010 Come on, let's book.
00:00:01,010 --> 00:00:02,000 Come on, let's book.

Ali ja želim da mi i popravi npr ovakve:

00:00:01,000 --> 00:00:01,010 Come on, let's book.
00:00:03,010  --> 00:00:06,000 Come on, let's book.

Ako je prevelika razlika u vremenu između 2 jednaka titla, onda ih SW ne detektira kao dupli titl, a ja želim da detektira dupli titl bez obzira koliko bili razmaknuti.

Poslije lako mogu popraviti ako predugo traju...

Naslov: Odg: OCR skripta za SW
Autor: kugi001 - 25.05.2008. 18:09:49
Ima li netko neku skriptu koja će detektirati svaki ponovljeni titl bez obzira koliko su razmaknuti.

Npr. SW popravi duple titlove ako je slučaj ovakav:

00:00:01,000 --> 00:00:01,010 Come on, let's book.
00:00:01,010 --> 00:00:02,000 Come on, let's book.

Ali ja želim da mi i popravi npr ovakve:

00:00:01,000 --> 00:00:01,010 Come on, let's book.
00:00:03,010  --> 00:00:06,000 Come on, let's book.

Ako je prevelika razlika u vremenu između 2 jednaka titla, onda ih SW ne detektira kao dupli titl, a ja želim da detektira dupli titl bez obzira koliko bili razmaknuti.

Poslije lako mogu popraviti ako predugo traju...

ova skripta spaja duple titlove samo ako je razmak manji od sekunde (tvoj prvi slucaj).
// program spaja linije prijevoda
// koje imaju isti tekst, a da razmak između
// dva takva susjedna titla nije veći od 1s

program JoinSameSubtitles;

var
text1 : String;
text2 : String;
textIndex : Integer;
//offset : Integer;
initialtime : Integer;
finaltime : Integer;

begin
//offset := 0;
for textIndex := 0 to (GetSubtitleCount - 1) do
begin
text1 := '';
text2 := '';
text1 := GetSubtitleText(textIndex);
text2 := GetSubtitleText(textIndex+1);
if text1 = text2 then
begin
finaltime := GetSubtitleFinalTime(textIndex);
initialtime := GetSubtitleInitialTime(textIndex+1);
if (initialtime - finaltime) <= 1000 then
begin
        initialtime := GetSubtitleInitialTime(textIndex);
finaltime := GetSubtitleFinalTime(textIndex+1);
SetSubtitleInitialTime(textIndex, initialtime);
SetSubtitleFinalTime(textIndex, finaltime);
DeleteSubtitle(textIndex+1);
textIndex := textIndex - 1;
//offset := offset + 1;
end;
end;
end;
end.


Ako želiš da ti radi i za ovaj drugi slučaj zakomentiraj ovu liniju koda:
//if (initialtime - finaltime) <= 1000 then
Naslov: Odg: OCR skripta za SW
Autor: genius - 25.05.2008. 19:58:21
thx

ali da li bi se mogla napraviti ocr skripta za to. Ja bih volio vidjeti mjesta gdje je bio taj dupli titl.
Naslov: Odg: OCR skripta za SW
Autor: kugi001 - 25.05.2008. 21:59:28
thx

ali da li bi se mogla napraviti ocr skripta za to. Ja bih volio vidjeti mjesta gdje je bio taj dupli titl.

aha, mislio sam da želiš da ti se odmaj spoje ti titlovi. Za ocr skriptu ne znam, nisam to proučavao.
Recimo možeš u gornjoj skripti promijeniti:
...
SetSubtitleFinalTime(textIndex, finaltime);
Insert('<b>',text1,1);
SetSubtitleText(textIndex,text1);
//DeleteSubtitle(textIndex+1);
...

znaci boldano će ti obilježiti titlove koje bi trebalo spojiti, tj. samo prvog od njih.
Poslije možeš obrisati <b> tagove.
Naslov: Odg: OCR skripta za SW
Autor: Strider - 10.06.2008. 22:38:41
Evo "male" RegEx skripte za popravak na hrvatski jezik. Uključuje OCR grešku "I", "L", "l" i hrvatsko pravilo za "s" i "sa".
Nije baš dorađena, al' potrudit ću se u dogledno vrijeme... Nadam se da će nekome poslužiti  8)

<!----------------------------------------------->
<!--     Subtitle Workshop OCR Script file     -->
<!--       Copyright © 2001-2004 URUSoft       -->
<!--           http://www.urusoft.net          -->
<!--                                           -->
<!-- Default values:                           -->
<!--                                           -->
<!-- UseRE = True (use Regular Expressions)    -->
<!-- UseREOnlyToFind = True (put the part that -->
<!-- is not a RE between parenthesis!)         -->
<!--                                           -->
<!-- If UseRE is set to false then you can use -->
<!-- the following parameters, otherwise they  -->
<!-- will be ignored:                          -->
<!--                                           -->
<!--    CaseSensitive  (Default = False)       -->
<!--    WholeWord      (Default = False)       -->
<!--    PreserveCase   (Default = False)       -->
<!-- ----------------------------------------- -->

<SWOCR WordChars="0123456789abcdefghijklmnopqrstuvwxyzABCDEFGHIJKLMNOPQRSTUVWXYZ_ńŃáéíóúÁÉÍÓÚäëďöü">

<!-- Npr. "O'NeiII" by "O'Neill" -->
<ERROR Find="[a-zá-ú][a-zá-ú](II)" ReplaceBy="ll">
<ERROR Find="(II)[a-zá-ú][a-zá-ú]" ReplaceBy="ll">
<ERROR Find="\b(II)[i]\b" ReplaceBy="Il">
<ERROR Find="\b(ll)[i]\b" ReplaceBy="Il">
<!-- Zamijeni sva "l" s "I" na početku riječi s velikim slovima -->
<ERROR Find="\b(l)[A-ZĆČĐŠŽ]" ReplaceBy="I">
<!-- Zamijeni sva "l" s "I" unutar riječi s velikim slovima -->
<ERROR Find="[A-ZĆČĐŠŽ](l)[A-ZĆČĐŠŽ]" ReplaceBy="I">
<!-- Zamijeni sva "l" s "I" na kraju riječi s velikim slovima -->
<ERROR Find="[A-ZĆČĐŠŽ][A-ZĆČĐŠŽ](l)" ReplaceBy="I">
<!-- Zamijeni sva "I" s "l" unutar riječi s malim slovima ili prvoj riječi u rečenici -->
<ERROR Find="[A-ZĆČĐŠŽa-zćčđšž](I)[a-zćčđšž]" ReplaceBy="l">
<!-- Zamijeni sva "I" s "l" na kraju riječi s malim slovima (uključujući znakove interpunkcije na kraju) -->
<ERROR Find="[a-zćčđšž](I)[a-zćčđšž\s\.!?:;,'\x22)]" ReplaceBy="l">
<ERROR Find="[a-zćčđšž](I)" ReplaceBy="l">
<!-- Zamijeni sva "I" s "l" unutar riječi s hrvatskim znakovima -->
<ERROR Find="[A-Za-zĆČĐŠŽćčđšž](I)[a-zćčđšž]" ReplaceBy="l">
<!-- Zamijeni sva "L" s "I" na početku riječi kada slijedi bilo koje slovo osim "aeiouj" -->
<ERROR Find="\b(L)[bcdfghklmnprstvz\ćčđšž]" ReplaceBy="I">
<!-- Zamijeni sva "l" s "I" na početku riječi kada slijedi bilo koje slovo osim "aeiouj" -->
<ERROR Find="\b(l)[bcdfghklmnprstvz\ćčđšž]" ReplaceBy="I">
<!-- Zamijeni sva "I" s "l" na početku riječi kada slijedi "aeiouj" -->
<ERROR Find="\b(I)[aeijou]" ReplaceBy="l">

<!-- Zamijeni sva sama "l" s "I" -->
<ERROR Find="\b(l)\b" ReplaceBy="I">
<!-- Zamijeni sva sama "I" s "i" ako prethode i slijede mala slova -->
<ERROR Find="[a-zćčđšž]( I )[a-zćčđšž]" ReplaceBy=" i ">

<!-- Izbriši razmak ispred dvotočke ako prethodi broj "1 :", "2 :"... "n :" s "n:" -->
<ERROR Find="\d( :)" ReplaceBy=":">
<!-- Zamijeni ",,," ili više sa "..." -->
<ERROR UseREOnlyToFind="False" Find=",{2,}" ReplaceBy="...">
<!-- "--" ili više sa "..." -->
<ERROR UseREOnlyToFind="False" Find="-{2,}" ReplaceBy="...">

<!-- Navodnici i apostrofi ("\x22" je '"' navodnik) -->
<ERROR Find="(“)" ReplaceBy=""">
<ERROR Find="(”)" ReplaceBy=""">
<ERROR Find="(`)" ReplaceBy="'">
<ERROR Find="(´)" ReplaceBy="'">
<ERROR Find="(‘)" ReplaceBy="'">
<ERROR Find="(’)" ReplaceBy="'">
<ERROR UseREOnlyToFind="False" Find="''" ReplaceBy=""">
<!-- '"' dva puta ili više zamijeni s jednim '"' -->
<ERROR UseREOnlyToFind="False" Find="\x22{2,}" ReplaceBy=""">

<!-- Razmak iza apostrofa, npr. "I' d" to "I'd", "I' LL" to "I'LL", etc. -->
<ERROR Find="(?i)[A-ZÁ-Úa-zá-ú]('\s|\s')(ll|ve|s|m|d)\b" ReplaceBy="'">
<!-- F "Hasn 't" and "Hasn' t" -->
<ERROR Find="[\.\s](')" ReplaceBy="'">
<!-- <ERROR Find="(?i)[A-ZÁ-Úa-zá-ú]('\s|\s')t\b" ReplaceBy="'"> -->
<!-- Zamijeni sva "I'" s "l'" -->
<ERROR Find="(I)[\']" ReplaceBy="l">

<!-- Zamijeni sve glagole s 5 i više slova "**(a)(e)(i)ti ću" s "**(a)(e)(i)t ću" i "**(a)(e)(i)ti će*" s "**(a)(e)(i)t će*" -->
<!-- Glagoli i imenice s četiri slova koja završavaju na "ati" su izuzeci i ne mijenjanju se!!! (ćati, dati, lati, mati, rati, sati, tati, vati) -->
<!-- Riječi s četiri slova koja završavaju na "eti" su izuzeci i ne mijenjanju se!!! (četi, meti, peti, teti) -->
<ERROR Find="[A-Za-zćčđšž][a-zćčđšž][a|e|i](ti )ć[eu]" ReplaceBy="t ">
<ERROR Find="[A-Za-zćčđšž][a-zćčđšž][a|e|i](ti)\r?\nć[eu]" ReplaceBy="t">
<!-- Izuzeci su  glagoli s četiri slova koji se mijenjaju (žeti, biti, liti, miti, piti, riti, šiti, viti) ! -->
<ERROR Find="\b[ž|Ž](eti )ć[eu]" ReplaceBy="et ">
<ERROR Find="\b[ž|Ž](eti)\r?\nć[eu]" ReplaceBy="et">
<ERROR Find="\b[b|B|l|L|m|M|p|P|r|R|š|Š|v|V](iti )ć[eu]" ReplaceBy="it ">
<ERROR Find="\b[b|B|l|L|m|M|p|P|r|R|š|Š|v|V](iti)\r?\nć[eu]" ReplaceBy="it">

<!-- Izuzeci koji se ne mijenjaju: -->
<!-- Ostaje "niti ću (ćeš, će, ćemo, ćete)" -->
<ERROR Find="(?i)\bni(t )ć[eu]" ReplaceBy="ti ">
<ERROR Find="(?i)\bni(t)\r?\nć[eu]" ReplaceBy="ti">
<!-- Ostaje "naniti će" (SF serije: naniti ili nanoboti) -->
<ERROR Find="(nanit )će\b" ReplaceBy="naniti ">
<ERROR Find="(nanit)\r?\nće\b" ReplaceBy="naniti">
<!-- Ostaje "uvjeti će" -->
<ERROR Find="(?i)\buvje(t )će" ReplaceBy="ti ">
<ERROR Find="(?i)\buvje(t)\r?\nće" ReplaceBy="ti">



<!-- Izuzeci koji se ne mijenjaju, dodaje se "t": -->
<!-- Mijenja se "pati ću (ćeš, će, ćemo, ćete)" u "patit ću (ćeš, će, ćemo, ćete)" -->
<ERROR Find="(?i)\b(pati )ć[eu]" ReplaceBy="patit ">
<ERROR Find="(?i)\b(pati)\r?\nć[eu]" ReplaceBy="patit">
<!-- Mijenja se "jati ću (ćeš, će, ćemo, ćete)" u "jatit ću (ćeš, će, ćemo, ćete)" -->
<ERROR Find="(?i)\b(jati )ć[eu]" ReplaceBy="jatit ">
<ERROR Find="(?i)\b(jati)\r?\nć[eu]" ReplaceBy="jatit">
<!-- Mijenja se "leti ću (ćeš, će, ćemo, ćete)" u "letjet ću (ćeš, će, ćemo, ćete)" -->
<ERROR Find="(?i)\b(leti )ć[eu]" ReplaceBy="letjet ">
<ERROR Find="(?i)\b(leti)\r?\nć[eu]" ReplaceBy="letjet">
<!-- Mijenja se "hiti ću (ćeš, će, ćemo, ćete)" u "hitit ću (ćeš, će, ćemo, ćete)" -->
<ERROR Find="(?i)\b(hiti )ć[eu]" ReplaceBy="hitit ">
<ERROR Find="(?i)\b(hiti)\r?\nć[eu]" ReplaceBy="hitit">
<!-- Mijenja se "kiti ću (ćeš, će, ćemo, ćete)" u "kitit ću (ćeš, će, ćemo, ćete)" -->
<ERROR Find="(?i)\b(kiti )ć[eu]" ReplaceBy="kitit ">
<ERROR Find="(?i)\b(kiti)\r?\nć[eu]" ReplaceBy="kitit">

<!-- Zamijeni sva "S" i "s" sa "SA", "Sa" i "sa" kad su na kraju prvog reda -->
<ERROR Find="\b(s)\b\r?\n" ReplaceBy="sa"> <!-- radi -->
<ERROR Find="[a-z]\s\b(S)\b\r?\n[a-z]" ReplaceBy="sa"> <!-- radi -->
<ERROR Find="[A-Z]\s\b(S)\b\r?\n[a-z]" ReplaceBy="SA"> <!-- radi -->
<ERROR Find="\b(S)\b\r?\n" ReplaceBy="Sa"> <!-- radi -->
<ERROR Find="\b(Sa)\b\r?\n[A-Z][A-Z]" ReplaceBy="SA"> <!-- radi -->
<ERROR Find="\b(Sa)\b\r?\n\x22[A-Z][A-Z]" ReplaceBy="SA"> <!-- radi -->
<!-- ovaj dio mora biti ispred ostalih "s" i "sa" -->
<!-- inače (s)\r?\n -> "sa" mijenja npr. "s"(novi red)"stilom" u "sa"(novi red)"satilom" -->



<!-- Zamijeni sva "Sa" i "sa" sa "S" i "s" ako ne slijedi riječ sa "š,Š,s,S,z,Z,ž,Ž,6,7" -->
<ERROR Find="\b(sa)\b\s[^sSšŠzZžŽ67\r?\n]" ReplaceBy="s">
<ERROR Find="\b(s \x22)[sSšŠzZžŽ67]" ReplaceBy="sa "">
<ERROR Find="\b(Sa)\b\s[^sSšŠzZžŽ67\r?\n]" ReplaceBy="S">
<ERROR Find="\b(SA)\b\s[^sSšŠzZžŽ67\r?\n]" ReplaceBy="S">
<ERROR Find="\b(S \x22)[sšzž67]" ReplaceBy="Sa "">
<ERROR Find="\b(S \x22)[SŠZŽ][a-z]" ReplaceBy="Sa "">
<ERROR Find="\b(S \x22)[SŠZŽ]" ReplaceBy="SA "">

<ERROR Find="\b(sa)\r?\n[^sSšŠzZžŽ67\x22]" ReplaceBy="s">
<ERROR Find="\b(sa)\r?\n\x22[abcčćdđefghijklmnopqrtuvwxyABCČĆDĐEFGHIJKLMNOPQRSTUVWXYZŽ]" ReplaceBy="s">
<ERROR Find="\b(s)\r?\n\x22[SšŠzZžŽ67]" ReplaceBy="sa">
<ERROR Find="\b(Sa)\r?\n[^sSšŠzZžŽ67\x22]" ReplaceBy="S">
<ERROR Find="\b(Sa)\r?\n\x22[abcčćdđefghijklmnopqrtuvwxyABCČĆDĐEFGHIJKLMNOPQRTUVWXYZŽ]" ReplaceBy="S">
<ERROR Find="\b(SA)\r?\n[^sSšŠzZžŽ67\x22]" ReplaceBy="S">
<ERROR Find="\b(SA)\r?\n\x22[abcčćdđefghijklmnopqrstuvwxyABCČĆDĐEFGHIJKLMNOPQRTUVWXYZŽ]" ReplaceBy="S">
<ERROR Find="\b(S)\r?\n\x22[sšzž67]" ReplaceBy="Sa">
<ERROR Find="\b(S)\r?\n\x22[SŠZŽ]" ReplaceBy="SA">
<ERROR Find="\b(S)\r?\n\x22[SŠZŽ][a-z]" ReplaceBy="Sa">

<!-- Zamijeni sva "S" i "s" sa "Sa" i "sa" ako slijedi riječ sa "š,Š,z,Z,ž,Ž,s,S" ili broj "6, 7, 6x, 7x, 16, 17, 1xx, 1xxx..." -->
<ERROR Find="\b(S )\b[šzžs][a-z]" ReplaceBy="Sa ">
<ERROR Find="\b(S )\b[ŠZŽS][a-z]" ReplaceBy="Sa ">
<ERROR Find="\b(S )\b[ŠZŽS][A-Z]" ReplaceBy="SA ">
<ERROR Find="\b(s )\b[šŠzZžŽsS67]" ReplaceBy="sa ">
<!-- ...bilo koji broj u istom redu koji počinje sa 6 ili 7 -->
<ERROR Find="[A-Z]( S )[67]" ReplaceBy=" SA ">
<ERROR Find="\b(S )[67]" ReplaceBy="Sa ">
<!-- ...16 ili 17 u istom redu -->
<ERROR Find="\b(s 1)[67]\b" ReplaceBy="sa 1">
<ERROR Find="[A-Z]( S 1)[67]\b" ReplaceBy=" SA 1">
<ERROR Find="\b(S 1)[67]\b" ReplaceBy="Sa 1">
<!-- ...stotice u istom redu koje počinju sa 1 -->
<ERROR Find="\b(s )[1][0-9][0-9]\b" ReplaceBy="sa ">
<ERROR Find="[A-Z]( S )[1][0-9][0-9]\b" ReplaceBy=" SA ">
<ERROR Find="\b(S )[1][0-9][0-9]\b" ReplaceBy="Sa ">
<!-- ... 100000 u istom redu - 100000000 nisu uključeni jer se obično pišu s točkama: 100.000.000 :-) -->
<ERROR Find="\b(s )[1][0-9][0-9][0-9][0-9][0-9]\b" ReplaceBy="sa ">
<ERROR Find="[A-Z]( S )[1][0-9][0-9][0-9][0-9][0-9]\b" ReplaceBy=" SA ">
<ERROR Find="\b(S )[1][0-9][0-9][0-9][0-9][0-9]\b" ReplaceBy="Sa ">

<!-- Zamijeni sva "S" i "s" sa "Sa" i "sa" ako slijedi broj "6, 7, 6x, 7x, 16, 17, 1xx, 1xxx..." U DRUGOM REDU -->
<!-- ...bilo koji broj u drugom redu koji počinje sa 6 ili 7 -->
<ERROR Find="\b(s)\b\r?\n[67]" ReplaceBy="sa">
<ERROR Find="[A-Z]( S)\r?\n[67]" ReplaceBy=" SA">
<ERROR Find="\b(S)\r?\n[67]" ReplaceBy="Sa">
<!-- ...16 ili 17 u drugom redu -->
<ERROR Find="\b(s)\r?\n[1][67]\b" ReplaceBy="sa">
<ERROR Find="[A-Z]( S)\r?\n[1][67]\b" ReplaceBy=" SA">
<ERROR Find="\b(S)\r?\n[1][67]\b" ReplaceBy="Sa">
<!-- ...stotice u drugom redu koje počinju s 1 -->
<ERROR Find="\b(s)\r?\n[1][0-9][0-9]\b" ReplaceBy="sa">
<ERROR Find="[A-Z]( S)\r?\n[1][0-9][0-9]\b" ReplaceBy=" SA">
<ERROR Find="\b(S)\r?\n[1][0-9][0-9]\b" ReplaceBy="Sa">
<!-- ... 100000 u drugom redu  - 100000000 nisu uključeni jer se obično pišu s točkama: 100.000.000 :-) -->
<ERROR Find="\b(s)\r?\n[1][0-9][0-9][0-9][0-9][0-9]\b" ReplaceBy="sa">
<ERROR Find="[A-Z]( S)\r?\n[1][0-9][0-9][0-9][0-9][0-9]\b" ReplaceBy=" SA">
<ERROR Find="\b(S)\r?\n[1][0-9][0-9][0-9][0-9][0-9]\b" ReplaceBy="Sa">

<!-- Zamijeni sva "S" i "s" sa "Sa" i "sa" ako slijedi riječ "mnom" -->
<ERROR Find="\b(s)\b\s(\mnom)\b" ReplaceBy="sa">
<ERROR Find="\b(S)\b\s(\mnom)\b" ReplaceBy="Sa">
<ERROR Find="\b(S)\b\s(\MNOM)\b" ReplaceBy="SA">
<ERROR Find="\b(s ili bez)\b" ReplaceBy="sa ili bez">
<ERROR Find="\b(S ili bez)\b" ReplaceBy="Sa ili bez">
<!-- Zamijeni sva "S" i "s" sa "Sa" i "sa" ako slijedi riječ "mnom" U DRUGOM REDU -->
<ERROR Find="\b(s)\r?\n(\mnom)\b" ReplaceBy="sa">
<ERROR Find="\b(S)\r?\n(\mnom)\b" ReplaceBy="Sa">
<ERROR Find="\b(S)\r?\n(\MNOM)\b" ReplaceBy="SA">
<ERROR Find="\b(s)\r?\n(ili bez)\b" ReplaceBy="sa">
<ERROR Find="\b(S)\r?\n(ili bez)\b" ReplaceBy="Sa">

<!-- Zamijeni sva "samnom" u "sa mnom" -->
<ERROR Find="\b(samnom)\b" ReplaceBy="sa mnom">
<ERROR Find="\b(Samnom)\b" ReplaceBy="Sa mnom">
<ERROR Find="\b(SAMNOM)\b" ReplaceBy="SA MNOM">

<!-- Zamijeni sva "S" i "s" sa "Sa" i "sa" ako slijedi riječ "ps..." ili "ks..." -->
<ERROR Find="\b(s ps)" ReplaceBy="sa ps">
  <ERROR Find="\b(s Ps)" ReplaceBy="sa Ps">
  <ERROR Find="\b(S ps)" ReplaceBy="Sa ps">
  <ERROR Find="\b(S Ps)" ReplaceBy="Sa Ps">
  <ERROR Find="\b(S PS)" ReplaceBy="SA PS">
  <ERROR Find="\b(s ks)" ReplaceBy="sa ks">
  <ERROR Find="\b(s Ks)" ReplaceBy="sa Ks">
  <ERROR Find="\b(S Ks)" ReplaceBy="Sa Ks">
<ERROR Find="\b(S ks)" ReplaceBy="Sa ks">
  <ERROR Find="\b(S KS)" ReplaceBy="SA KS">
<ERROR Find="\b(s)\b\r?\n(\ps)" ReplaceBy="sa">
<ERROR Find="\bsa\b\r?\n(psa)" ReplaceBy="ps">
<ERROR Find="\b(s)\b\r?\n(\Ps)" ReplaceBy="sa">
<ERROR Find="\bsa\b\r?\n(Psa)" ReplaceBy="Ps">
<ERROR Find="\b(S)\b\r?\n(\ps)" ReplaceBy="Sa">
<ERROR Find="\b(S)\b\r?\n(\PS)" ReplaceBy="SA">
<ERROR Find="\bSA\b\r?\n(PSA)" ReplaceBy="PS">
<ERROR Find="\b(S)\b\r?\n(\Ps)" ReplaceBy="Sa">
<ERROR Find="\b(s)\b\r?\n(\PS)" ReplaceBy="sa">
<ERROR Find="\b(s)\b\r?\n(\ks)" ReplaceBy="sa">
<ERROR Find="\bsa\b\r?\n(ksa)" ReplaceBy="ks">
<ERROR Find="\b(s)\b\r?\n(\Ks)" ReplaceBy="sa">
<ERROR Find="\bsa\b\r?\n(Ksa)" ReplaceBy="Ks">
<ERROR Find="\b(S)\b\r?\n(\ks)" ReplaceBy="Sa">
<ERROR Find="\b(S)\b\r?\n(\KS)" ReplaceBy="SA">
<ERROR Find="\bSA\b\r?\n(KSA)" ReplaceBy="KS">
<ERROR Find="\b(S)\b\r?\n(\Ks)" ReplaceBy="Sa">
<ERROR Find="\b(s)\b\r?\n(\KS)" ReplaceBy="sa">

<!-- Rijetkosti -->
<!-- Izuzetak za "I" s "l" kada slijedi: Ionako, Ijedan, Iole -->
<ERROR Find="\b(lonako)\b" ReplaceBy="Ionako">
<ERROR Find="\b(ljedan)\b" ReplaceBy="Ijedan">
<ERROR Find="\b(ljedn)" ReplaceBy="Ijedn">
<ERROR Find="\b(lole)\b" ReplaceBy="Iole">
<ERROR Find="[\.][\s](lako)\b" ReplaceBy="Iako">
<ERROR Find="(-lako)\b" ReplaceBy="-Iako">
<ERROR Find="(- lako)\b" ReplaceBy="- Iako">
<ERROR Find="[a-z][\s](Iako)\b" ReplaceBy="lako">
  <ERROR Find="\.\r?\n(lako)\b" ReplaceBy="Iako">
  <ERROR Find="^(lako)\b" ReplaceBy="Iako">
<ERROR Find="\b(lon)\b" ReplaceBy="Ion">
<ERROR Find="\b(lons)" ReplaceBy="Ions">
<ERROR Find="\b(loni)" ReplaceBy="Ioni">
<ERROR Find="\b(lono)" ReplaceBy="Iono">
<ERROR Find="\b(Mls)" ReplaceBy="Mis">
<ERROR Find="\b(Nlj)" ReplaceBy="Nij">
<ERROR Find="\b(Nlk)" ReplaceBy="Nik">
<ERROR Find="\b(Nls)" ReplaceBy="Nis">
<ERROR Find="\b(Nlš)" ReplaceBy="Niš">
<ERROR Find="\b(ALi)" ReplaceBy="Ali">

<!-- Kad se NEODREĐENE ZAMJENICE slažu s veznicima i, ni (itko, išta, ikakav, nitko, ništa, nikakav…) -->
<!-- koriste se s prijedlozima te se oni umeću između veznika i odnosne zamjenice -->
<ERROR Find="\b(od nikoga)\b" ReplaceBy="ni od koga">
<ERROR UseReOnlyToFind="False" Find="\b(od)\r?\n(nikoga)\b" ReplaceBy="ni od koga">
<ERROR Find="\b(za ništa)\b" ReplaceBy="ni za što">
<ERROR UseReOnlyToFind="False" Find="\b(za)\r?\n(ništa)\b" ReplaceBy="ni za što">
<ERROR Find="\b(pred ičim)\b" ReplaceBy="i pred čim">
<ERROR UseReOnlyToFind="False" Find="\b(pred)\r?\n(ičim)\b" ReplaceBy="i pred čim">
<ERROR Find="\b(pred ničim)\b" ReplaceBy="ni pred čim">
<ERROR UseReOnlyToFind="False" Find="\b(pred)\r?\n(ničim)\b" ReplaceBy="ni pred čim">
<ERROR Find="\b(s nikakvim)\b" ReplaceBy="ni s kakvim">
<ERROR UseReOnlyToFind="False" Find="\b(s)\r?\n(nikakvim)\b" ReplaceBy="ni s kakvim">
<ERROR Find="\b(s nikim)\b" ReplaceBy="ni s kim">
<ERROR UseReOnlyToFind="False" Find="\b(s)\r?\n(nikim)\b" ReplaceBy="ni s kim">
<ERROR Find="\b(s ikim)\b" ReplaceBy="i s kim">
<ERROR UseReOnlyToFind="False" Find="\b(s)\r?\n(ikim)\b" ReplaceBy="i s kim">
<ERROR Find="\b(uz nikakav)\b" ReplaceBy="ni uz kakav">
<ERROR UseReOnlyToFind="False" Find="\b(uz)\r?\n(nikakav)\b" ReplaceBy="ni uz kakav">
<ERROR Find="\b(zbog ničega)\b" ReplaceBy="ni zbog čega">
<ERROR UseReOnlyToFind="False" Find="\b(zbog)\r?\n(ničega)\b" ReplaceBy="ni zbog čega">

<!-- <ERROR Find="\b(III)\b" ReplaceBy="III"> -->

<!-- Lokacija u USA "Iowa" -->
<ERROR Find="\b(lowa)\b" ReplaceBy="Iowa">
<ERROR Find="\b(lowe)\b" ReplaceBy="Iowe">
<ERROR Find="\b(lowi)\b" ReplaceBy="Iowi">
<ERROR Find="\b(lowu)\b" ReplaceBy="Iowu">

<!-- Ime ili prezime "Lloyd" -->
<ERROR Find="\b(Iloyd)" ReplaceBy="Lloyd"> -->

<!-- Ispravak nule i velikog 'O' -->
<ERROR Find="[0-9](O)" ReplaceBy="0">
<ERROR Find="[0-9](\.O)" ReplaceBy=".0">
<ERROR Find="[0-9](,O)" ReplaceBy=",0">
<ERROR Find="[A-Z](0)" ReplaceBy="O">
<ERROR Find="\b(0)[A-Za-z]" ReplaceBy="O">

<!-- Briši razmak ispred zareza -->
<ERROR Find="[A-ZĆČĐŠŽa-zćčđšž]( ,)" ReplaceBy=",">
<!-- Dodaj razmak iza zareza -->
<ERROR Find="(,)[A-ZĆČĐŠŽa-zćčđšž]" ReplaceBy=", ">

<!-- Razmak iza točke -->
<!-- <ERROR Find="[a-su-zá-úńä-ü](\.)[^(\s\n\.\*\?\!\x22\,)]" ReplaceBy=". "> --> <!-- osim kad je zadnje t (rijec kolt) -->
<!-- Oznaka za kalibar. Npr. "Colt .45" -->
<!-- Da bi radilo, da bi ovaj razmak bio dopušten, u SW idite Alt+I i odčekirajte "Razmaci ispred točke" -->
<ERROR Find="(t\.)[0-9][0-9]" ReplaceBy="t .">
<!-- Razmak iza uzastopnih točaka (npr. "...") -->
  <ERROR Find="(\.\.)[^(\x22\s\n\.\?\!\,)]" ReplaceBy=".. ">
<!-- Razmak iza 3 točke ("...") -->
<ERROR Find="(\.\.\.)[\x22][a-z]" ReplaceBy="... ">
  <ERROR Find="(\.\.\.)[^(\x22\s\n\.\?\!\,)]" ReplaceBy="... ">

<!-- Zamijeni dvije točke trima ("..")->("...") -->
<ERROR Find="^(\.\.)[^\.]" ReplaceBy="..."> <!-- na početku 1. reda, ne slijedi točka -->
<ERROR Find="[^\.](\.\.)[^\.]" ReplaceBy="..."> <!-- ne prethodi i ne slijedi točka -->
<ERROR Find="[^\.](\.\.)$" ReplaceBy="..."> <!-- ne prethodi točka, na kraju reda -->

<!-- Briši razmak iza "..." kad je na početku 1. reda. Izbrišite ovu liniju ukoliko vam ne odgovara -->
<ERROR UseREOnlyToFind="False" Find="^(\.\.\.) " ReplaceBy="...">
<ERROR UseREOnlyToFind="False" Find="^(\x22\.\.\.) " ReplaceBy=""...">
<!-- Briši razmak iza "..." kad je na početku 2. reda. Izbrišite ovu liniju ukoliko vam ne odgovara -->
<ERROR Find="\r?\n(\.\.\.\s)" ReplaceBy="...">
<ERROR Find="\r?\n\x22(\.\.\.\s)" ReplaceBy="...">
<!-- Briši "," prije "..." -->
<ERROR Find="(\,\.\.\.)" ReplaceBy="...">
<!-- Briši "," poslije "..." -->
<ERROR Find="(\.\.\.\,)" ReplaceBy="...">
<!-- Briši "- " prije "..." -->
<ERROR Find="(\-\s\.\.\.)" ReplaceBy="-...">
<ERROR Find="(\-\.\.\.\s)" ReplaceBy="-...">
<!-- Zamijeni "- -" sa "..." -->
<ERROR Find="(\-\s\-)" ReplaceBy="... ">

</SWOCR>

Zadnji update: 24/12/2011
Naslov: Odg: OCR skripta za SW
Autor: Strider - 14.06.2008. 16:49:07
Za sve one kojima smeta kada se ne poštuje pravilo koje kaže:
"Specifična futuru prvom jest morfološka promjena koja nastaje u inverziji pomoćnog glagola i infinitiva, pa glagoli čiji infinitiv završava s -ti gube dio infinitivnog nastavka" (ufff),
tj (npr.):
pogrešno: raditi ću, raditi ćeš, raditi će, raditi ćemo, raditi ćete, raditi će
ispravno: radit ću, radit ćeš, radit će, radit ćemo, radit ćete, radit će
...evo RegEx skripte za SW, koja to ispravlja...

<!----------------------------------------------->
<!--     Subtitle Workshop OCR Script file     -->
<!--       Copyright © 2001-2004 URUSoft       -->
<!--           http://www.urusoft.net          -->
<!--                                           -->
<!-- Default values:                           -->
<!--                                           -->
<!-- UseRE = True (use Regular Expressions)    -->
<!-- UseREOnlyToFind = True (put the part that -->
<!-- is not a RE between parenthesis!)         -->
<!--                                           -->
<!-- If UseRE is set to false then you can use -->
<!-- the following parameters, otherwise they  -->
<!-- will be ignored:                          -->
<!--                                           -->
<!--    CaseSensitive  (Default = False)       -->
<!--    WholeWord      (Default = False)       -->
<!--    PreserveCase   (Default = False)       -->
<!-- ----------------------------------------- -->

<SWOCR WordChars="0123456789abcdefghijklmnopqrstuvwxyzABCDEFGHIJKLMNOPQRSTUVWXYZ_ńŃáéíóúÁÉÍÓÚäëďöü">

<!-- Zamijeni sve glagole s 5 i više slova "**(a)(e)(i)ti ću" s "**(a)(e)(i)t ću" i "**(a)(e)(i)ti će*" s "**(a)(e)(i)t će*" -->
<!-- Glagoli i imenice s četiri slova koja završavaju na "ati" su izuzeci i ne mijenjanju se!!! (ćati, dati, lati, mati, rati, sati, tati, vati) -->
<!-- Riječi s četiri slova koja završavaju na "eti" su izuzeci i ne mijenjanju se!!! (četi, meti, peti, teti) -->
<ERROR Find="[A-Za-zćčđšž][a-zćčđšž][a|e|i](ti )ć[eu]" ReplaceBy="t ">
<ERROR Find="[A-Za-zćčđšž][a-zćčđšž][a|e|i](ti)\r?\nć[eu]" ReplaceBy="t">
<!-- Izuzeci su  glagoli s četiri slova koji se mijenjaju (žeti, biti, liti, miti, piti, riti, šiti, viti) ! -->
<ERROR Find="\b[ž|Ž](eti )ć[eu]" ReplaceBy="et ">
<ERROR Find="\b[ž|Ž](eti)\r?\nć[eu]" ReplaceBy="et">
<ERROR Find="\b[b|B|l|L|m|M|p|P|r|R|š|Š|v|V](iti )ć[eu]" ReplaceBy="it ">
<ERROR Find="\b[b|B|l|L|m|M|p|P|r|R|š|Š|v|V](iti)\r?\nć[eu]" ReplaceBy="it">

<!-- Izuzeci koji se ne mijenjaju: -->
<!-- Ostaje "niti ću (ćeš, će, ćemo, ćete)" -->
<ERROR Find="(?i)\bni(t )ć[eu]" ReplaceBy="ti ">
<ERROR Find="(?i)\bni(t)\r?\nć[eu]" ReplaceBy="ti">
<!-- Ostaje "naniti će" (SF serije: naniti ili nanoboti) -->
<ERROR Find="(nanit )će\b" ReplaceBy="naniti ">
<ERROR Find="(nanit)\r?\nće\b" ReplaceBy="naniti">
<!-- Ostaje "uvjeti će" -->
<ERROR Find="(?i)\buvje(t )će" ReplaceBy="ti ">
<ERROR Find="(?i)\buvje(t)\r?\nće" ReplaceBy="ti">


<!-- Izuzeci koji se ne mijenjaju, dodaje se "t": -->
<!-- Mijenja se "pati ću (ćeš, će, ćemo, ćete)" u "patit ću (ćeš, će, ćemo, ćete)" -->
<ERROR Find="(?i)\b(pati )ć[eu]" ReplaceBy="patit ">
<ERROR Find="(?i)\b(pati)\r?\nć[eu]" ReplaceBy="patit">
<!-- Mijenja se "jati ću (ćeš, će, ćemo, ćete)" u "jatit ću (ćeš, će, ćemo, ćete)" -->
<ERROR Find="(?i)\b(jati )ć[eu]" ReplaceBy="jatit ">
<ERROR Find="(?i)\b(jati)\r?\nć[eu]" ReplaceBy="jatit">
<!-- Mijenja se "leti ću (ćeš, će, ćemo, ćete)" u "letjet ću (ćeš, će, ćemo, ćete)" -->
<ERROR Find="(?i)\b(leti )ć[eu]" ReplaceBy="letjet ">
<ERROR Find="(?i)\b(leti)\r?\nć[eu]" ReplaceBy="letjet">
<!-- Mijenja se "hiti ću (ćeš, će, ćemo, ćete)" u "hitit ću (ćeš, će, ćemo, ćete)" -->
<ERROR Find="(?i)\b(hiti )ć[eu]" ReplaceBy="hitit ">
<ERROR Find="(?i)\b(hiti)\r?\nć[eu]" ReplaceBy="hitit">
<!-- Mijenja se "kiti ću (ćeš, će, ćemo, ćete)" u "kitit ću (ćeš, će, ćemo, ćete)" -->
<ERROR Find="(?i)\b(kiti )ć[eu]" ReplaceBy="kitit ">
<ERROR Find="(?i)\b(kiti)\r?\nć[eu]" ReplaceBy="kitit">
</SWOCR>

Zadnji update: 24/12/2011
Naslov: Odg: OCR skripta za SW
Autor: genius - 15.06.2008. 13:52:59
Trebam skriptu koja će brisati "-" na početku prvog reda u ovom slučaju:

- ...i bio sam prisiljen braniti se.
- Vidiš, o tome se radi.

btw, koristim ovu skriptu
<!----------------------------------------------->
<!--     Subtitle Workshop OCR Script file     -->
<!--       Copyright © 2001-2004 URUSoft       -->
<!--           http://www.urusoft.net          -->
<!--                                           -->
<!-- Default values:                           -->
<!-- UseRE = True (use Regular Expressions)    -->
<!-- UseREOnlyToFind = True (put the part that -->
<!-- is not a RE between parenthesis!)         -->
<!-- If UseRE is set to false then you can use -->
<!-- the following parameters, otherwise they  -->
<!-- will be ignored:                          -->
<!--    CaseSensitive  (Default = False)       -->
<!--    WholeWord      (Default = False)       -->
<!--    PreserveCase   (Default = False)       -->
<!-- ----------------------------------------- -->
<!--     Prilagodio i dodao nove opcije:       -->
<!--                  MilanRS                  -->
<!----------------------------------------------->

<SWOCR WordChars="0123456789abcdefghijklmnopqrstuvwxyzABCDEFGHIJKLMNOPQRSTUVWXYZ_ńŃáéíóúÁÉÍÓÚäëďöü">

<!-- Replace all "l" by "I" in the middle of any uppercase word -->
<ERROR Find="[A-ZÁ-Ú](l)[A-ZÁ-Ú]" ReplaceBy="I">
<!-- Replace all "I" by "l" in the middle of any lowercase word -->
<ERROR Find="[a-zá-ú](I)[a-zá-ú]" ReplaceBy="l">

<!-- "1 :", "2 :"... "n :" to "n:" -->
<ERROR Find="\d( :)" ReplaceBy=":">
<!-- ",,," or similar to "..." -->
<ERROR UseREOnlyToFind="False" Find=",{2,}" ReplaceBy="...">
<!-- "--" or more to "..." -->
<ERROR UseREOnlyToFind="False" Find="-{2,}" ReplaceBy="...">
<ERROR Find="--" ReplaceBy="...">

<!-- Apostrophes ("\x22" is '"' character) -->
<ERROR Find="[´`“”]" ReplaceBy="'">
<ERROR UseREOnlyToFind="False" Find="''" ReplaceBy=""">
<!-- '"' more than two times together is replaced by only one '"' -->
<ERROR UseREOnlyToFind="False" Find="\x22{2,}" ReplaceBy=""">

<!-- Brisanje crte - na početku 1. reda kada ima dva reda -->
<ERROR Find="^(- )[A-ZŠĆŽČĐ]" ReplaceBy="">
<ERROR Find="^(-)[A-ZŠĆŽČĐ]" ReplaceBy="">
<ERROR UseREOnlyToFind="False" Find="^- \x22" ReplaceBy=""">
<ERROR UseREOnlyToFind="False" Find="^-\x22" ReplaceBy=""">
<!-- Razmak iza crte - na početku 2. reda -->
    <ERROR Find="[\n](-)[A-ZŠĆŽČĐ\x22]" ReplaceBy="- ">
    <!-- Korigovanje crte - kad je u sredini prvog reda -->
    <ERROR Find="[\.\?\!\x22]( -)[A-ZŠĆŽČĐ\x22]" ReplaceBy=" - ">

<!-- Smart space after dot -->
<ERROR Find="[a-zá-úńä-ü](\.)[^(\s\n\.\?\!\x22)]" ReplaceBy=". ">
<ERROR Find="(\.)[A-ZŠĆŽČĐ]" ReplaceBy=". ">
<ERROR Find="(www\. )" ReplaceBy="www.">
<ERROR Find="(\. com)" ReplaceBy=".com">
<ERROR Find="(\. net)" ReplaceBy=".org">
<ERROR Find="(\. org)" ReplaceBy=".org">
<ERROR Find="(\. yu)" ReplaceBy=".yu">
<ERROR Find="(\. hr)" ReplaceBy=".hr">

<!-- Smart space after zarez -->
<ERROR Find="[A-ZŽĆČŠĐa-zžčćšđá-úńä-ü](\,)[^(\s\n\,\?\!)]" ReplaceBy=", ">
<!-- Space after last of some consecutive dots (eg. "...") -->
<ERROR Find="(\.\.)[^(\s\n\.\?\!)]" ReplaceBy=".. ">
<ERROR Find="[a-z](!)[A-Z]" ReplaceBy="! ">
<!-- Delete space after "..." that is at the beginning of the line. You may delete this line if you don't like it -->
<ERROR UseREOnlyToFind="False" Find="^(\.\.\.) " ReplaceBy="...">
<ERROR Find="[\S](\. \x22)" ReplaceBy="."">
<ERROR Find="[\S\.\.\.]( \x22$)" ReplaceBy=""">
</SWOCR>

Ta skripta koju imam briše "-" na početku prvog reda osim u slučaju kada iza "-" slijede "..." i " ..."
Naslov: Odg: OCR skripta za SW
Autor: MilanRS - 15.06.2008. 15:24:39
Drago mi je kad vidim da neko koristi moju skriptu :)
To je moja greška što nisam dodao i to za "...".
U ovoj skripti pronađi
<!-- Brisanje crte - na početku 1. reda kada ima dva reda -->
   <ERROR Find="^(- )[A-ZŠĆŽČĐ]" ReplaceBy="">
   <ERROR Find="^(-)[A-ZŠĆŽČĐ]" ReplaceBy="">
i ispod toga dodaj ova dva reda:
   <ERROR Find="^(- )\.\.\." ReplaceBy="">
   <ERROR Find="^(-)\.\.\." ReplaceBy="">

Isprobao sam na ovom tvom primjeru i radi.
Ako bude nekih problema oko toga ili nečeg drugog, javi pa ćemo ispravljati.
Imam novu verziju u kojoj sam ispravio nekoliko grešaka i dodao još neke univerzalne najčešće greške, pa ću je uskoro ubaciti.
Naslov: Odg: OCR skripta za SW
Autor: genius - 15.06.2008. 16:20:50
Zahvaljujem.
Naslov: Odg: OCR skripta za SW
Autor: Strider - 25.06.2008. 21:55:34
Mali "update" onih mojih prijašnjih skripti gore...
Naslov: Odg: OCR skripta za SW
Autor: ptomic - 27.06.2008. 22:33:30
2 pitanja:

1.) Da li sve ove skripte mogu da spakujem u jedan fajl i da ga ucitam u OCR Scripts, gde mi trenutno iz nekog razloga stoji Espanol ?
2.) Da li seneko seca, bio je link sa OCR skriptom za SW za CRO koji ispravlja gomilu stvari, secam se da je na tom linku bio i software za ispravljanje iz SRB->CRO ?

U slucaju da mi odgovori na pitanje 1 pozitivno, nema potrebe za odgovorom na pitanje 2.

Hvala.
Naslov: Odg: OCR skripta za SW
Autor: MilanRS - 28.06.2008. 12:56:06
2 pitanja:

1.) Da li sve ove skripte mogu da spakujem u jedan fajl i da ga ucitam u OCR Scripts, gde mi trenutno iz nekog razloga stoji Espanol ?

Ne može više skripti (svaka ima svoje zaglavlje) ići u jedan fajl.
Moraš uzeti jednu pa dodavati iz drugih šta ti treba a nema u prvoj.
Pročitaj ponovo postove iz ove teme, pa napiši šta ti precizno treba, a ja ću se potruditi da to iskombinujem i dostavim.
Naslov: Odg: OCR skripta za SW
Autor: Strider - 28.06.2008. 20:56:58

2.) Da li seneko seca, bio je link sa OCR skriptom za SW za CRO koji ispravlja gomilu stvari, secam se da je na tom linku bio i software za ispravljanje iz SRB->CRO ?
Ta skripta o kojoj pričaš je bila na mojoj stranici, ali kako su zabranjeni linkovi 8), imaš je i na prethodnoj stranici (post koji počinje: "Evo "male" RegEx skripte za popravak na hrvatski jezik. bla bla bla ;D)
Što se tiče programa za ispravljanje SRB->CRO, program se zvao SCGTitlovi. Sad imaš bolji, B3S Subtranslator. Ako "u-google-aš" to, dobit ćeš kao prvu autorovu stranicu, a ukoliko upišeš B3SSubtitler (stari naziv programa) ili SCGTitlovi, dobit ćeš kao prvu moju stranicu (na kojoj je i ta OCR skripta za SW), pa pogledaj.
Nadam se da će ti biti od pomoći  ;)
Naslov: Odg: OCR skripta za SW
Autor: Veleno - 28.06.2008. 21:52:44
Zamolio bih majstore koji prave OCR skripte da pogledaju mogu li namjestiti da kad koristim skriptu koja briše "-" iz prvog reda i skriptu koja briše razmak iza "-" drugog reda, da to radi i kad su italic slova u pitanju. Ovo nije baš "must have" ali bih stvarno bio zahvalan. Unaprijed VELIKO hvala.
Naslov: Odg: OCR skripta za SW
Autor: MilanRS - 28.06.2008. 23:13:55
Strider, linkovi su zabranjeni ako vode na sajt sa piratskim i nelegalnim sadržajima, nacionalističkim i sl. Ako nemaš ništa protivzakonito na sajtu, napiši link.

Veleno, provjeriću to za italic.
Naslov: Odg: OCR skripta za SW
Autor: MilanRS - 28.06.2008. 23:32:18
Sad sam isprobao kod sebe. Radi nezavisno od toga da li su slova kosa ili nisu. Mislim da ih OCR ignoriše, ne vidi ih pri provjeri. Daj mi neki test primjer u kojem ne vrši. Koju skriptu koristiš?
Testirao sam ovo:
<i>- Ko je došao? - Lucas.
- Otkud Lucas?

Prešlo je u:
<i>Ko je došao? -Lucas.
-Otkud Lucas?
Naslov: Odg: OCR skripta za SW
Autor: Veleno - 29.06.2008. 07:59:45
Skripte sam skupio sa sajta. A dogadja se sljedece.
<i>- Ko je došao? - Lucas.
- Otkud Lucas?

<i>-Ko je došao? -Lucas.
-Otkud Lucas?
Ne skida ovaj prvi (kad bolje razmislim vidim da sam krivo napisao u prvom postu. Sorry). Znaci ako su slova italic ne radi skripta koja skida prvi razmak u recenici.
Naslov: Odg: OCR skripta za SW
Autor: pejafor3 - 29.06.2008. 11:23:06
Milane

Ne radi skirpta to sa italik varijantom.

Makar ova koja je postavljena ovde na sajtu.
Naslov: Odg: OCR skripta za SW
Autor: MilanRS - 29.06.2008. 12:04:18
Milane
Ne radi skirpta to sa italik varijantom.
Makar ova koja je postavljena ovde na sajtu.
Daj mi rečenicu za koju ne radi, da pokušam popraviti. Ovu gore rečenicu koju sam naveo odradilo je kako sam naveo. Išao sam copy/paste.
Naslov: Odg: OCR skripta za SW
Autor: Strider - 29.06.2008. 13:13:26
Strider, linkovi su zabranjeni ako vode na sajt sa piratskim i nelegalnim sadržajima, nacionalističkim i sl. Ako nemaš ništa protivzakonito na sajtu, napiši link.
Hmpf, ne mogu stavit moj site, ima linkove za Gustava :o, ali obzirom na pravila, moga bi se stavit link za B3S Subtranslator. Nije ilegalno, ne prodaje se, nisu u pitanju ni linkovi za download, pa čak ni titlova tamo nema. Jel, Šimac? Moglo bi, jel' da?  8)
Naslov: Odg: OCR skripta za SW
Autor: Strider - 29.06.2008. 16:31:17
E, jes' čovik! ;)

Dakle, "B3S Subtranslator" (starog naziva "B3S Subtitler"), program za prevođenje srpskih titlova u hrvatske (i ispravljanje kojekakvih typo grešaka i nepismenosti), besplatan, domaći uradak, možete naći na adresi http://mba.vozibrale.com

Malo "podebljane" rječnike za isti, možete naći na onoj mojoj stranici, koju ne smin upisat  ;)
Naslov: Odg: OCR skripta za SW
Autor: Veleno - 29.06.2008. 20:21:33
Citat:
Milan RS
Daj mi rečenicu za koju ne radi, da pokušam popraviti.

- Prestani se igrati.
- Slušaj, kasno je.
==>Originalna rečenica.

- Prestani se igrati.
- Slušaj, kasno je.
==> Skripta koja uklanja '-' iz prvog reda. Ova skripta to nije ni 'pogledala'

-Prestani se igrati.
-Slušaj, kasno je.
==> Skripta koja uklanja razmak iza drugog '-'
Naslov: Odg: OCR skripta za SW
Autor: genius - 29.06.2008. 20:32:06
Ja imam skriptu koja uklanja "-" iz prvog reda čak i ako je tekst ukošen.
Mene muči drugi problem. Koristim skriptu od MilanaRS. Ne uklanja mi "-" iz prvog reda ako rečenica počinje malim slovom.
evo pr.
- ja sam Ivan.
- Ja Marko.

Ja želim da mi ukloni "-" iz prvog reda iako rečenica počinje malim slovom.
Naslov: Odg: OCR skripta za SW
Autor: MilanRS - 29.06.2008. 21:35:40
genius, evo ti rješenje i obrazloženje.
U skripti već imaš ovo:
<!-- Brisanje crte - na početku 1. reda (i kada ima dva reda) -->
   <ERROR Find="^(- )[A-ZŠĆŽČĐ]" ReplaceBy="">
   <ERROR Find="^(-)[A-ZŠĆŽČĐ]" ReplaceBy="">

^ označava da je početak reda. Ono što je u ( i ) se mijenja onim što je na kraju pod "". U ovom slučaju ničim, tj. briše se. Ovo što je u [ i ] služi za pronalaženje, i to se ne mijenja.
Ovaj prvi red pronalazi na početku reda crticu pa razmak pa neko slovo od A do Z uključujući ŠĆŽČĐ. Znači da pronalazi ono što počinje velikim slovom. Drugi red je slično, samo što umjesto crtice pa razmaka pa velikog slova pronalazi crticu pa veliko slovo. Npr. -Ja sam Ivan.
Nisam napravio da briše crticu jer nisam računao da će rečenica početi malim slovom. U novoj verziji skripte u postu br. 2 ću staviti i to.
Trebaš samo ona tri reda zamijeniti ovim:
<!-- Brisanje crte - na početku 1. reda (i kada ima dva reda) -->
   <ERROR Find="^(- )[A-ZŠĆŽČĐa-zšćžčđ]" ReplaceBy="">
   <ERROR Find="^(-)[A-ZŠĆŽČĐa-zšćžčđ]" ReplaceBy="">
Naslov: Odg: OCR skripta za SW
Autor: MilanRS - 29.06.2008. 21:42:06
Ne skida ovaj prvi (kad bolje razmislim vidim da sam krivo napisao u prvom postu. Sorry). Znaci ako su slova italic ne radi skripta koja skida prvi razmak u recenici.
Ovaj tvoj post mi je promakao kad sam prošli put gledao.
Ja sam testirao i druge rečenice koje si kasnije postavio i opet mi je radilo. Možda ima nešto u trenutnoj skripti koju koristim a da nije u onoj koju sam u 4. mjesecu postavio u post br. 2.
Najbolje rješenje za sve probleme: Copy/Paste skriptu koju koristiš, ovdje u ovu temu. Ja ću je preuzeti i direktno na njoj isprobati. Nisam siguran koju koristiš pa da ne bude nesporazuma. Ne može biti da jedno isto kod nekoga radi jedno, a kod drugoga drugo. :)
Naslov: Odg: OCR skripta za SW
Autor: Strider - 29.06.2008. 22:16:44
- Prestani se igrati.
- Slušaj, kasno je.
==>Originalna rečenica.

Ako ti rečenica u SW-u izgleda ovako:
<i>- Prestani se igrati.
- Slušaj, kasno je.

...radi. Meni je rezultat:
<i>Prestani se igrati.
- Slušaj, kasno je.


Napravi posebnu skriptu:
<!----------------------------------------------->
<!--     Subtitle Workshop OCR Script file     -->
<!--       Copyright © 2001-2004 URUSoft       -->
<!--           http://www.urusoft.net          -->
<!----------------------------------------------->

<SWOCR WordChars="0123456789abcdefghijklmnopqrstuvwxyzABCDEFGHIJKLMNOPQRSTUVWXYZ_ńŃáéíóúÁÉÍÓÚäëďöü">

<!-- Brisanje crte - na početku 1. reda kada ima dva reda -->
<ERROR Find="^(- )[A-ZŠĆŽČĐa-zšćžčđ]" ReplaceBy="">
<ERROR Find="^(-)[A-ZŠĆŽČĐa-zšćžčđ]" ReplaceBy="">

</SWOCR>
pa probaj. Ako radi, problem je negdi drugo u skripti.
Naslov: Odg: OCR skripta za SW
Autor: Veleno - 29.06.2008. 22:43:01
Ekipa: Kriv sam. Koristio sam skriptu koju je Kugi radio. Sad sam ubacio od Milan RS i sve radi samo tako.
Naslov: Odg: OCR skripta za SW
Autor: MilanRS - 30.06.2008. 00:58:24
Ekipa: Kriv sam. Koristio sam skriptu koju je Kugi radio. Sad sam ubacio od Milan RS i sve radi samo tako.
Odlično, neka smo i to riješili.
Sutra dolazi update i uputstvo za prilagođavanje.
Naslov: Odg: OCR skripta za SW
Autor: ptomic - 30.06.2008. 22:31:18
2 pitanja:

1.) Da li sve ove skripte mogu da spakujem u jedan fajl i da ga ucitam u OCR Scripts, gde mi trenutno iz nekog razloga stoji Espanol ?

Ne može više skripti (svaka ima svoje zaglavlje) ići u jedan fajl.
Moraš uzeti jednu pa dodavati iz drugih šta ti treba a nema u prvoj.
Pročitaj ponovo postove iz ove teme, pa napiši šta ti precizno treba, a ja ću se potruditi da to iskombinujem i dostavim.

Najvise mi treba oko problema sa malim L i velikim I, eventualno blaga ispravka tipo gresaka.
Naslov: Odg: OCR skripta za SW
Autor: MilanRS - 30.06.2008. 23:01:07
U drugom postu ove teme je osvježena verzija RegEx ocr skripte.

Uputstvo za prilagođavanje najnovije verzije RegEx ocr skripte.

1. Ako ne želite da vam skripta nešto radi, a možete da prepoznate koji red u skripti vrši neželjene promjene, deaktivirajte ga na sljedeći način. Na početak tog reda stavite <!-- a na kraj -->
Obratite pažnju da nije isti skup znakova za početak i kraj, početak ima i !
Nemojte isključivati red kao što to može u C++, php i sl. sa // jer će najvjerovatnije doći do neželjenih posljedica.

2. Ako ne možete da prepoznate koji redovi rade ono što vi ne želite, ovdje pročitajte šta sve radi skripta i šta da isključite za pojedine postupke.

   <!-- ," -->
   <ERROR Find="[\w](\,\x22)[\s]" ReplaceBy="",">
   <ERROR Find="[\w](\,\x22$)" ReplaceBy="",">
   <ERROR Find="(,)[\.\.\.]" ReplaceBy="">
   <ERROR Find="(\.\.\.\,)" ReplaceBy="...">

Ova prva sekcija je zadužena za problematiku oko zareza tj. zapete.
Prvi red sa ERROR pronalazi slovo ili broj pa zarez pa navodnik pa razmak i ispravlja u navodnik pa zarez.
Primjer:
je vrlo brzo," rekao mi je.
Biće:
je vrlo brzo", rekao mi je.

Primjer:
"Prva," "druga," "treća," i "posljednja," vrata.
Biće:
"Prva", "druga", "treća", i "posljednja", vrata.

Ovo su vrlo česte greške kod titlova na engleskom, a zna se desiti i kod nas. Ako vi želite da ostane onako pogrešno, stavite oznake za komentar, prema uputstvu pod 1.

Druga linija radi isto, samo što pronalazi i ako je kraj reda iza navodnika, a ne razmak.
Treća linija briše razmak koji se nalazi ispred tri tačke.
Primjer: Otišao je, vratio se, otišao je,...
Prelazi u: Otišao je, vratio se, otišao je...
Četvrta, kao i treća, briše razmak, ali iza tri tačke.

   <!-- Replace htjeo by htio i slično  -->
Sljedeća sekcija sadrži ispravke najčešćih grešaka u pravopisu. Ako imate neku riječ koju bi trebalo dodati, molim da me obavijestite ovdje na forumu, da bi skripta bila što bolja.
I ovdje važi isto pravilo. Ako vi želite i dalje da u titlu piše samnom iako je sa mnom pravilno, vi ovaj red
<ERROR Find="(samnom)" ReplaceBy="sa mnom">
promijenite u
<!-- <ERROR Find="(samnom)" ReplaceBy="sa mnom"> -->
I tako za svaki red. Možete i više redova odjednom isključiti tako što ćete početak staviti na početak prvog, a kraj na kraj posljednjeg neželjenog reda.
Npr. ako hoćete da i dalje piše gdin. Petrović, a ne gosp. Petrović, kao i Gdin. Petrović, isključite oba reda posebno ili odjednom kao što je ovdje ispod.
<!--   <ERROR Find="(gdin\.)" ReplaceBy="gosp.">
   <ERROR Find="(gdin )" ReplaceBy="gosp. "> -->
Dodate su i neke riječi koje nepravilno imaju č umjesto ć.

Sljedeću cjelinu čine ovi redovi:
   <!-- "1 :", "2 :"... "n :" to "n:" -->
   <ERROR Find="\d( : )[^(\d)]" ReplaceBy=": ">
   <!-- ",,," or similar to "..." -->
   <ERROR UseREOnlyToFind="False" Find=",{2,}" ReplaceBy="...">
   <!-- "--" or more to "..." -->
   <ERROR UseREOnlyToFind="False" Find="-{2,}" ReplaceBy="...">
   <ERROR Find="--" ReplaceBy="...">
   <ERROR Find="[^(\.)](\.\.)[^(\.)]" ReplaceBy="...">
Prvi ERROR pronalazi broj pa razmak pa : i briše razmak. To je zadržano iz engleske skripte. Ja sam modifikovao tako da ne briše razmak ako je slučaj poređenja, npr. Omjer je 3 : 2.
Sljedeći red mijenja tri zareza u tri tačke. Dalje, dvije crtice (vrlo česte u engl. titlovima) prebacuje u tri tačke. I za kraj, dvije tačke mijenja u tri tačke. Česta greška u titlovima.

Ovaj dio <!-- Apostrophes ("\x22" is '"' character) -->
se bavi promjenom apostrofa koji su korišćeni kao navodnici. Mijenja ih u navodnike.
Ako imate nejasnoća oko ovoga, pitajte, jer ne mogu sada opisivati svaki red šta radi.

<!-- Fix zero and capital 'o' ripping mistakes -->
Ovo je iz engleske skripte. Ako se malo slovo o nađe među brojevima, promijeniće ga u broj nula. I obrnuto.

Ovo je važan dio.
   <!-- Brisanje crte - na početku 1. reda (i kada ima dva reda) -->
Ako nećete da koristite ove opcije, stavite je pod komentare, kao što je ovdje:

<!--   <ERROR Find="^(- )[A-ZŠĆŽČĐa-zšćžčđ]" ReplaceBy="">
   <ERROR Find="^(-)[A-ZŠĆŽČĐa-zšćžčđ]" ReplaceBy="">
   <ERROR Find="^(- )\.\.\." ReplaceBy="">
   <ERROR Find="^(-)\.\.\." ReplaceBy="">
   <ERROR UseREOnlyToFind="False" Find="^- \x22" ReplaceBy=""">
   <ERROR UseREOnlyToFind="False" Find="^-\x22" ReplaceBy=""">    -->
   <!-- Brisanje razmaka iza crte - na početku 2. reda -->
<!--    <ERROR Find="[\n](- )[A-ZŠĆŽČĐ\x22]" ReplaceBy="-">       -->
   <!-- Korigovanje crte - kad je u sredini prvog reda -->
 <!--   <ERROR Find="[\.\?\!\x22]( - )[A-ZŠĆŽČĐ\x22]" ReplaceBy=" -">    -->


Sljedeći dio je posvećen tački i razmaku.
   <!-- Smart space after dot -->
   <ERROR Find="[a-su-zá-úńä-ü](\.)[^(\s\n\.\*\?\!\x22)]" ReplaceBy=". "> <!-- osim kad je zadnje t (rijec kolt) -->
   <!-- Oznaka za kalibar. Npr. "Colt .45" -->
   <!-- Da bi radilo, da bi ovaj razmak bio dozvoljen, u SW idite Alt+I i odcekirajte "Razmaci ispred tacke" -->
   <ERROR Find="(t\.)[0-9][0-9]" ReplaceBy="t .">
Prvi red: Kad naiđe na malo slovo pa tačku, napravi razmak iza tačke. To se izvršava samo ako iza te tačke nema razmaka, ako nije kraj reda, ako nije druga tačka (neće napraviti razmake između ...), itd. Podešeno je da sve radi kako treba.
Postavio sam izuzetak za kolt. Npr. "Kolt .9" će ostati tako, neće biti nepotrebni razmak iza tačke.

Dio    <!-- Podešavanje oko domena -->
je posvećen ispravljanju grešaka kod razmaka iza tačke. Pošto je pravopisno nedopustivo da iza tačke nema razmaka, moraju se dodati izuzeci kod domena. Npr. Kod www.prijevodi-online.org će se onemogućiti pravljenje razmaka iza www. i .org. Dodati su najčešći domeni.

   <!-- Sredjuje zarez sa razmakom -->   
Ovdje sam koristio skriptu za razmak iza tačke da podesim slično i za zareze.
Iza zareza uvijek mora biti razmak, osim kad je kraj reda, ako već nema razmak i slično.
Ako je razmak ispred zareza, koriguje se. Npr. "Ne ,nemoj mi prići" će biti "Ne, nemoj mi prići"
Ovo ispravlja česte greške u kucanju, nenamjerne.

Ostalo do kraja je nešto iz engleske skripte što je i za nas korisno, razmak iza ... i razmak iza ! i ako je na početku reda razmak iza tri tačke, briše se razmak.
Ako su ... između dvije riječi sa razmakom i ispred i iza, tri tačke se privlače prvoj riječi.
Navodnik se privlači tački, ako je greškom napravljen razmak iza tačke, a navodnik ne pripada rečenici koja slijedi.
Posljednja dva reda privlače navodnik tekstu ako je taj navodnik posljednji znak u redu titla.

Nadam se da vam je sada jasnije šta radi koji dio i da ćete bez problema prilagoditi skriptu svom ukusu i ustaljenom načinu rada. Za sva dodatna pitanja slobodno se obratite ovdje preko foruma, preko maila ili preko lične poruke (PM).
Naslov: Odg: OCR skripta za SW
Autor: Veleno - 29.07.2008. 21:06:39
Milane, jeli može jedna jednostavna skripta?

Da ovo: rekao sam joj. -rekao si joj? -da, rekao sam.

u ovo: Rekao sam joj. -Rekao si joj? -Da, rekao sam.

Ili takve slične stvari, tj. da ako je prvo slovo na početku rečenice malo da ga se stavi veliko.
Naslov: Odg: OCR skripta za SW
Autor: brxxxi - 15.08.2008. 16:03:09

evo jos jedne vrlo korisne skripte, c/p sa SW foruma
preporuka za one koji prevode preko eng. titla tj. samo
promijene eng. riječi s našima.

Skripta provjerava koji titlovi imaju više od 25 znakova po sekundi
(uključite mod prevođenja u SW jer tamo stavlja log za te titlove)

Cilj skripte je lakše čitanje titlova, znači da se isprave oni koji
prekratko traju/imaju previše znakova ili riječi u odnosu na trajanje

// --= CPS Comment (in translation) =--
// Add info about the Readability Rythm
// of the original sub (Characters per second)
// as a comment [...] in the Translation.
// ------------------------------------
// Made by Buzcatcher - feb.2007
// http://subtitle-spotting.blogspot.com/

program CPScomment;

// -------------------------------------

const
//FYI: 25cps = 40ms spotting for each char ; 20cps=50ms/char. etc.
  CPSlimit = 25;  //Change as you see fit.
  CRLF = ''#13''#10;

var
  i, j, n, pln, p1, p2 : Integer;
  duration, sublength, cps : Integer;
  subtxt, subtrans, report : String;

begin
  if not IsTranslatedloaded then
    exit;

  n := GetSubtitleCount-1;

  for i := 0 to n do
  begin
    subtxt := GetSubtitleText(i);
    sublength := length(subtxt);
    duration := GetSubtitleFinalTime(i) - GetSubtitleInitialTime(i);
   
    //pure stripped text length doesn't count the CRLF in 2 line subs
    pln := pos(''#13''#10, subtxt);
    if (pln>0) then
      sublength := sublength - 2;
   
    cps := round((sublength * 1000)/ duration);   //spotting spead.
   
    if (cps > CPSlimit) then
    begin
      // To update rather than double the cps info.
      subtrans := GetSubtitleTrans(i);
      p1 := pos('[*', subtrans);
      p2 := pos('*]', subtrans);
      while ((p1>0) and (p2>0)) do
         begin
           subtrans := copy(subtrans, p2+2, length(subtrans)-p2);
           p1 := pos('[*', subtrans);
           p2 := pos('*]', subtrans);
         end;
      SetSubtitleTrans(i, subtrans);
   
      //Adding [*xx C/sec*] in the translation text.
      report := '[*' + IntToStr(cps) + ' Car/s*]';
      subtrans := report + GetSubtitleTrans(i);
      SetSubtitleTrans(i, subtrans);
      j := j + 1;
    end;
 
  end;

  MsgBox(IntToStr(j) + ' Subtitles over ' + IntToStr(CPSlimit) + ' char/sec' + CRLF + 'Noted in Translation File', '&Ok', '', '', $20);
end.


Ova skripta bi meni trebala ali ja ne znam kako se u sw koriste skripte.... budite ljubazni objasnite mi postupak primene skripte u sw korak po korak molim vas. Hvala
Naslov: Odg: OCR skripta za SW
Autor: Nagy - 16.08.2008. 16:28:45
// --= CPS Comment (in translation) =--
// Add info about the Readability Rythm
// of the original sub (Characters per second)
// as a comment [...] in the Translation.
// ------------------------------------
// Made by Buzcatcher - feb.2007
// http://subtitle-spotting.blogspot.com/

program CPScomment;

// -------------------------------------

const
//FYI: 25cps = 40ms spotting for each char ; 20cps=50ms/char. etc.
  CPSlimit = 25;  //Change as you see fit.
  CRLF = ''#13''#10;

var
  i, j, n, pln, p1, p2 : Integer;
  duration, sublength, cps : Integer;
  subtxt, subtrans, report : String;

begin
  if not IsTranslatedloaded then
    exit;

  n := GetSubtitleCount-1;

  for i := 0 to n do
  begin
    subtxt := GetSubtitleText(i);
    sublength := length(subtxt);
    duration := GetSubtitleFinalTime(i) - GetSubtitleInitialTime(i);
   
    //pure stripped text length doesn't count the CRLF in 2 line subs
    pln := pos(''#13''#10, subtxt);
    if (pln>0) then
      sublength := sublength - 2;
   
    cps := round((sublength * 1000)/ duration);   //spotting spead.
   
    if (cps > CPSlimit) then
    begin
      // To update rather than double the cps info.
      subtrans := GetSubtitleTrans(i);
      p1 := pos('[*', subtrans);
      p2 := pos('*]', subtrans);
      while ((p1>0) and (p2>0)) do
         begin
           subtrans := copy(subtrans, p2+2, length(subtrans)-p2);
           p1 := pos('[*', subtrans);
           p2 := pos('*]', subtrans);
         end;
      SetSubtitleTrans(i, subtrans);
   
      //Adding [*xx C/sec*] in the translation text.
      report := '[*' + IntToStr(cps) + ' Car/s*]';
      subtrans := report + GetSubtitleTrans(i);
      SetSubtitleTrans(i, subtrans);
      j := j + 1;
    end;
 
  end;

  MsgBox(IntToStr(j) + ' Subtitles over ' + IntToStr(CPSlimit) + ' char/sec' + CRLF + 'Noted in Translation File', '&Ok', '', '', $20);
end.

Ovo gore kopiraj u notepad i sačuvaš pod Provjera broja znakova.PAS i kopiraj taj file u C:\Program Files\URUSoft\Subtitle Workshop\PascalScripts direktorij. Otvoriš Subtitle Workshop i pod Tools--> Pascal scripts će ti se nalaziti taj "Provjera broja znakova". Da bi ova određena skripta radila svoju funkciju mora ti biti otvoren prijevod i uključen Translator mode (Ctrl-U ili Edit-->Translation-->Translator mode). Dakle, kad ti je otvoren prijevod i uključen translator mode klikom na ono "Provjera broja znakova" pod Pascal scripts pokreće se ta skripta i vidjeti ćeš poruku u kojoj ti javi koliko ti redova ima više od 25 znakova. Koji su to točno redovi vidjeti ćeš u onom desnom dijelu prijevoda gdje će ti kod svakog takvog reda pisati [*XX Car/s*]. Nadam se da si sve uspio pohvatati...
Naslov: Odg: OCR skripta za SW
Autor: brxxxi - 16.08.2008. 21:03:24
Sredio sam radi tj obelezila je sve recenice, ali kad taj prevod saveujem svugde buse untranslated subtitle i prevoda nema..........
Naslov: Odg: OCR skripta za SW
Autor: Nagy - 16.08.2008. 21:10:56
Sredio sam radi tj obelezila je sve recenice, ali kad taj prevod saveujem svugde buse untranslated subtitle i prevoda nema..........
Kad radiš u Translator modu onda imaš 2 otvorena prijevoda odjednom. Ti si sačuvao ovaj drugi prijevod, gdje ti je zapravo samo "- Untranslated subtitle -". On ti nije bitan, bitan ti je onaj prvi, onaj lijevo. Njega sačuvaš tako da ideš na Save-->Save original. Ti si vjerojatno sačuvao ovaj desni, prazni prijevod pod istim imenom kao i ovaj lijevo, pa ti je sačuvao preko postojećeg... Ovaj desni prijevod ne trebaš uopće sačuvati, kad ti izbaci onu poruku hoćeš li sačuvati ili ga sačuvaš pod nekih nebitnim imenom. Samo moraš paziti koji ti je od ta 2 prijevoda onaj pravi "Original", a koji ti je taj "Translated", odnosno onaj u koji ti skripta zapisuje te brojeve... Valjda si shvatio... :D
Naslov: Odg: OCR skripta za SW
Autor: MilanRS - 23.08.2008. 11:57:54
Milane, jeli može jedna jednostavna skripta?

Da ovo: rekao sam joj. -rekao si joj? -da, rekao sam.
u ovo: Rekao sam joj. -Rekao si joj? -Da, rekao sam.

Ili takve slične stvari, tj. da ako je prvo slovo na početku rečenice malo da ga se stavi veliko.
Izvini što nisam odgovorio ovako dugo, ali nisam aktivno učestvovao na ovom forumu skoro mjesec dana (pisao postove). Moram se i ja nekad odmoriti :)
Da li si i dalje pri ovome, da ti treba skripta za ovako nešto? Napraviću je ako ti treba, ali mislim da to pravi više štete nego koristi. Ima dosta redova koji počinju nastavkom rečenice iz prethodnog titla. Ti potvrdi, ako ti i dalje treba i dobijaš.
Naslov: Odg: OCR skripta za SW
Autor: Veleno - 23.08.2008. 12:30:14
Bitno je da si se (nadam se) odmorio. A skriptu sam mislio koristiti na engleskim titlovima za seriju Pretender ali sam našao bolje titlove tako da nije potrebno.
Ipak hvala. ;)
Naslov: Odg: OCR skripta za SW
Autor: MilanRS - 24.08.2008. 14:59:35
Sinoć sam instalisao paskal skriptu za 25cps i vidim da je to prava stvar. Samo, ja sam sebi povećao na 28 jer mi oni ne prolaze brzo, a morao bih puno titlova štelovati.
Nagy, hvala za objašnjenje, i meni je koristilo.
Naslov: Odg: OCR skripta za SW
Autor: MilanRS - 04.10.2008. 17:34:34
Noah, što se tiče prelamanja redova, u SW možeš selektovati sve redove i ići Ctrl+E i on će duge redove prelomiti u dva, ali će i kratke
   Koliko komada zeli?
   -Dvadeset.
prebaciti u jedan
   Koliko komada zeli? -Dvadeset.
To nije baš poželjno.
Zato, u SW Alt+I, Napredno, Predugačka linija, tu upišeš koliko najviše karaktera smije imati linija. I uvećaš za 1. Poslije kad budeš testirao sa OCR, javiće ti koje linije su predugačke, pa ih središ na Ctrl+E, a kratke u dva reda ostaju takve.
Pročitaj postove iz ove teme, pisao sam o pretraživanju redova, metod sa F12 i F11.
Spreman sam da pojasnim sve što treba.
Naslov: Odg: OCR skripta za SW
Autor: Noah - 04.10.2008. 18:38:04
jel ima kakva opcija da se jedan redak ako je predugacak prelama u dva?
Naslov: Odg: OCR skripta za SW
Autor: petko - 05.10.2008. 10:39:35
jel ima kakva opcija da se jedan redak ako je predugacak prelama u dva?

CTRL+E
Naslov: Odg: OCR skripta za SW
Autor: Strider - 05.10.2008. 13:19:47
Noah, što se tiče prelamanja redova, u SW možeš selektovati sve redove i ići Ctrl+E i on će duge redove prelomiti u dva, ali će i kratke
   Koliko komada zeli?
   -Dvadeset.
prebaciti u jedan
   Koliko komada zeli? -Dvadeset.
To nije baš poželjno.
Neće to napraviti ukoliko ima razmak iza crte u drugom redu:
   Koliko komada zeli?
   - Dvadeset.

...ali tako neće ni dugačku liniju razlomiti u dvije kratke :(
Umjesto ovoga:
   Ili kako je jedna od njegovih
   ljubavnica rekla... -Imao je ljubavnice?

dobit ćeš ovo (gdje je prva linija predugačka - 49 znakova):
   Ili kako je jedna od njegovih ljubavnica rekla...
   - Imao je ljubavnice?
Naslov: Odg: OCR skripta za SW
Autor: MilanRS - 05.10.2008. 14:15:17
Da, to je skroz loše riješeno. Zato sa samo postavim max 45 karaktera i idem od greške do greške sa F12 i popravljam duge redove sa F11. Nadam se da će u nekoj novoj verziji SW to biti bolje riješeno.
Naslov: Odg: OCR skripta za SW
Autor: pejafor3 - 14.12.2008. 14:22:08
Moze li da se prepravi originalna skripta

Copy text to translation. Made by Bedazzle.

ali da bude u obrntom pravcu



Naslov: Odg: OCR skripta za SW
Autor: petko - 14.12.2008. 16:05:56
Moze li da se prepravi originalna skripta

Copy text to translation. Made by Bedazzle.

ali da bude u obrntom pravcu


moze ;)

// Copy text to translation. Made by Bedazzle.
// naopaka varijanta

program CopyToOriga;

// ---------------------------------------------

var
  n: Integer;
  i: Integer;

  txt: String;

begin
  n := GetSubtitleCount;

  for i := 0 to n-1 do
  begin
     if (IsSubtitleSelected(i) = true) then
     begin
//        txt := GetSubtitleText(i);
//        SetSubtitleTrans(i, txt);
        txt := GetSubtitleTrans(i);
        SetSubtitleText(i, txt);
     end;
  end;
end.
Naslov: Odg: OCR skripta za SW
Autor: pejafor3 - 14.12.2008. 16:25:35
radi super....
 clapp clapp clapp clapp Petko
Naslov: Odg: OCR skripta za SW
Autor: petko - 14.12.2008. 18:28:04
don't mention it :)
Naslov: Odg: OCR skripta za SW
Autor: Jablan - 14.12.2008. 19:05:25
može li mi netko reći kako da ubacim i da mi radi skripta od milana skroz na početku iz drugog posta. i ako ima još koja dobra skripta da mi odmah objasni, da ne listam sada bez veze, iovako neću ništa skužiti :)

hvala

EDIT: riješeno uz veliku pomoć MilanRS-a, veliko hvala još jednom!  clapp
Naslov: Odg: OCR skripta za SW
Autor: ManOfHonor - 24.12.2008. 02:10:28
Verovatno bi se mogla napraviti i skripta za prevođenje sa hrvatskog na srpski i obrnuto. Dok sam koristio BFAFS zapisivao sam sve reči koje nisu postojale u njegovoj bazi radi naknadnog dodavanja, međutim program je malo bagovit i često napravi više štete nego koristi, pa sam iz tog razloga hteo da probam da napravim jedan mali prevodilac za najčešće korišćene reči, imena, pojmove...
Mogu li koristiti ovaj šablon za tako nešto:
<ERROR Find="(HRVATSKI)" ReplaceBy="SRPSKI">
Naslov: Odg: OCR skripta za SW
Autor: MilanRS - 24.12.2008. 13:44:49
Već postoji jedna beta verzija te skripte za hr --> sr.
Večeras više informacija, kad dođem kući.
Naslov: Odg: OCR skripta za SW
Autor: ManOfHonor - 24.12.2008. 17:02:06
Ok, jedva čekam! :o
Naslov: Odg: OCR skripta za SW
Autor: MilanRS - 18.01.2009. 19:06:49
Ovo iz prošlog posta smo riješili preko PM.

Zna li neko za skriptu koja prebroji broj znakova u dva reda jednog titla, pa da ih označi ako je u jednom mnogo više nego u drugom?
Ako npr. prvi red ima 10 a drugi 35 znakova ili obrnuto, volio bih da budu označeni da odradim Ctrl+E.
Kad zalijepim titlove (.divx) sa podlogom, podloga bude zajednička za oba reda širine onog koji je duži. Ako jedan od ta dva reda ima malo karaktera, tu bude puno crne pozadine bez slova.

Ima li nešto za označavanje titlova koji u dva reda u zbiru imaju manje od xy (40) znakova?
Ja bih njih prebacio u jedan red.
Naslov: Odg: OCR skripta za SW
Autor: petko - 19.01.2009. 08:46:16
Uvidom u Example.pas, paskal skriptu koja dolazi uz subtitle workshop našao sam da je moguće naći broj slova u određenom dijalogu:

Citat:
for a := GetSubtitleCount-1 downto 0 do
begin
  if Length(GetSubtitleText(a)) > 20 then

Ukoliko negde nađem neki spisak funkcija subtitle workshopa koje je moguće pozvati iz paskal skripti onda je to rešeno očas posla...
Ako neko zna, neka ne ćuti :)
Naslov: Odg: OCR skripta za SW
Autor: petko - 21.01.2009. 13:18:55
Zna li neko za skriptu koja prebroji broj znakova u dva reda jednog titla, pa da ih označi ako je u jednom mnogo više nego u drugom?
Ako npr. prvi red ima 10 a drugi 35 znakova ili obrnuto, volio bih da budu označeni da odradim Ctrl+E.

Nisam uspeo da nađem funkciju kojom bih takve redove označio ali evo nečeg što možda obavi posao
Kako se koristi:
- Ovo dole snimi u folder gde stoje subtitle workshop pascal skripte, nazovi ga recimo "xPorediDuzine.pas"
- Pokreni subtitle workshop
- Otvori kao original titl koji hoćeš da obradiš
- pokreni skriptu - Tools/Pascal scripts/xPorediDuzine

Nakon ovoga u prevodu je označeno koji titlovi iz originala imaju veću razliku u broju znakova od dozvoljene.

// *********************************************************
// skarabudžio Petko - 21.01 MMIX
// ---------------------------------------------------------
// poredi dužine prvog i drugog reda titla u originalu
// a u prevodu obeležava titlove koji imaju veæu razliku
// u dužinama prve i druge linije
// =========================================================
// PAŽNJA! PAŽNJA! PAŽNJA!
// Prevod se briše bez pitanja pa vodite raèuna
// *********************************************************

program PorediDuzine;
const
  iMaxRazlika = 10;

var
  iRed, iDuzPrve, iDuzDruge: Integer;
  cr: string;

begin
  cr := chr(13) + chr(10);
  for iRed := GetSubtitleCount-1 downto 0 do
  begin
    SetSubtitleTrans(iRed, '');
    iDuzPrve := pos(cr, GetSubtitleText(iRed));
    if iDuzPrve > 1 then
    begin
      iDuzDruge := Length(GetSubtitleText(iRed)) - iDuzPrve;
      if abs(iDuzPrve - iDuzDruge) > iMaxRazlika then SetSubtitleTrans(iRed, '*$ razlika u duzinama zadovoljena!');
    end;
  end;
end.

U liniji koja glasi iMaxRazlika = 10; možeš promeniti broj koji označava maksimalnu razliku u broju znakova između prve i druge linije.
Važno je pomenuti da se izvršenjem skripte gubi prevod tako da treba raditi samo sa otvorenim originalom.
Naslov: Odg: OCR skripta za SW
Autor: MilanRS - 21.01.2009. 15:56:10
Hvala za ovo, isprobaću ali već sad vjerujem da radi baš ono što želim. Svaka čast!
Naslov: Odg: OCR skripta za SW
Autor: magila - 21.01.2009. 19:55:18
Milane majstore, može li tvoj script da postavlja razmak i iza znaka "?" ?
Juče sam počeo da čačkam po tim skriptama.
Pokušavam ošišanu latinicu da prebacim u latinicu sa kvačicama.
Hrvatski u srpski, sve redom, što može.
Za sada uglavnom radi...
Ako mi nešto zatreba, mogu li te kontaktirati preko PM-a?
Naslov: Odg: OCR skripta za SW
Autor: MilanRS - 21.01.2009. 21:35:32
PM, mail, forum, ... biraj.

Može se to staviti u skriptu ali već ima u SW opcija da se to provjerava.
Vidi sliku.
(http://i44.tinypic.com/spzw35.jpg)

Samo upiši ? u ovo polje.
Naslov: Odg: OCR skripta za SW
Autor: magila - 22.01.2009. 06:07:10
  Da, hvala, video sam tu opciju.
Ali sam mislio da posle bilo kog znaka interpukcije dođe razmak,
a ne da mu ja svaki put zadajem iza kog pojedinačno će on izvršavati naredbu.

  Drugo, jako sam zainteresovan za te OCR rečnike koje si oformio,
trenutno radim na jednom. Ima oko dve hiljade reči.

Naslov: Odg: OCR skripta za SW
Autor: Strider - 01.02.2009. 21:15:59
Ekipa, pogledajte program koji je već spominjan na ovom forumu, B3SSubTranslator (http://www.mba.vozibrale.com/articles/view/b3s-subtranslator-0-6-1/), koji inače prevodi SR->HR. "Okrenite" rječnike "ReplaceableWords" i "MultiValueWords" (ne baš doslovno jer ima i Typo grešaka) i prepravite "AcceptedWords" (ijekavicu u ekavicu i sl.). Riješili ste se i kreiranja novih rječnika od početka i imate dobar program za prijevode :-) BTW, nisam ja autor programa, da ne bi bilo da je samo-reklama :-)

Usput, zamolio bih ekipu koja prevodi na srpski da probaju već spominjani B3SSubTranslator i da naprave barem rječnik "AcceptedWords" za srpski jezik. Dobar dio tih rječnika sam ja unio (i ispravio, prebacio iz jednog u drugi...), ali najveća muka je kad naletim na Typo greške jer je moguće više ispravaka. Neke stvari sam prevodio i sam, i znam da je to težak posao i da se provuku svakakve greške. Ali, onda lijepo, provučete svoj autorski titl kroz SubTranslator i ispravite greške koje su Vam se potkrale zbog brzine ili umora :-)
Evo primjera jednog titla, "Farscape [4x21] - We're So Screwed III - La Bomba" (koji je još i dobar):
crvotčine - crvotočine
evoluciski - evolucijski
hirararhija - hijerarhija
izsključi - isključi
imperaatorom - imperatorom
bušilicima - bušilicama
nisma - nisam
izabarali - izabrali
baram - barem
aktivaraće - aktiviraće (aktivirat će)
bemtenovoj - batmenovoj
elift - lift
hoćel - hoće, hoće li
konfernciju - konferenciju
ktivira - aktivira
ministerke - ministarke (ministrice)
niovu - nivou
oduglovačio - odugovlačio
oploćuje - oplođuje
ostavćite - ostavićete (ostavit ćete)
razaro - razarao
rećićuti - rećiću ti (reći ću ti)
samoubstvom - samoubistvom - samoubojstvom
saznađemo - saznaćemo (saznat ćemo)
uhapiste - uhapsite (uhitite)
Pretpostavljam da nam je svima u interesu napraviti što bolji i ispravniji prijevod. Bez obzira na kojem jeziku bio, samo nek je ispravan.
Stoga apeliram na cijelu ekipu prevoditelja koji rade na ekavici da preprave rječnik "AcceptedWords" za srpski jezik.

Pozdrav od Stridera!
Naslov: Odg: OCR skripta za SW
Autor: magila - 02.02.2009. 06:07:22
Hvala Stridere. Ovo je od velike pomoći.
Već sam zapeo da obnovim znanje iz pascala.
Naslov: Odg: OCR skripta za SW
Autor: Shomac - 16.02.2009. 17:52:49
Pozdrav. Prvo bih htio da se zahvalim @MilanRS na njegovoj ocr skripti kao i ostalim clanovima koji se trude da poboljsaju SW.
Nisam odavno programirao u Pascal-u pa mi je lakse da vas zamolim za uslugu.
Evo u cemu je problem. Desavalo mi se da u prevodu jedna recenica bude podijeljena u dva ili vise titlova sa tim sto da ti titlovi traju ~1 sec.
Primjer:
1
00:00:00,000 --> 00:00:01,000
Ovo je
2
00:00:01,001 --> 00:00:02,001
titl.
Moze li se napraviti skripta koja bi prepoznala ovo i spoji dva titla u jedan?
Naslov: Odg: OCR skripta za SW
Autor: ndma11 - 17.02.2009. 09:04:04
Ne znam za skriptu, ali postoji opcija CTRL+K.... Ona spaja dve linije koje selektuješ....
Naslov: Odg: OCR skripta za SW
Autor: Shomac - 17.02.2009. 12:11:48
Hvala. Nisam znao za tu opciju.
Ali opet trebao bi svaki prevod da pregledam da bi nasao gdje je greska. Sa skriptom bi bilo jednostavnije.
Naslov: Odg: OCR skripta za SW
Autor: pejafor3 - 17.02.2009. 12:37:58
Hvala. Nisam znao za tu opciju.
Ali opet trebao bi svaki prevod da pregledam da bi nasao gdje je greska. Sa skriptom bi bilo jednostavnije.

Grešiš!

Evo ti primer:

1
00:00:00,000 --> 00:00:01,000
Ovo je
2
00:00:01,001 --> 00:00:02,001
titl.

Šta ako pod rednim brojem 2, rečenicu izgovara druga osoba!?
dobio bi sledeće

00:00:00,000 --> 00:00:02,001
Ovo je
titl.

A pravilno je
00:00:00,000 --> 00:00:02,001
Ovo je
- titl.

Zato lepo kad završiš titl, ili u toku rada.
Pokreneš komadnu CTRL+I
Informations and Errors
Tu prethodno namesti u opcijama, vreme za koje ti smatraš da treba da ti javlja Too Short Durations.
I onda u toku rada ili nakon završenog prevoda, vidiš obeležene rečenice crvenom bojom, selektuješ ih i spojis sa CTRL+K.

Ali ovo važi samo ako prevodiš!
A ako ne prevodiš a nerviraju te kratke rečenice....
E to ima druge komande, a one se uče tokom rada. angeldemon
Naslov: Odg: OCR skripta za SW
Autor: Shomac - 17.02.2009. 13:01:40
Citat:
Šta ako pod rednim brojem 2, rečenicu izgovara druga osoba!?
dobio bi sledeće

00:00:00,000 --> 00:00:02,001
Ovo je
titl.

A pravilno je
00:00:00,000 --> 00:00:02,001
Ovo je
- titl.

Mislim da bi u ovom slucaju izpravno bilo ovako:

00:00:00,000 --> 00:00:02,001
Ovo je...
- titl.


Ne, ne prevodim nego sredjujem prevode koji imaju greske.

Konkretno dosta puta u prevodima za Prison Break ima ovakvih gresaka gdje je jedna recenica razdijeljena u vise linija od kojih je svaka traje ~1,000 - 1,500 tako da ti cijela recenica prodje u "treptajima" i ne uspijes procitati sta pise. A u 90% slucajeva tu recenicu izgovara jedan covijek.

Evo konkretnog primjera:

306
00:28:32,190 --> 00:28:33,209
Zaustavi kombi.

307
00:28:33,210 --> 00:28:34,339
Ne mogu je ostaviti.

308
00:28:34,340 --> 00:28:36,660
Ona je veæ
ostavila tebe.

309
00:28:37,630 --> 00:28:38,510
Tata!

310
00:28:38,520 --> 00:28:40,040
Ne mogu je ostaviti.

311
00:28:40,050 --> 00:28:41,300
Tata, moraš iæi.

Prvi titl traje 1,019 a drugi 1,129 sto je malo vremena s obzirom koliko znakova imaju oba titla. Bilo bi lakse za citanje da su ta da titla spojeni.
Naslov: Odg: OCR skripta za SW
Autor: pejafor3 - 17.02.2009. 14:30:46
Citat:
00:00:00,000 --> 00:00:02,001
Ovo je
titl.

A pravilno je
00:00:00,000 --> 00:00:02,001
Ovo je
- titl.


Citat:
Mislim da bi u ovom slucaju izpravno bilo ovako:

00:00:00,000 --> 00:00:02,001
Ovo je...
- titl.


He, he, he, dobar si!
naučiću još nešto!


Vidi...
Nikad to nećeš moći da rešiš sa nikakvim skriptama!!!

Evo ti primera...
Uzmi prevode za najbolju seriju koja se emituje----
Imaš dva prevodioca.
Ne znaš ko bolje prevodi po pitanju poznavanja jezika!
Ali...
Kod jednog imaš 600 linija a kod drugog 350 linija! (lupam sada brojke napamet)

Kao i onaj gornji primer koji sam ti napisao..... nijedna skirpta to ne može da reši....
Osim da....
U svakoj liniji imaš "-"

primer
- Ovo je
- titl.
A to se inače kosi sa svim pravilima prevođenja!

Imaš komandu u SW... sa kojom možeš da produžiš trajanje postojećih linija.
(samo mala pomoć. SW pa Help pa search. Extend length )
 >:dj
Naslov: Odg: OCR skripta za SW
Autor: -=QuadDamage=- - 17.02.2009. 15:36:41
  Da, hvala, video sam tu opciju.
Ali sam mislio da posle bilo kog znaka interpukcije dođe razmak,
a ne da mu ja svaki put zadajem iza kog pojedinačno će on izvršavati naredbu.

  Drugo, jako sam zainteresovan za te OCR rečnike koje si oformio,
trenutno radim na jednom. Ima oko dve hiljade reči.



Samo ukucaj sve znakove posle kojih hoćeš razmak. Npr.   :,-
Naslov: Odg: OCR skripta za SW
Autor: Shomac - 17.02.2009. 19:21:19
Citat:
00:00:00,000 --> 00:00:02,001
Ovo je
titl.

A pravilno je
00:00:00,000 --> 00:00:02,001
Ovo je
- titl.


Citat:
Mislim da bi u ovom slucaju izpravno bilo ovako:

00:00:00,000 --> 00:00:02,001
Ovo je...
- titl.


He, he, he, dobar si!
naučiću još nešto!


Vidi...
Nikad to nećeš moći da rešiš sa nikakvim skriptama!!!

Evo ti primera...
Uzmi prevode za najbolju seriju koja se emituje----
Imaš dva prevodioca.
Ne znaš ko bolje prevodi po pitanju poznavanja jezika!
Ali...
Kod jednog imaš 600 linija a kod drugog 350 linija! (lupam sada brojke napamet)

Kao i onaj gornji primer koji sam ti napisao..... nijedna skirpta to ne može da reši....
Osim da....
U svakoj liniji imaš "-"

primer
- Ovo je
- titl.
A to se inače kosi sa svim pravilima prevođenja!

Imaš komandu u SW... sa kojom možeš da produžiš trajanje postojećih linija.
(samo mala pomoć. SW pa Help pa search. Extend length )
 >:dj


Izgleda da se mi ne razumijemo bas najbolje, al' nema veze hvala ti na pomoci.

Extend length ne moze da produzi postojecu liniju ako je ovakav slucaj

1
00:00:00,000 --> 00:00:01,000
Ovo je
2
00:00:01,001 --> 00:00:02,001
titl.

Obrati paznju kad se zavrsava prvi titl a kad pocinje drugi.
Nego da batalimo ovo. Moze li mi neko reci gdje mogu da vidim spisak svih pascal funkcija koje podrzava SW.
Naslov: Odg: OCR skripta za SW
Autor: petko - 17.02.2009. 19:39:54
Pogledaj forume na sajtu URUsofta, proizvođača Subtitle workshopa.
Naslov: Odg: OCR skripta za SW
Autor: pejafor3 - 17.02.2009. 23:00:41
Citat:
00:00:00,000 --> 00:00:02,001
Ovo je
titl.

A pravilno je
00:00:00,000 --> 00:00:02,001
Ovo je
- titl.


Citat:
Mislim da bi u ovom slucaju izpravno bilo ovako:

00:00:00,000 --> 00:00:02,001
Ovo je...
- titl.


He, he, he, dobar si!
naučiću još nešto!


Vidi...
Nikad to nećeš moći da rešiš sa nikakvim skriptama!!!

Evo ti primera...
Uzmi prevode za najbolju seriju koja se emituje----
Imaš dva prevodioca.
Ne znaš ko bolje prevodi po pitanju poznavanja jezika!
Ali...
Kod jednog imaš 600 linija a kod drugog 350 linija! (lupam sada brojke napamet)

Kao i onaj gornji primer koji sam ti napisao..... nijedna skirpta to ne može da reši....
Osim da....
U svakoj liniji imaš "-"

primer
- Ovo je
- titl.
A to se inače kosi sa svim pravilima prevođenja!

Imaš komandu u SW... sa kojom možeš da produžiš trajanje postojećih linija.
(samo mala pomoć. SW pa Help pa search. Extend length )
 >:dj


Izgleda da se mi ne razumijemo bas najbolje, al' nema veze hvala ti na pomoci.

Extend length ne moze da produzi postojecu liniju ako je ovakav slucaj

1
00:00:00,000 --> 00:00:01,000
Ovo je
2
00:00:01,001 --> 00:00:02,001
titl.

Obrati paznju kad se zavrsava prvi titl a kad pocinje drugi.
Nego da batalimo ovo. Moze li mi neko reci gdje mogu da vidim spisak svih pascal funkcija koje podrzava SW.


DA! U PRAVU SI!!!!
ali će ti pomoći u 50-60% titla!
A ako hoćeš savršen titl... ili ga prevodi ili ga sređuješ nakon gledanja!
Bilo kako....
Ti si običan Leecher. Nikad nisi ništa prevodio. I šta će tebi neke pascal funkcije!?
Sedi  i prevodi...
Ne trebaju ti nikakve pascal skripte!
Naslov: Odg: OCR skripta za SW
Autor: Shomac - 17.02.2009. 23:36:58
@pejafor3 Jbt koji si ti lik. Lijepo zamolim za pomoc a ti se pravis pametan i GALAMIS na ljude sto nije lijepo.
Ja nisam htio skriptu koju cu koristiti za sve prevode nego samo za one u kojima primjetim da ima ovakvih gresaka. Pascal funkcije ne trebaju meni nego jednom liku na drugom forumu pa sam mislio da bi mogao neko da mi pomogne oko toga jer ih na sajtu URUsofta nisam nasao.

U pravu si stace nam pascal ili ocr skripte lakse je bez njih  ;D

Hvala na pomoci.

PS. Izvinjavam se ako sam spamovao temu mozete slobodno da obrisete moje postove.
Naslov: Odg: OCR skripta za SW
Autor: MilanRS - 19.02.2009. 23:07:13
Osvježio sam post br. 2 poslije skoro 10 mjeseci. Dodao sam linkove do skripte, da se ne mučite sa copy/paste pa snimanje kao UTF8, sad samo snimite skriptu u odgovarajući folder i uživate.
Naslov: Odg: OCR skripta za SW
Autor: Cata - 19.02.2009. 23:24:31
Ma Milane, šta bi mi bez tebe!  ;D
Naslov: Odg: OCR skripta za SW
Autor: kanda - 19.02.2009. 23:36:43
Osvježio sam post br. 2 poslije skoro 10 mjeseci. Dodao sam linkove do skripte, da se ne mučite sa copy/paste pa snimanje kao UTF8, sad samo snimite skriptu u odgovarajući folder i uživate.

Ako se ne varam, oba linka su ti do iste skripte. Usput, puno hvala!  clapp clapp
Naslov: Odg: OCR skripta za SW
Autor: MilanRS - 19.02.2009. 23:45:04
Hvala na informaciji. Išao sam copy/paste pa zaboravio 1 zamijeniti sa 2.

Napomena: Koristite ovo na svoju odgovornost! (Da me neko poslije ne tuži ;D )
Naslov: Odg: OCR skripta za SW
Autor: Strider - 20.02.2009. 22:52:54
Milane, ovo je "perverzija" i nepotrebno. Pogledaj B3S SubTranslator (http://mba.vozibrale.com). Ako ti treba iz HR u SR, promijeni rječnike. Puno, puno jednostavnije, brže i preciznije, nego da "bildaš" ispravke ovako u OCR skripti.
P.S. ...za modere... program je "džaba", free, besplatan, našeg čovika, tako da nije reklama ni link za neku "nepodopštinu"  ;)
Naslov: Odg: OCR skripta za SW
Autor: noodleshr - 01.03.2009. 19:46:09
Milane, ako želiš pomogni!

Koristim jednu super igračku za gledanje filmova, a zove se ICIDU Media player.
To je zapravo eksterni hard s media playerom i hrpetinu izlaza na poleđini (scart, hdmi, component, composite, s-video).
Čita srt i sub titlove, ali ne i ž,š,č,ć. Svaki titl moram prepravljati ručno (shift+f i replace).
Postoji li neka fora da ž,š,č,ć pretvorim u z,s,c a da ne moram utipkavati slovo po slovo?
Probao sam par ''finti'' poput find š,ž,č,ć replace with s, z,c,c, ali niš.
Btw, fala na trudu koji ulažeš u sve ovo, kao i ostala ekipa.
Naslov: Odg: OCR skripta za SW
Autor: MilanRS - 01.03.2009. 20:42:47
Otvori novi dokument u Notepad.
Ovo sve selektuj, pa Ctrl+C, pa u Notepad Ctrl+V.
Snimi kao neko_ime.ocr (ispod gdje piše Text Document prebaci na All Files)
Snimi u folder OCRScripts koji se nalazi na C: Program Files / URUSoft / Subtitle Workshop
Otvori SW, sa lijeve strane gdje piše default izaberi taj fajl koji si imenovao neko_ime.ocr i poslije toga pritisni F9 na tastaturi. Svi redovi sa šđčćž će da se zacrvene (od sramote ;D).
Pritisni F10. Poslije toga dosnimi izmjene i neće biti kvačica.

<!----------------------------------------------->
<!--     Subtitle Workshop OCR Script file     -->
<!-- ----------------------------------------- -->
<!--     Prilagodio i dodao nove opcije:       -->
<!--                  MilanRS                  -->
<!----------------------------------------------->

<SWOCR WordChars="abcčćdđefghijklmnopqrsštuvwxyžzABCČĆDEFGHIJKLMNOPQRSŠTUVWXYŽZ_">

<ERROR Find="(š)" ReplaceBy="s">
<ERROR Find="(Š)" ReplaceBy="S">
<ERROR Find="(č|ć)" ReplaceBy="c">
<ERROR Find="(Č|Ć)" ReplaceBy="C">
<ERROR Find="(ž)" ReplaceBy="z">
<ERROR Find="(Ž)" ReplaceBy="Z">
<ERROR Find="(đ)" ReplaceBy="dj">
<ERROR Find="(Đ)" ReplaceBy="Dj">

</SWOCR>
Naslov: Odg: OCR skripta za SW
Autor: magila - 02.03.2009. 07:25:40
Milane, to je OK, ali me zanima, kako bi se taj OCR što briše foneme,
inaktivirao?
To jest, kako bi to radilo samo po potrebi.
Naime, ja u jednom trenutku takođe poskidam sve foneme, pa ih vraćam
tamo gde treba.(duža je priča zašto).
Naslov: Odg: OCR skripta za SW
Autor: noodleshr - 06.03.2009. 22:55:56
Otvori novi dokument u Notepad.
Ovo sve selektuj, pa Ctrl+C, pa u Notepad Ctrl+V.
Snimi kao neko_ime.ocr (ispod gdje piše Text Document prebaci na All Files)
Snimi u folder OCRScripts koji se nalazi na C: Program Files / URUSoft / Subtitle Workshop
Otvori SW, sa lijeve strane gdje piše default izaberi taj fajl koji si imenovao neko_ime.ocr i poslije toga pritisni F9 na tastaturi. Svi redovi sa šđčćž će da se zacrvene (od sramote ;D).
Pritisni F10. Poslije toga dosnimi izmjene i neće biti kvačica.

<!----------------------------------------------->
<!--     Subtitle Workshop OCR Script file     -->
<!-- ----------------------------------------- -->
<!--     Prilagodio i dodao nove opcije:       -->
<!--                  MilanRS                  -->
<!----------------------------------------------->

<SWOCR WordChars="abcčćdđefghijklmnopqrsštuvwxyžzABCČĆDEFGHIJKLMNOPQRSŠTUVWXYŽZ_">

<ERROR Find="(š)" ReplaceBy="s">
<ERROR Find="(Š)" ReplaceBy="S">
<ERROR Find="(č|ć)" ReplaceBy="c">
<ERROR Find="(Č|Ć)" ReplaceBy="C">
<ERROR Find="(ž)" ReplaceBy="z">
<ERROR Find="(Ž)" ReplaceBy="Z">
<ERROR Find="(đ)" ReplaceBy="dj">
<ERROR Find="(Đ)" ReplaceBy="Dj">

</SWOCR>

Dakle, Milane...svaka čast! Puno Ti hvala.
Naslov: Odg: OCR skripta za SW
Autor: MilanRS - 06.03.2009. 23:20:58
Ipak bih ti ja preporučio da probaš program AviAddXsubs, koristi se za dodavanje titla .avi snimku i onda plejeri mogu prikazati i šđčćž. Proces ubacivanja titla traje oko 2 minuta po epizodi i vrlo jednostavno je.
Ipak gledati bez kvačica nije ni približno isto doživljaju gledanja sa kvačicama.
Naslov: Odg: OCR skripta za SW
Autor: noodleshr - 14.03.2009. 20:02:08
Milane,
Isprobao sam program i jako sam zadovoljan. Moram još skužiti zašto mi na serijama titl baca malo u lijevo, no na filmovima je super.
Slažem se, s kvačicama je ipak bolji ugođaj. Hvala još jednom.
Naslov: Odg: OCR skripta za SW
Autor: MilanRS - 14.03.2009. 20:11:13
To je i meni bio problem tek kad sam počeo da koristim program.
Onda sam eksperimentisao sa pozicijom titla i mislim da sam dobro podesio.
Pogledaj na ovoj slici, podesi isto tako pa vidi da li je bolje.
Ako nije, vrati prvobitnu vrijednost.
(http://i44.tinypic.com/2ew02ld.jpg)
Naslov: Odg: OCR skripta za SW
Autor: noodleshr - 19.03.2009. 21:51:49
Puno toga još ne znam, Milane. Problem sa tekstom bio je zbog 2. sezone Heroesa koja je ripana u bitrate-u 400 i nešto x 200 i nešto, a kad sam podesio to u Subtitle bitmap-u, nije se niš promijenilo. No povećavao sam vrijednosti vp-a i uspio. Sada je fakat gušt gledati.
Naslov: Odg: OCR skripta za SW
Autor: svetlanalane - 19.04.2009. 22:43:24
Ovih dana sam imala mnogo posla oko dodavanja kvačica na jednom filmu.
U SW sam morala da preskočim sve linije u kojima ima npr. i ć i č i c a tražila sam da promenim c u ć. Postoji li mogućnost da se nekako izdvoji svako c u tom redu (da bude bold ili crvene boje) i da se izabere koje će biti promenjeno u ć a koje neće?
Nisam sigurna da li sam baš jasno napisala šta želim.
Verujem da mnoge nervira kad nema kvačica u titlu i voljna sam da to ispravljam gde god nađem.
Naslov: Odg: OCR skripta za SW
Autor: Veleno - 19.04.2009. 22:44:40
Nisam 100% siguran, ali mislim da nema. Teško.  :(
Naslov: Odg: OCR skripta za SW
Autor: MilanRS - 20.04.2009. 00:09:08
Spominjali su neki program yu titlovi ili tako nešto, koji nudi za svaku riječ da je zamijeni nekom drugom.
Pomoću OCR skripte je vrlo teško napraviti.
Naslov: Odg: OCR skripta za SW
Autor: kanda - 20.04.2009. 00:13:31
To je program titlYU. On nudi za zamjenu za riječi koje ima u svojoj bazi, pa to nije 100%. Ja ga koristim za provjeru nakon svakog prijevoda. Uvijek mi nađe grešaka.
Naslov: Odg: OCR skripta za SW
Autor: svetlanalane - 20.04.2009. 00:35:35
Mogu li dobiti link za download titlYU?
A oči su mi bile uprene u Milana za OCR skriptu :\)
Naslov: Odg: OCR skripta za SW
Autor: MilanRS - 20.04.2009. 01:30:34
:)

Pokušao sam ja jednom davno da napravim skriptu koja bi popravljala riječi ali to može samo za neke slučajeve gdje se zna sigurno šta treba. Dobro dođe da skrati posao jer npr. " cu " prebaci u " ću " jer je to jedini mogući slučaj. Dok npr. "kuca" ne može jer ne znamo da li je "kuća" ili "kuca".
A to da se oboji slovo pa da biramo koje da zamijeni, to je van OCR mogućnosti :)
Naslov: Odg: OCR skripta za SW
Autor: magila - 20.04.2009. 07:59:14
Probaj sa B3SSubTranslator.   http//mba.vozibrale.com
Nemoj da ovo shvate kao reklamu.
Naslov: Odg: OCR skripta za SW
Autor: svetlanalane - 20.04.2009. 11:08:41
Pa neka se i skrati posao, svako skraćenje je dobro. Samo ti Milane nama daj taj OCR. clapp Lako je posle ispraviti ručno manji deo.
Naslov: Odg: OCR skripta za SW
Autor: radrad - 20.04.2009. 11:46:52
Probaj sa B3SSubTranslator.   http//mba.vozibrale.com

Kako to radi, sta to radi?
Naslov: Odg: OCR skripta za SW
Autor: Strider - 20.04.2009. 16:45:50
Evo, po 101. put da napišem šta je B3SSubtranslator (http://mba.vozibrale.com)... program koji je nastao na ideji SCGTitlovi... program koji prevodi SR titlove u HR (ili one za koje VI kreirate rječnike  clapp )
Ne prevodi SVE jer nema toliki rječnik, ne radi sve umjesto vas jer neke riječi treba provjeriti i sam... Da bi radio, trebate imati instaliran "Microsoft .Net Framework 2.0" (http://www.microsoft.com/downloads/details.aspx?FamilyID=0856EACB-4362-4B0D-8EDD-AAB15C5E04F5&displaylang=en)

Ideja je da se prevode ispravni titlovi. Kako ispravan format .srt i .sub, tako i srpski titlovi koji su napisani književnim srpskim jezikom. Stoga, ubačene su riječi za ispravak, pod pretpostavkom da su napisane ispravno, npr. menica je ispravljena kao mjenica, a ne kao i moguća greška imenica, ili posedovali kao posjedovali, a ne kao posredovali.
Kako je dosta nepismenosti, uvedene su stavke "je->ije" i "ije->je". Ima mnogo grešaka pri pisanju, pa je uvedena "Typo" stavka, koju obvezno treba pregledati.

Isto tako, u "MultiValue" rječniku, mogu se odrediti uobičajene (default) vrijednosti. Vodilja je bila da je "default" vrijednost ona koja je češća. Ukoliko prevodite npr. SF film/seriju u kojoj je česta riječ "biće" (stvorenje) postavite je za "default" umjesto "bit će",
ili ako češće nailazite na besan kao bijesan, umjesto "besan - koji je bez sna"... odaberite sami. Isti je princip i ukoliko titlu nedostaju domaći fonemi: za riječ "braci" postavit ćete "default" riječ "braći" umjesto "braci" (hipokoristik od riječi brat).

U ovom rječniku se nalaze i poneki ispravci "Typo" grešaka za koje je bilo više mogućih ispravaka: npr. besmislenoh (besmisleno, besmislenih, besmislenog...).

KRATKE UPUTE ZA RAD S B3S SubTranslator-om

* Case sensitive - krivo sricane imenice ili napisane malim slovom, te rijetko, kratice kao ok-->OK
* Wrong Form - krivi rod te ili prethodne riječi
* OCR errors - greške nastale prilikom tzv. "rippanja" titla, kada je slovo "i" (bilo malo, bilo veliko) zamijenjeno slovom "l" i obratno
* Foreign words - strane, neprevodive riječi npr. "Mount Everest" ne može biti "Maunt Everest" kao ni "United"-->"Junajted", ili kad su obje riječi tuđice kao "šrapnel-->geler", ali je druga riječ prihvatljivija u hrvatskom jeziku
* Typo - krivo napisana riječ (po mogućnosti pregledati jer se može dogoditi više isto krivo napisanih riječi, ali drugačijeg značenja)
* missing Cro phonemes - nedostaju hrvatski fonemi, tj. slova č,ć,đ,š,ž (100% ispravno)
* wrong Cro phonemes - krivi hrvatski fonemi, tj. slova č,ć,đ,š,ž (100% ispravno)
* Apostrophe – krivo napisane riječi ili složenice s apostrofom
* Negation – negacija se piše odvojeno
* 1->2 – lako uočljiva razlika između Hrvatskog i Srpskog jezika, npr. "obavićemo"-->"obavit ćemo"
* je->ije – neki ljudi ne znaju kada treba napisati "ije"...
* ije->je – ...dok neki ljudi ne znaju pa još i pretjeruju!

* obvezno pregledati ispravljene riječi koje se nalaze pod sljedećim upozorenjima:
- Replaced/Wrong Form
u pitanju je obično krivi rod te ili prethodne riječi:
1. npr. "u prošlom deceniju"-->"u prošlom desetljeće" - treba promijeniti desetljeće-->desetljeću
2. npr. "u mojoj kancelariji"-->"u mojoj uredu" - dobro je ispravljeno kancelariji-->uredu, ali treba promijeniti mojoj-->mom
- Multi value
obvezno pregledati jer (kako i upozorenje kaže) postoji više značenja, npr:
Replaced:
1. "biće-->bit će" (npr. "bit će dobro", ali nerijetko se odnosi na neko živo stvorenje ili unutrašnju prirodu čovjeka npr. "to biće je bilo...")
2. "kuca-->kuća" (npr. "srce kuca", ali u većini slučajeva je u pitanju titl bez hrvatskih fonema pa je lakše vratiti 2-3 kuća u kuca, negoli 50ak nezamijenjenih kuca zamijeniti u kuća...)
Unreplaced:
1. "neko-->neko" (može biti i "netko" npr. "netko vrijedan", ali je u većini slučajeva "neko vrijeme" zbog čega je i ostavljeno nepromijenjeno)
2. "bili-->bili" (može biti više mogućnosti pa je stoga nepromijenjeno: bili ("bili smo"), bi li ("bi li vi htjeli") ili strano ime Billy (slučaj kod srpskih titlova, da se imena piše kako se izgovaraju, a ne kako se izvorno pišu).

Ako vam ne odgovara to što će prevoditi srpski u hrvatski, prepravite rječnike, ili izbrišite iz rječnika one riječi koje vam ne odgovaraju. Ostavite missing i wrong Cro phonemes da bi ispravilo "rijeci bez kvacica".

Nadam se da je ovo dovoljno pojašnjenje u svezi programa da biste ga počeli koristiti, a uz to još i:
1. besplatan je  8)
2. nećete gubiti živce "diveći" se nečijoj nepismenosti
3. nećete gubiti vrijeme pokušavajući dokučiti što je "pjesnik htio reći"... kuća ili kuca
4. nećete se osramotiti s vašim titlom, jer će popraviti greške koje su vam se "slučajno provukle"  :'(

Uff, autor programa će mi platit piće za ovo!!! A još mi je danas da' ver. 0.6.9.3 na beta testiranje...!

P.S. Pozdrav Magili! Kako napreduju tvoji rječnici (tj. rečnici)?!
Naslov: Odg: OCR skripta za SW
Autor: magila - 21.04.2009. 15:42:02
Program je odličan, SAMO(!) još rečnik.
Ja ga još uvek pravim!
Naslov: Odg: OCR skripta za SW
Autor: Strider - 21.04.2009. 21:11:38
Program je odličan, SAMO(!) još rečnik.
Ja ga još uvek pravim!

SAMO(!)
bbq
Ajmeeeeee... sa srićon ti bilo, prika!!!
I podili ga s ekipom, bit će nam svima lakše. Možeš se javit i autoru da ga "izvisi" na stranicu, ako 'oćeš...
Naslov: Odg: OCR skripta za SW
Autor: MilanRS - 22.05.2009. 18:53:25
A oči su mi bile uprene u Milana za OCR skriptu :\)

Evo probaj ovo,
http://www.prijevodi-online.org/Tutorial/kvake.ocr (http://www.prijevodi-online.org/Tutorial/kvake.ocr)
ali kad otvoriš titl u SW, lijevo izaberi "kvake", pritisni F9, klikni na prvi red, idi na F11, pogledaj da li je dobro zamijenio, ako jeste idi na F12 (prelazak na sljedeći red sa greškom), ako nije idi na Ctrl+Z (undo), pa F12 (sljedeća greška) pa F11 da je ispravi (pa provjeri da li je ispravio kako treba i tako redom.
Kad primijetiš da nešto ne ispravlja kako treba, zapiši na neki papir pa mi poslije pošalji da ispravim.
To važi za sve koji hoće da testiraju skriptu.
Ja je nisam puno koristio pa ne znam da li dobro radi i da li olakšava posao dodavanja kvačica.
Ima nekih drugih programa koje su drugi preporučivali, pa vidite šta bolje radi.
Naslov: Odg: OCR skripta za SW
Autor: magila - 23.05.2009. 10:12:56
Milane care, ovo uopšte ne ispravlja kvake! Ni jednu jedinu.
Ispravlja one opšte greške, ali kvake - ne.
Tačno sam postupao po tvom uputstvu.
Naslov: Odg: OCR skripta za SW
Autor: magila - 23.05.2009. 10:32:59
Preciznije: ispravlja samo ono što je konstatovao kao grešku.
(A nedostajuće kvake uopšte ne konstatuje!).
Čak ni te ocr greške, koje inače ispravlja u linijama koje  je markirao,
ne ispravlja u ostatku teksta. Iako su greške istovetne!
Naslov: Odg: OCR skripta za SW
Autor: svetlanalane - 23.05.2009. 12:16:49
Da, ne ispravlja kvačice, provereno, ni ostale greške, kao što reče magila.
Pravim spisak reči koje još treba uneti u skriptu, pa ću poslati kad se nakupi još.
Naslov: Odg: OCR skripta za SW
Autor: MilanRS - 23.05.2009. 15:33:28
Nesporazum, čini mi se.
Ovo je dodatna skripta, ne zamjenjuje upotrebu onih prethodnih. U nju nije ubačeno da ispravlja "pobjedio" u "pobijedio" na primjer kao što radi ona Default.
Ova skripta ne mijenja svako c u č ili ć, ona mijenja samo neke riječi koje su navedene u skripti.
Ako ste je snimili u Program Files, URUSoft, OCR Skripts, kad je izaberete lijevo u SW, zamijeniće određen broj riječi ali to je samo pomoć za one koji će poslije toga da ručno isprave ostale slučajeve upotrebe c umjesto č ili ć.
Sad sam provjerio, otvorio sam titl Weeds 3.09,
izabrao "kvake" lijevo, išao F9, redovi 3, 4, 9 su postali crvene boje, kliknuo na prvi red, išao F12, prebacilo me u 3. red, išao F11, od "Mrdni usnama. Kazi nesto." dobijeno je "Mrdni usnama. Kazi nešto."
Ponovo F12, prebacilo me je u 4. red, F11 i umjesto "Sta su ove linije." dobija se "Šta su ove linije."
Toliko bi trebalo da radi ispravno i kod vas. Ako ne radi, javite da vidim u čemu je problem.

Napomena: Nadam se da niste otvorili u browseru tu skriptu pa je selektovali i kopirali u Notepad pa snimili. Kliknite desnim klikom na link, pa Save link as, izaberite tamo gdje treba, ako je na Visti, morate je prvo snimiti negdje drugo pa prekopirati u Program Files.
Naslov: Odg: OCR skripta za SW
Autor: magila - 23.05.2009. 16:45:00
Da, radi samo za "Sta". Bio sam uzeo titl gde je trebalo popraviti na ć i č.
A ovo radi ovako delimično, to je "find replace" kombinacija.
Neće raditi za resto...
Naslov: Odg: OCR skripta za SW
Autor: MilanRS - 23.05.2009. 16:52:59
Upravo tako.
Zato sam i rekao ovo prije:


Evo probaj ovo,
[...]
Ja je nisam puno koristio pa ne znam da li dobro radi i da li olakšava posao dodavanja kvačica.
Ima nekih drugih programa koje su drugi preporučivali, pa vidite šta bolje radi.

Ovo nije najbolji način za taj posao, već postoje drugi programi koji nude da se izabere koja riječ bi trebalo da se zamijeni sa postojećom i sl.
Inače je teško napraviti nešto za dodavanje kvačica, postoji mnogo riječi gdje samo čovjek može znati da li treba biti sa č, ć ili c. Zavisi od konteksta.
Najlakše je da onaj koji kuca prevod odmah koristi sva slova azbuke ili abecede i riješen problem ;)
Naslov: Odg: OCR skripta za SW
Autor: magila - 23.05.2009. 17:11:53

Najlakše je da onaj koji kuca prevod odmah koristi sva slova azbuke ili abecede i riješen problem ;)
E Milane, kad bi to tako bilo... U ruke ti dopadnu titlovi od ljudi, koji jednostavno neznaju da podese tastaturu
za naše foneme.
Ili još gore, dobar titl iskopiraju u Notepad, pa im on sve pobriše.
Neznaju da ga podese.
Naslov: Odg: OCR skripta za SW
Autor: krbo - 23.05.2009. 21:26:31
Ja je nisam puno koristio pa ne znam da li dobro radi i da li olakšava posao dodavanja kvačica.
Ima nekih drugih programa koje su drugi preporučivali, pa vidite šta bolje radi.

SW sigurno nije namijenjen kao spell/dictionary checker, zato nije ni opremljen pametnijim opcijama.

Ništa tu ne može konkurirati B3S SubTranslatoru, imate dobre striderove rječnike za hrvatski, a bilo bi dobro da se i
netko prihvati srpskih rječnika i onda ih polako vas nekoliko zajedno nadogradi od kvačica do , recimo, pretvaranja eng. imena i naziva u fonetske oblike.

B3S koristi nekoliko rječnika:

accepted za ispravne i dozvoljene riječi
replaceable za jednoznačne ispravke
multiword za riječi koje mogu imati više do jednog značenja

tako pogrešna riječ "kuca" može biti kuća no može značiti i pas od milja

trenutno su rječnici u jednostavnoj ASCII formi tako da se mogu sređivati i u excellu kao CVS file, primjer:

aboriđan;Aboridžin;Case sensitive
aboriđanska;aboridžinska;wrong Cro phonemes
aboriđin;Aboridžin;wrong Cro phonemes
abortira;pobaci;


i jedan iz multiworda:

aleksej;Aleksej;;true;Alexei;;false;Aleksei;;false
alekseju;Alekseju;;true;Alexeiu;;false
ambasada;veleposlanstvo;;true;ambasada;;false


svakako, program ima i interni dictionary editor.

malo više info na:

http://uk.geocities.com/striderco/b3ssubtitler.html (http://uk.geocities.com/striderco/b3ssubtitler.html)


u početku dok se puni rječnik je dosadno i sporo no kasnije to ide drastično brže, a i samo unošenje ispravka riječi
je puno lakše od edita OCR skripte.

Svako vrijedi pogledati i probati program, ja više bez njega ništa ne radim....



Naslov: Odg: OCR skripta za SW
Autor: MilanRS - 04.07.2009. 22:12:47
Napravljen je update skripte 1 i 2.
Dodato je da napravi razmak poslije ? i ! ako ima - za promjenu govornika.

Prva rečenica?-Druga rečenica.
Prva rečenica? -Druga rečenica.
Naslov: Re: OCR skripta za SW
Autor: MilanRS - 09.03.2010. 16:12:42
Već dugo nije bilo pisanja u ovoj temi.
Skripte nisam mijenjao isto tako dugo.
Kod sebe sam ispravljao neke greške koje sam uočio, ali kad bude nekih većih promjena, napraviću update i skripte na sajtu.

Za sada, evo nešto što je želio jedan član, pa možda još nekome može biti korisno.

Ako želite da uklonite ... na početku linije titla,
dodajte ovo u skriptu koju koristite:

<ERROR Find="^(\.\.\.)" ReplaceBy="">

Ako treba da uklanja i na početku drugog reda, treba dodati i ovo:
<ERROR Find="[\n](\.\.\.)" ReplaceBy="">

Korisnici Viste ili Win7 najvjerovatnije neće moći da mijenjaju skriptu direktno u folderu OCRScripts nego treba da je kopiraju na Desktop ili u neki drugi folder, izmijene što treba pa je vrate tamo. Kad je budu vraćali, treba da potvrde da žele ukloniti postojeću, tj. zamijeniti je novom.

--------------------------------
Ako imate nekih prijedloga, ideja ili želja, pišite pa ću pokušati da napravim to.
Naslov: Re: OCR skripta za SW
Autor: magila - 09.03.2010. 17:27:45
Milane, kako bi se rešio problem tzv. "nemih" titlova, tj. onih koji se ne izgovaraju u filimu?
Npr:"Lijeva Rijeka 1830".
Oni ometaju kod sinhronizacije tritla.
Jako ih je teško naći, ako nisu posebno istaknuti velikim slovima ili  nečim drugim.
Posebna priča su prevodi pesama koje se pevaju u filmu. Na žalost i toga ima. "Lion King" npr. je u stvari crtani mjuzikl.
Skoro da sam svaki titl ručno sinhronizovao.
Kako ih naći , neutralizovati i po potrebi vratiti u sinhronizovamn titl.
Imam neke ideje, ali voleo bih da čujem šta drugi misle o tome.
Zahvalan Magila.
Tvoji skriptovi rade. U kombinaciji sa drugim programima su nezamenljivi.
Naslov: Re: OCR skripta za SW
Autor: MilanRS - 09.03.2010. 18:15:05
Što se tiče tih pitanja, nisam stručan.
Ja samo znam oko regularnih izraza, a ništa o pisanju pascal skripti i ostalih dodataka.
Ona skripta za isticanje redova sa preko 25 cps je odlična, rađena u pascalu, ja sam je našao ovdje na forumu i koristim je često.
Naslov: Re: OCR skripta za SW
Autor: radrad - 09.03.2010. 18:23:02
Korisnici Viste ili Win7 najvjerovatnije neće moći da mijenjaju skriptu direktno u folderu OCRScripts nego treba da je kopiraju na Desktop ili u neki drugi folder...

Control Panel--> User Accounts--> Change User Account Control settings i onda namestiti na Never notify. Tako vise nikada nece izbacivati sranja tipa da li ste sigurni da to zelite da uradite i imacete kontrolu nad kompom kao administrator...
Naslov: Re: OCR skripta za SW
Autor: dvkv - 09.03.2010. 18:41:43
Milane, da li imaš neku skriptu, koja ispravlja razmak posle tačke?
Na primer: Divno.Zaboravila si na gumu. u Divno. Zaboravila si na gumu.
Naslov: Re: OCR skripta za SW
Autor: MilanRS - 09.03.2010. 18:58:16
Ima to već u skripti.
Uz izuzetke, da ne pravi razmak iza tačke ako npr. piše:
"Colt .45 je..." ili u web/mail adresi.

Ovaj dio iz skripte je zadužen za to:

   <!-- Smart space after dot -->
   <ERROR Find="[a-su-zá-úńä-ü](\.)[^(\s\n\.\*\?\!\x22\x3C)]" ReplaceBy=". "> <!-- osim kad je zadnje t (rijec kolt) -->
   <!-- Oznaka za kalibar. Npr. "Colt .45" -->
   <!-- Da bi radilo, da bi ovaj razmak bio dozvoljen, u SW idite Alt+I i odcekirajte "Razmaci ispred tacke" -->
   <ERROR Find="(t\.)[0-9][0-9]" ReplaceBy="t .">

   <!-- Podešavanje oko domena -->
   <ERROR Find="(\. )com" ReplaceBy=".">
   <ERROR Find="www(\. )" ReplaceBy=".">
   <ERROR Find="(\. )net" ReplaceBy=".">
   <ERROR Find="(\. )org" ReplaceBy=".">
   <ERROR Find="(\. )rs" ReplaceBy=".">
   <ERROR Find="(\. )yu" ReplaceBy=".">
   <ERROR Find="(\. )hr" ReplaceBy=".">
   <ERROR Find="http\:(\/)[a-z]" ReplaceBy="//">   
    <ERROR Find="[^(A-ZŠĆŽČĐ\.)](\.)[A-ZŠĆŽČĐ]" ReplaceBy=". "> <!-- osim kod L.A. T.R. i sl. -->

---------------
Ako ti to sve nije bitno i želiš razmak poslije svake tačke ako slijedi veliko slovo, potrebno ti je samo ovo:
   <ERROR Find="(\.)[(A-ZŠĐČĆŽ)]" ReplaceBy=". "> <!-- ako izmedju tacke i velikog slova nema razmaka, bice napravljen -->
Naslov: Re: OCR skripta za SW
Autor: dvkv - 09.03.2010. 19:33:49
Hvala na pomoći.
Naslov: Re: OCR skripta za SW
Autor: pejafor3 - 26.03.2010. 12:27:46
Meni bi trebala jedna skripta.

primeri:
1. Radimo Billy-jev film.
2. Da li si ti proèitao Walsh-ov scenario?
da pretvori u

Radimo Billyjev film.
Da li si ti pročitao Walshov scenario?

Naslov: Re: OCR skripta za SW
Autor: magila - 27.03.2010. 06:07:40
Za "è" učitaš ceo prevod u MS Word, promeniš mu kodnu stranu u npr. 125o.
Snimiš to kao tekst(*.txt) Učitaš u Subbtitle Workshop i snimiš kao (*.srt).

Za ove crtice je lako napraviti skript, ali on će ti brisati Jean-Marry, kod ovakvih imena.
Nadam se da Milan već ima gotovo rešenje skripta za crtice.
Naslov: Re: OCR skripta za SW
Autor: pejafor3 - 27.03.2010. 13:52:35
Za ove crtice je lako napraviti skript, ali on će ti brisati Jean-Marry, kod ovakvih imena.


Možda da se ubaci u skriptu....
primer:
Jean-Marry-no dete i suprug...
da prebaci u
Jean-Marryno dete i suprug...
(znači, samo na kraju reči... kada vidi "-slova-spejs)

Za početak mi je obična skripta važnija, posle ako naiđem na neke greške...

dovoljno je da  briše "-" iza imena ako ima samo 3 slova iza
primer:
Michael-ovo
Michael-ova
Michael-u
Cristopher-ovo
Jenny-ine


 da ne briše posle trećeg slova.

Uglavnom iza imena

Naslov: Re: OCR skripta za SW
Autor: MilanRS - 27.03.2010. 15:57:52
Neće biti problem oko Jean-Marry jer ću staviti kao uslov da je ispred crtice malo slovo, iza crtice takođe malo slovo.
Onda ostaje samo problem oko složenica: ovo-ono, tamo-amo, ... pa ću vidjeti kako da to riješim.
Mislio sam da pravim posebno za svaki nastavak, -a, -e, -ov, -in, ali opet bi vjerovatno nešto ostalo neobuhvaćeno.
Sad sam se sjetio da mogu zadati da riječ mora počinjati velikim slovom tako da bi to riješilo određene probleme.

Napraviću probnu verziju pa na osnovu primijećenih grešaka vršiti unapređenja.
Naslov: Re: OCR skripta za SW
Autor: MilanRS - 28.03.2010. 18:57:36
Razmak između crticâ ne postoji. Nemaju nigdje dvije crtice pa da se između njih pravi razmak.
Ovo što ti se obriše dvostruki razmak ISPRED crtice nema veze sa skiptama, nego sa podešavanjem SW.

Uradi sljedeće:
Otvori SW,
Alt+I,
treći tab: Check For,
isključi: Unnecessary Spaces,
četvrti tab: Fix,
isključi: Unnecessary Spaces.

Sada neće brisati dvostruku razmak, nebitno koju skriptu koristiš.

Pozdrav.
Naslov: Re: OCR skripta za SW
Autor: MilanRS - 28.03.2010. 22:42:31
Gotovo prvo izdanje.

Ispravno briše crticu:

primeri:
1. Radimo Billy-jev film.
2. Da li si ti proèitao Walsh-ov scenario?

U:
Radimo Billyjev film.
Da li si ti pročitao Walshov scenario?

Za početak mi je obična skripta važnija, posle ako naiđem na neke greške...
... prijavi ih.

Desni klik na link pa Save...
http://www.prijevodi-online.org/Tutorial/ime-.ocr (http://www.prijevodi-online.org/Tutorial/ime-.ocr)

-------------
Edit: Našao sam određene nedostatke.
Kod "Mhm-hm" će obrisati crticu. Ne znam zašto se tako nešto uopšte nalazi u prevodu...
Kod "Ja-ja nisam..." će obrisati crticu. Ne znam zašto prevodioci pokušavaju da doslikaju kako je govornik zapeo pri izgovoru riječi. To se čuje.
Naslov: Re: OCR skripta za SW
Autor: magila - 29.03.2010. 07:27:43
Kod "Mhm-hm" će obrisati crticu. Ne znam zašto se tako nešto uopšte nalazi u prevodu...
Kod "Ja-ja nisam..." će obrisati crticu. Ne znam zašto prevodioci pokušavaju da doslikaju kako je govornik zapeo pri izgovoru riječi. To se čuje.
Mislim da je to zbog toga, što su koristili titl na engleskom, namenjen ljudima sa slabim sluhom.
Tu imaš sve i ko govori , razne onomtopeje, opise radnji.
Vrlo je korisno prilikom prevođenja. Ali, kao što vidiš ostavlja i posledice u obliku
tih zaostataka.

Sve to je obeleženo velikim uglastim zagradama "[", "]". Ručno to brisati je prava mora.
Uz to možeš obrisati i nešto što ti treba.

Pa evo još jednog zadatka - brisanje teksta koji je uokviren tim uglastim zagradama. (?)
Naslov: Re: OCR skripta za SW
Autor: Veleno - 29.03.2010. 07:43:40
Mislim da ti to sam SW makne, ukoliko staviš da briše Hearing Impaired subtitles.
Naslov: Re: OCR skripta za SW
Autor: pejafor3 - 29.03.2010. 09:41:34
Radi skripta.

 rofl rofl rofl rofl rofl
Uzmem da je testiram, a ono sve
Whoo-hoo! Uh-uh. Mah-mah. Urgh-urgh
 rofl rofl rofl
Prevod za Entourage.
Najsmešniji prevod od svih serija koje sam gledao.
Svaka epizoda je ovakva.

Hey, Ari. Ko jebe
kriticara. -Uh-huh.

Hey, Ari. Ko jebe
kriticara. -Uhhuh.

Whoo-hoo!
Whoohoo!

Whoo-hoo-hoo
Whoohoo-hoo

Nuh-uh.
Nuhuh.

Radi super.
(I ako je reč pod "")

Jednog dana kad budeš završio
sa sisanjem Terranc-ove sise,

Jednog dana kad budeš završio
sa sisanjem Terrancove sise,

ko želi malo Johnny-a plavog?
ko želi malo Johnnya plavog?

Jesi li gledao Johnny-ja
u interviju? -Kako je bilo?

Jesi li gledao Johnnyja
u interviju? -Kako je bilo?


OVDE je problem... zahvaljujući "odličnom" titlu

Jamie-lynn glumica iz "the sopranos."
Jamielynn glumica iz "the sopranos."

Kada prepraviš lynn u Lynn
onda radi kako treba

Sve u svemu super.
Hvala puno.
 smileyNO1
Naslov: Re: OCR skripta za SW
Autor: Cata - 29.03.2010. 19:38:53
Svaka čast, Milane.
Šta bi mi da tebe nema.  Smajlicvece
Naslov: Re: OCR skripta za SW
Autor: pejafor3 - 08.04.2010. 19:51:16
Petkoooo

Ovu skriptu dosta koristim kada radim sa dva titla.

Ovo je nešto kao komanda CTRL+K za spajanje titlova... (kada radiš sa jednim titlom)
Selektujem dve linije, pokrenem komandu i spojim ih u Translate, a originalni titl mi ostaje netaknut.
Treba mi isto ovo ali da mi radi u Originalnom prevodu, odnosno da mi spoji linije u originalu, a da mi u Translate modu ostane netaknuto.

// Join and Delete subtitles (only from translation). Original by Bedazzle.
// Edited by anonymous.
// Deletes selected translations and shifts remainder up.

program JoinAndDeleteSubs;

// -----------------------------------------------------------------------------

var
 n: Integer;
 i: Integer;
 j: Integer;
 txt1: string;
 txt2: string;
 displacement : Integer;

 lasttrans : String;
 work : boolean;

begin
 if not IsTranslatedloaded then
    exit;

 n := GetSubtitleCount-1;

 displacement := 0;
 for i := 0 to n do
    if (IsSubtitleSelected(i)=true) then
       begin
          if i<>n then
          begin
         txt1 := GetSubtitleTrans(i);
         txt2 := GetSubtitleTrans(i+1);
             txt1 := txt1 + ''#13''#10 + txt2;
             SetSubtitleTrans(i+1, txt1);
          end;

          for j := i-displacement to n-1 do
             SetSubtitleTrans( j, GetSubtitleTrans(j+1) );

          SetSubtitleTrans(n, '- Untranslated subtitle -');
          i := i+1;
          displacement := displacement + 1;
       end;
end.
Naslov: Re: OCR skripta za SW
Autor: petko - 08.04.2010. 20:23:30
Pejo, za ovo ne treba praviti neku posebnu skriptu.
Selektuj prvu liniju koju hoćeš da spajaš pa onda pomoću postojeće skripte Insert subtitle only in translation ubaci jednu praznu u translation, zatim selektuj i drugu liniju, odradi Ctrl+K i rešena stvar.
To ako sam dobro skapirao šta ti treba.

:)
Naslov: Re: OCR skripta za SW
Autor: pejafor3 - 08.04.2010. 21:02:20
Pejo, za ovo ne treba praviti neku posebnu skriptu.
Selektuj prvu liniju koju hoćeš da spajaš pa onda pomoću postojeće skripte Insert subtitle only in translation ubaci jednu praznu u translation, zatim selektuj i drugu liniju, odradi Ctrl+K i rešena stvar.
To ako sam dobro skapirao šta ti treba.

:)

To već imam!
Ali mi onda spaja i titlt i u orginal i u translation!
Naslov: Re: OCR skripta za SW
Autor: petko - 08.04.2010. 22:08:20
Ok, što kažu "veži konja gde gazda kaže"...

// Delete subtitle (only from translation). Made by Bedazzle.
// Join subtitles (only in original)... modifikacija petko

program JShiftSubs;

// -----------------------------------------------------------------------------

const
    cCR = ''#13''#10;

var
  n: Integer;
  s: Boolean;
  i: Integer;

  curr: Integer;
  txt: String;

begin
  n := GetSubtitleCount;

  s := false;

  for i := 1 to n do
  begin
     if (s = false) then
     begin
        if (IsSubtitleSelected(i) = true) then
        begin
           curr := i;
           break;
        end;
     end;
  end;
 
  txt := GetSubtitleText(i) + cCr + GetSubtitleText(i+1);
  SetSubtitleText(i, txt);
  SetSubtitleFinalTime(i, GetSubtitleFinalTime(i+1));
  curr := curr + 1;

  for i := curr to n-1 do
  begin
     txt := GetSubtitleText(i+1);
     SetSubtitleText(i, txt);
     SetSubtitleInitialTime(i, GetSubtitleInitialTime(i+1));
     SetSubtitleFinalTime(i, GetSubtitleFinalTime(i+1));
  end;
 
  SetSubtitleText(n-1, '- Untranslated subtitle -');
end.

 ;D
Naslov: Re: OCR skripta za SW
Autor: pejafor3 - 08.04.2010. 22:45:28
Shit Works!
 clapp clapp rofl rofl

 smileyNO1 smileyNO1
Naslov: Re: OCR skripta za SW
Autor: hajo0309 - 16.04.2010. 21:21:04
Milane, imam jedan problemčić vezan za drugu skriptu...
Neće mi izbrisati razmak poslije crtice za promjenu govornika i ne promijeni mi l u I ako linija izgleda ovako:

What are you doing?
- l've got this problem.

Znači, ako se poslije crtice i razmaka nalazi l i onda apostrof...


(http://i41.tinypic.com/b7nw39.jpg)
Naslov: Re: OCR skripta za SW
Autor: MilanRS - 16.04.2010. 21:31:20
Neće mi izbrisati razmak poslije crtice za promjenu govornika

Riješićemo. ;)

Dok istražim ovo drugo, evo ti rješenje za prvi problem.
Naime, to nije do skripte (bar ove moje), nego do podešavanja SW-a.

Otvori SW,
Alt+I,
drugi tab: Advanced,
Space after Characters: Izbriši crticu.
Ako je tu crtica, on će nasilno napraviti razmak poslije nje, iako ga prethodno skripta ukloni.
Moja preporuka je da izbrišeš sve iz ta dva polja: Space after i Space before ch.
Naslov: Re: OCR skripta za SW
Autor: hajo0309 - 16.04.2010. 21:34:35
Neće mi izbrisati razmak poslije crtice za promjenu govornika

Riješićemo. ;)

Dok istražim ovo drugo, evo ti rješenje za prvi problem.
Naime, to nije do skripte (bar ove moje), nego do podešavanja SW-a.

Otvori SW,
Alt+I,
drugi tab: Advanced,
Space after Characters: Izbriši crticu.
Ako je tu crtica, on će nasilno napraviti razmak poslije nje, iako ga prethodno skripta ukloni.
Moja preporuka je da izbrišeš sve iz ta dva polja: Space after i Space before ch.


Hvala, ali već mi je podešeno tako, prazna su mi oba polja...
(http://i40.tinypic.com/nwn280.jpg)
Naslov: Re: OCR skripta za SW
Autor: MilanRS - 16.04.2010. 21:48:42
What are you doing?
- l've got this problem.
Ovo nije bilo zato što je to za engleski jezik, a skripta je pravljena za prevode. :)
Nikakav problem.
Nađi na početku skripte ova dva reda:
<ERROR Find="( l )" ReplaceBy=" I ">
<ERROR Find="(-l )" ReplaceBy="-I ">

i ispod toga dodaj sljedeća tri reda:
<ERROR Find="( l')" ReplaceBy=" I'">
<ERROR Find="(-l')" ReplaceBy="-I'">
<ERROR Find="^(l')" ReplaceBy="I'">

Ako pronađeš još nešto, javi slobodno.

Što se tiče prvog problema, ili koristiš prvu skriptu (ona to ne briše), ili je obrisano što ne treba.
Provjeri ima li pri kraju skripte ovaj dio koda:
<!-- Brisanje razmaka iza crte - na početku 2. reda -->
<ERROR Find="[\n](- )[A-ZŠĆŽČĐ\x22]" ReplaceBy="-">

Ako ima to, daj mi primjer rečenice gdje ne briše razmak
ili mi pošalji skriptu na moj username @gmail.com da je sam isprobam.
Naslov: Re: OCR skripta za SW
Autor: hajo0309 - 16.04.2010. 21:54:33
Hvala još jednom, probat ću pa javim!
Pozdrav...
Naslov: Re: OCR skripta za SW
Autor: MilanRS - 16.04.2010. 22:06:01
Sad sam se sjetio...
Ako je broj ili malo slovo poslije crtice, ne briše razmak.
Samo ako je veliko slovo, onda briše.
Malo slovo sam izostavio zbog slučajeva kad neko upotrijebi crticu kao sredstvo naglašavanja drugog dijela rečenice.
Ako bi se tu izbrisao razmak, došlo bi do greške i izgledalo bi da taj dio rečenice govori drugi lik, a da je greška što je rečenica počela malim slovom.
Brojeve sam izostavio jer ako neko napiše npr. "U periodu 1850 - 1875. godine", postalo bi "U periodu 1850 -1875. godine", što opet ne bi bilo dobro.
Nezgodno je sve uštimati.
:)
Naslov: Re: OCR skripta za SW
Autor: hajo0309 - 19.04.2010. 11:06:25
Sad sam se sjetio...
Ako je broj ili malo slovo poslije crtice, ne briše razmak.
Samo ako je veliko slovo, onda briše.
Malo slovo sam izostavio zbog slučajeva kad neko upotrijebi crticu kao sredstvo naglašavanja drugog dijela rečenice.
Ako bi se tu izbrisao razmak, došlo bi do greške i izgledalo bi da taj dio rečenice govori drugi lik, a da je greška što je rečenica počela malim slovom.
Brojeve sam izostavio jer ako neko napiše npr. "U periodu 1850 - 1875. godine", postalo bi "U periodu 1850 -1875. godine", što opet ne bi bilo dobro.
Nezgodno je sve uštimati.
:)

Aha, dobro.
Jel se može složiti da najprije prebaci ovo l (malo slovo) u I (veliko slovo) pa bi se onda razmak dao izbrisati...
Naslov: Re: OCR skripta za SW
Autor: hajo0309 - 20.04.2010. 15:15:30
Sad vidim da mi ne pretvara sve l i I... ???
Evo primjera, neke promijeni, neke ne. Evo primjera:
(http://i44.tinypic.com/25i3v9j.jpg)
Naslov: Re: OCR skripta za SW
Autor: MilanRS - 20.04.2010. 16:25:47
Pošto ti sređuješ engleski titl, probaj ga provući kroz default skriptu koja dolazi uz SW.
Oni su nju prilagodili da ispravlja te ripping mistakes, pretpostavljam da će srediti sve te slučajeve.
Ako ne sredi, onda ćemo praviti dodatne linije koda.
P.S. Zašto tebi treba ispravan engleski titl? Ako ćeš ga kasnije prevoditi, svejedno je da li je bilo l know ili I know. :)
Naslov: Re: OCR skripta za SW
Autor: hajo0309 - 20.04.2010. 18:37:21
Zašto tebi treba ispravan engleski titl? Ako ćeš ga kasnije prevoditi, svejedno je da li je bilo l know ili I know. :)
Ne, ne treba. Samo se čudim kako negdje ispravi, negdje ne.
Naslov: Re: OCR skripta za SW
Autor: MilanRS - 25.04.2010. 22:50:10
Poslije 9 mjeseci napravljen je update MilanRS2 skripte.
Tokom ovih mjeseci ispravljao sam greške koje sam uočavao, ali nisam mijenjao fajl na sajtu.
Večeras sam dodao code koji uklanja - i ako je ona iza <i> (hvala Ziledinu na prijedlogu), sređena je greška oko .. na početku reda, izbacio sam code koji je ispravljao gdin u gosp. jer ni jedan ni drugi oblik nisu ispravni.

Raspoložen sam za prijedloge i ideje, slobodno recite.
Naslov: Re: OCR skripta za SW
Autor: magila - 13.05.2010. 07:51:10
Mislim da ti to sam SW makne, ukoliko staviš da briše Hearing Impaired subtitles.
Ne znam gde grešim, ali TO ne radi!
Čekirao sam i u " Chek for" tabu i u "Fix" tabu.
Naslov: Re: OCR skripta za SW
Autor: petko - 13.05.2010. 08:33:17
Mislim da ti to sam SW makne, ukoliko staviš da briše Hearing Impaired subtitles.
Ne znam gde grešim, ali TO ne radi!
Čekirao sam i u " Chek for" tabu i u "Fix" tabu.

Daj konkretan primer šta je propustio da obriše.

:)
Naslov: Re: OCR skripta za SW
Autor: magila - 13.05.2010. 11:08:23
Nebitno je.
Napravio sam mali ocr koji sve briše.
Prroverite možda negde grešim.
<!----------------------------------------------->
<!--     Subtitle Workshop OCR Script file     -->
<!-- ----------------------------------------- -->
<!--     Autor skripte:                         -->
<!--     magila                                   -->
<!--     13.05.2010.                          -->
<!----------------------------------------------->
<SWOCR WordChars="0123456789abcčćdđefghijklmnopqrsštuvwxyžzABCČĆDEFGHIJKLMNOPQRSŠTUVWXYŽZ_ńŃáéíóúÁÉÍÓÚäëďöü">

<!-- briše tekst za gluve -->

<ERROR Find="([)([a-z])(])" ReplaceBy="">


</SWOCR>
Naslov: Re: OCR skripta za SW
Autor: MilanRS - 27.06.2010. 22:27:05
Slike sa podešavanjima SW-a.
Ovako je kod mene podešeno i skripta radi kako treba.
Nije obavezno da i kod vas sve bude identično podešeno.
Neophodno je da u polju: Space after charachers ne bude tačka.

1.
http://i45.tinypic.com/25unq1i.jpg

2.
http://i50.tinypic.com/2dselb4.jpg

3.
http://i50.tinypic.com/16kdnqw.jpg

4.
http://i48.tinypic.com/28salv7.jpg

5.
http://i46.tinypic.com/2iks4gk.jpg
Naslov: Re: OCR skripta za SW
Autor: Macondo - 27.06.2010. 23:17:27
Kod mene je nešto slično, mada je meni pod obavezno u onom
Check for
      Overlapping subtitles


Ovo je dobro kada radite podešavanje samo nekih linija jer meni se uvek potkrade bar jedno od ovih preklapanja
Naslov: Re: OCR skripta za SW
Autor: MilanRS - 27.06.2010. 23:25:45
Kod mene je to izabrano u Fix.
Ne treba mi da vidim koliko ih se preklapa, samo mi treba da on to popravi kad idem F10.
Ali, naravno da treba to izabrati ako se želi vidjeti koji se redovi preklapaju.
Macondo, dobar prijedlog.
Naslov: Re: OCR skripta za SW
Autor: MilanRS - 11.07.2010. 21:10:50
Poslije 2-3 mjeseca sitnih dopisivanja i večerašnjeg dodavanja redova za ispravak takozvanih "ripping mistakes" i duplih tagova, u drugi post teme je postavljena osvježena verzija MilanRS2 skripte.
(Skripta MilanRS1 nije u planu za osvježavanje. Programeri bi rekli: deprecated [wiki (http://en.wikipedia.org/wiki/Deprecation)].
Naslov: Re: OCR skripta za SW
Autor: Cata - 11.07.2010. 22:16:54
Hvala Milane.  clapp
Naslov: Re: OCR skripta za SW
Autor: Veleno - 11.07.2010. 22:32:36
Hvala Milane, br. 1 koristim samo u iznimnim slučajevima, dok je ova, br. 2 radna  smileyNO1
Naslov: Re: OCR skripta za SW
Autor: igniss - 24.09.2010. 20:49:39
Milane, zašto mi tvoja skripta za sve tekstove koji su italik daje obaveštenje da je to tekst za osobe sa oštećenim sluhom?
Naslov: Re: OCR skripta za SW
Autor: kugi001 - 25.09.2010. 19:25:47
Milane, zašto mi tvoja skripta za sve tekstove koji su italik daje obaveštenje da je to tekst za osobe sa oštećenim sluhom?
To nije do Milanove skripte. Ako ti ne treba provjera za italic titlove isključi: tools->information & errors->Settings->Check for tab-> makni kvačicu s Hearing impaired subtitles
Naslov: Re: OCR skripta za SW
Autor: igniss - 25.09.2010. 19:42:13
Meni treba da proverava da li ima te vrste titlova, ali se tu koriste drugačije zagrade.
Naslov: Re: OCR skripta za SW
Autor: kugi001 - 25.09.2010. 20:03:24
Meni treba da proverava da li ima te vrste titlova, ali se tu koriste drugačije zagrade.
Svejedno, mislim da ako isključiš to što sam napisao, opet će SW provjeravat hearing impaired titlove, sa [] zagradama, tj. bacit će OCR gresku
Naslov: Re: OCR skripta za SW
Autor: svetlanalane - 22.10.2010. 17:33:29
Više puta sam u titlovima primetila da lprevodioci umesto l pišu I na primer: "Ovi Ijudi su biIi ideaIno..." Treba malo vremena da se to ispravi, tj red po red, jer sa komandom "find --> replace all" se zamenjuju i početna slova I u rečenici. Može li neko da napravi dodatak uz skriptu ili posebnu skriptu kojom bi se ta slova u sredini rečenice validno ispravila? Smajlicvece Biće i piće.
Naslov: Re: OCR skripta za SW
Autor: Macondo - 22.10.2010. 17:35:52
pa mislim da bi to trebalo da radi u titlYu programčiću koji je ionako meni pod obavezno, jer uvek, ali uvek se potkrade neka greška u kucanju tipa zamnee redosleda slova u reči
Naslov: Re: OCR skripta za SW
Autor: Aleks@ - 22.10.2010. 17:39:30
Mož da gledaš 10 puta ručno, ali TitlYU nađe grešku obavezno.
Naslov: Re: OCR skripta za SW
Autor: Macondo - 22.10.2010. 17:40:34
Mož da gledaš 10 puta ručno, ali TitlYU nađe grešku obavezno.

Pa kad imaš felerične titlove kolega :D
Naslov: Re: OCR skripta za SW
Autor: Aleks@ - 22.10.2010. 17:45:44
Ovo je već ozbiljan napad. :)
Naslov: Re: OCR skripta za SW
Autor: vekyizveky - 22.10.2010. 18:09:12
Jel' itko od vas pročitao postove na prvoj strani? ;D
Lipo se prošetajte do prve strane vidjet ćete da je naš Milan napravio
čuda sa skriptom. ;D
Naslov: Re: OCR skripta za SW
Autor: Aleks@ - 22.10.2010. 18:17:40
Titl koji koji nije propušten kroz Milanovu krv i znoj pretočenu u MilanRS2, nije titl. ;D
Sinoć propustim jedan titl sa titlovi.com kroz MilanRS2 i 80% redova crveno. Izem takav titl.

PS. Nema ovo veze sa titlovi.com, već sa onim koji je radio prevod, da ne bude zabune.
Naslov: Re: OCR skripta za SW
Autor: svetlanalane - 22.10.2010. 18:39:35
Da, da, slažem se, ništa bez Milanove skripte. Meni je uvek uključena.
Ipak za ovo što sam tražila, sa titlYU se ispravlja isto ručno a skripta bi to mogla da uradi jednim klikom.
Još jedno pitanje: kad se (automatski) popravlja overlaping, može li se negde u podešavanjima podesiti da bude malo veći vremenski razmak između ta dva reda koji se preklapaju. Meni se početak u tom slučaju pomera za 050 ms a volela bih da bude bar 100 ms.

Titl koji koji nije propušten kroz Milanovu krv i znoj pretočenu u MilanRS2, nije titl. ;D
Sinoć propustim jedan titl sa titlovi.com kroz MilanRS2 i 80% redova crveno. Izem takav titl.

PS. Nema ovo veze sa titlovi.com, već sa onim koji je radio prevod, da ne bude zabune.

Možda ima veze sa kriterijumima za postavljanje titlova koji po mom mišljenu treba da budu mnogo strožiji.
Naslov: Re: OCR skripta za SW
Autor: vekyizveky - 22.10.2010. 18:56:32
Da, da, slažem se, ništa bez Milanove skripte. Meni je uvek uključena.
Ipak za ovo što sam tražila, sa titlYU se ispravlja isto ručno a skripta bi to mogla da uradi jednim klikom.
Kolko ja znam, ispravlja sa dva klika F9 i F10. I ne mjenja ti I na početku rečenice. ;D
Naslov: Re: OCR skripta za SW
Autor: outside - 22.10.2010. 19:00:39
kod mene je F11 i F12 ;D
Naslov: Re: OCR skripta za SW
Autor: vekyizveky - 22.10.2010. 19:11:57
kod mene je F11 i F12 ;D
(http://www.cosgan.de/images/midi/konfus/a020.gif)
I opet kolko ja znam F11 ispravlja označeni red, a F12 te bacaka na sljedeći s greškom.
Naslov: Re: OCR skripta za SW
Autor: lazavr - 22.10.2010. 19:18:53
F9+F10+F11 i resen problem  ;D ;D
Naslov: Re: OCR skripta za SW
Autor: outside - 22.10.2010. 19:23:27
kod mene je F11 i F12 ;D
(http://www.cosgan.de/images/midi/konfus/a020.gif)
I opet kolko ja znam F11 ispravlja označeni red, a F12 te bacaka na sljedeći s greškom.

Ups, u pravu si..ja sam krivo razumio...my bad.. u_jeeeeeeeeee
Naslov: Re: OCR skripta za SW
Autor: Mikos - 22.10.2010. 19:27:32
Ja ne mogu da skinem ocr skripte (prijavljuje da ih nema na serveru).
Da li je to problem samo kod mene, ili su izgubljene tokom selidbe, kao kod mene sa hard na hard?
Naslov: Re: OCR skripta za SW
Autor: outside - 22.10.2010. 19:32:42
Ja ne mogu da skinem ocr skripte (prijavljuje da ih nema na serveru).
Da li je to problem samo kod mene, ili su izgubljene tokom selidbe, kao kod mene sa hard na hard?


Nije samo tebi, ne radi nešto..
Naslov: Re: OCR skripta za SW
Autor: vekyizveky - 22.10.2010. 19:33:14
Meni radi...
Naslov: Re: OCR skripta za SW
Autor: outside - 22.10.2010. 19:34:17
Zanimljivo...

"The requested URL /Tutorial/MilanRS2.ocr was not found on this server.

Additionally, a 404 Not Found error was encountered while trying to use an ErrorDocument to handle the request."
Naslov: Re: OCR skripta za SW
Autor: petko - 22.10.2010. 20:23:00
Ajd' probaj sada :)
Naslov: Re: OCR skripta za SW
Autor: MilanRS - 22.10.2010. 20:36:27
Veki, hvala na divnim riječima.

Svetlana, SW nema mogućnost da popravljeni redovi imaju veći razmak, ali postoji odlična pascal skripta koja to lijepo ispravi.
Kugi001 je dao link http://www.urusoft.net/forum/viewtopic.php?pid=196#p196
Snimiš je na ovu ili sličnu putanju C:\Program Files (x86)\URUSoft\Subtitle Workshop\PascalScripts
kao nešto.pas i u SW kad otvoriš titl ideš Tools -> Pascal Scripts -> nešto.pas i on će gdje je malen razmak između titlova povećati na 125ms.

Što se tiče onog Ijudi ili Ijubomoran, to je zato što prevodilac poslije prevođenja provuče prevod kroz skriptu koja je fabrički ubačena u SW i prilagođena engleskom jeziku pa kvari naše prevode.
Njima preporučujem da tu skriptu poprave na način opisan u ovoj temi:
http://www.prijevodi-online.org/smf/index.php/topic,3265.0.html

Ja sam podesio MilanRS2 skriptu da ispravlja takve greške, ali moguće je da postoje slučajevi koji nisu obuhvaćeni.
Slobodno javite takve slučajeve da unaprijedim skriptu.

P.S. Petko, hvala za reupload skripti. Ja i dalje čekam da neko javi neki bug da mogu popraviti i postaviti noviju verziju. :)
Naslov: Re: OCR skripta za SW
Autor: outside - 22.10.2010. 20:44:13
Ajd' probaj sada :)

Sada radi smileyNO1
Naslov: Re: OCR skripta za SW
Autor: petko - 22.10.2010. 20:51:50
Hm... koristim ih redovno a nisam primetio nikakav iole bitan propust.
Dakle, samo ovo cepidlačenje: "www.tralala.com" postaje "www. tralala. com"
i "pera.zdera@mail.com" > "pera. zdera@mail. com"

Mada, ne bih nešto gubio sna oko ovoga ;D
Naslov: Re: OCR skripta za SW
Autor: MilanRS - 22.10.2010. 20:57:41
Dodati su izuzeci oko domena, npr.
   <!-- Podešavanje oko domena -->
   <ERROR Find="(\. )com" ReplaceBy=".">
   <ERROR Find="www(\. )" ReplaceBy=".">
   <ERROR Find="(\. )net" ReplaceBy=".">
   <ERROR Find="(\. )org" ReplaceBy=".">
   <ERROR Find="(\. )rs" ReplaceBy=".">
   <ERROR Find="(\. )yu" ReplaceBy=".">
   <ERROR Find="(\. )hr" ReplaceBy=".">

Kad nađeš na neki da je dobio razmake, slobodno mi javi da dodam uzorak za takav oblik, to je nekoliko minuta posla, nije gubljenje sna. ;D
Naslov: Re: OCR skripta za SW
Autor: MilanRS - 22.11.2010. 23:44:28
Može li se napraviti pascal skripta da detektuje kad dva titla (reda, linije) počinju sa istih xy znakova?

Primjer:
5
00:00:52,800 --> 00:00:55,200
Simon Brenner.
-Drag jel -Tako to zoveš?

6
00:00:55,280 --> 00:00:55,600
Simon Brenner.
-Drag je! -Tako to zoveš?
Naslov: Re: OCR skripta za SW
Autor: petko - 23.11.2010. 00:19:45
Hm, postoji SW API funkcija GetSubtitleText ali ne znam da li je moguće izvesti neki left, substr ili nešto slično na rezultatu...
Naslov: Re: OCR skripta za SW
Autor: svetlanalane - 23.11.2010. 00:50:55
Hvala Milane. Probaću prvom prilikom. Vidim da tamo ima poprilino pascal skripti, ali bih volela da nas neko malo uputi u njihove funkcije (bar one koje mogu biti zanimljive).
Imam još jedno pitanje. Naime, volela bih kada bi iznad samog polja za unošenje teksta postojala neka kvačica koja pokazuje gde je polovina ispisanog teksta. Znam da nakon odrađenog titla mogu da podesim smart line adjust, ali mislim da ne funkcioniše kod teksta koji je kraći od zadatog maksimalnog broja karaktera (koji je  kod mene 40) a ponekada bih podelila liniju u dva reda ako postoji stanka u govoru ili drugi govornik...
Kod mene SW ne prikazuje ceo okvir (sve brojke i tačke) za početno i krajnje vreme kao ni za vreme trajanja titla, jer je premali. Da li je to neki BUG i rešava se opet neom poštapalicom ili je tako kod svih? Kako rešiti taj sitni nedostatak? Smeta mi naročito kod vremena trajanja titla, jer ne vidim milisekunde pa moram da uđem u to polje i povlačim kursor do tog mesta, čime gubim na vremenu.
Naslov: Re: OCR skripta za SW
Autor: MilanRS - 23.11.2010. 02:15:59
Znam da nakon odrađenog titla mogu da podesim smart line adjust, ali mislim da ne funkcioniše kod teksta koji je kraći od zadatog maksimalnog broja karaktera (koji je  kod mene 40) a ponekada bih podelila liniju u dva reda ako postoji stanka u govoru ili drugi govornik...

Podesi tu manji broj. Npr. 37.
Nema to veze sa tvojim ograničenjem trajanja reda. I dalje možeš u podešavanjima staviti da ti javlja kad je red preko 40, 42, 45 ili koliko već. Ovo 37 je samo uslov za polovljenje sa Ctrl+E.

Kod mene je:
Two lines if longer than 36 characters.
Naslov: Re: OCR skripta za SW
Autor: petko - 23.11.2010. 08:25:55
Kod mene SW ne prikazuje ceo okvir (sve brojke i tačke) za početno i krajnje vreme kao ni za vreme trajanja titla, jer je premali. Da li je to neki BUG i rešava se opet neom poštapalicom ili je tako kod svih? Kako rešiti taj sitni nedostatak? Smeta mi naročito kod vremena trajanja titla, jer ne vidim milisekunde pa moram da uđem u to polje i povlačim kursor do tog mesta, čime gubim na vremenu.

SW bi kada se smanji najviše koliko je dozvoljeno trebao da izgleda otprilike ovako:
(http://www.uplo4d.com/images4/890751085_min_sw.png)

Pošto kod tebe vremena ne bivaju prikazana u potpunosti, rekao bih da je tvoj windows najverovatnije podešen na prikaz povećanih slova.
:)
Naslov: Re: OCR skripta za SW
Autor: kugi001 - 23.11.2010. 09:28:53
Može li se napraviti pascal skripta da detektuje kad dva titla (reda, linije) počinju sa istih xy znakova?

Primjer:
5
00:00:52,800 --> 00:00:55,200
Simon Brenner.
-Drag jel -Tako to zoveš?

6
00:00:55,280 --> 00:00:55,600
Simon Brenner.
-Drag je! -Tako to zoveš?
Naravno da može :). Ali ovakve greške (kod OCR) SW detektira ako postaviš minimum subtitle duration na npr. 1.8s (tako ja imam). Onda će SW drugu liniju detektirati/označiti kao prekratku, pa možeš spojiti te linije.
Naslov: Odg: OCR skripta za SW
Autor: MilanRS - 13.12.2010. 22:05:47
Ekskluzivno, povodom završetka Šeherezade na Prvoj,  rofl

predstavljam novu skriptu koja ima samo dvije linije koda.

Zadatak skripte: Ukloniti font color tagove iz titla.
Razlog: Određeni divx playeri ne mogu prikazivati fontove u boji i prikažu samo font color tag.
Primjer:
Prije: <font color=#00FAB6>Rečenica koja služi kao primjer.</font>
Poslije: Rečenica koja služi kao primjer.

<SWOCR WordChars="0123456789abcčćdđefghijklmnopqrsštuvwxyžzABCČĆDEFGHIJKLMNOPQRSŠTUVWXYŽZ_ńŃáéíóúÁÉÍÓÚäëďöü">
<ERROR Find="[(\x3C )]font color[=][#][0-9A-Z]{6}[(\x3E)]" ReplaceBy="">
<ERROR Find="[(\x3C)]/font[(\x3E)]" ReplaceBy="">
</SWOCR>

Download:
Desni klik i Save link as...

zfontTagovi (http://www.prijevodi-online.org/Tutorial/zfontTagovi.ocr)
(ime počinje sa z da bi bila na dnu menija u SW-u)
Naslov: Odg: OCR skripta za SW
Autor: Veleno - 13.12.2010. 22:08:19
A ja se potrudio naći ovu nijansu zelene, i sad bi ti da brišem  cry1
Neće ići, hehe.
Naslov: Odg: OCR skripta za SW
Autor: MilanRS - 13.12.2010. 22:11:26
A ja se potrudio naći ovu nijansu zelene, i sad bi ti da brišem  cry1
Neće ići, hehe.

Ovo nije lijepa boja. Nit' je plavo, nit' zeleno.
Color code je iz 2.5 Men.

A moj player takve redove prikaže bijelom bojom sa sve
<font color=#00FAB6> i </font>
Naslov: Odg: Re: OCR skripta za SW
Autor: Strider - 14.12.2010. 20:11:23
Više puta sam u titlovima primetila da lprevodioci umesto l pišu I na primer: "Ovi Ijudi su biIi ideaIno..." Treba malo vremena da se to ispravi, tj red po red, jer sa komandom "find --> replace all" se zamenjuju i početna slova I u rečenici. Može li neko da napravi dodatak uz skriptu ili posebnu skriptu kojom bi se ta slova u sredini rečenice validno ispravila? Smajlicvece Biće i piće.
Nije me bio odavna, pa malo kasnim s odgovorom, ali valjda neće škodit. ??? Ovo ispravljanje sam ja odavno napravio (na 2. stranici ovog istog topika (http://www.prijevodi-online.org/smf/index.php/topic,142.msg4230.html#msg4230)... zadnji update: 20/09/2008), između ostalog stoji i: ...uključuje OCR grešku "I", "L", "l".... Uzmi dio koji ti treba (označeni su svi) i ubaci u svoju skriptu. ;)
Evo zadnje verzije te iste skripte (ne znam više što sam mijenjao, godine, pa da ne bi bilo zabune...)
<!----------------------------------------------->
<!--     Subtitle Workshop OCR Script file     -->
<!--       Copyright © 2001-2004 URUSoft       -->
<!--           http://www.urusoft.net          -->
<!--                                           -->
<!-- Default values:                           -->
<!--                                           -->
<!-- UseRE = True (use Regular Expressions)    -->
<!-- UseREOnlyToFind = True (put the part that -->
<!-- is not a RE between parenthesis!)         -->
<!--                                           -->
<!-- If UseRE is set to false then you can use -->
<!-- the following parameters, otherwise they  -->
<!-- will be ignored:                          -->
<!--                                           -->
<!--    CaseSensitive  (Default = False)       -->
<!--    WholeWord      (Default = False)       -->
<!--    PreserveCase   (Default = False)       -->
<!-- ----------------------------------------- -->
<!-- Pošto SubtitleWorkshop ne radi s našim    -->
<!-- fonemima "čćđšž" kako treba, malo sam     -->
<!-- "preuredio" exe datoteku i ubacio naše    -->
<!-- foneme. Radi bolje, ne baš najbolje, a    -->
<!-- možete je naći na adresi:                 -->
<!-- http://strider.1free.ws/files/SubtitleWorkshop.zip.doc -->
<!-- Zip arhiva, samo izbrišite nastavak ".doc"-->
<!----------------------------------------------->

<SWOCR WordChars="0123456789abcdefghijklmnopqrstuvwxyzABCDEFGHIJKLMNOPQRSTUVWXYZ_ńŃáéíóúÁÉÍÓÚäëďöü">

<!-- Npr. "O'NeiII" by "O'Neill" -->
<ERROR Find="[a-zá-ú][a-zá-ú](II)" ReplaceBy="ll">
<ERROR Find="(II)[a-zá-ú][a-zá-ú]" ReplaceBy="ll">
<ERROR Find="\b(II)[i]\b" ReplaceBy="Il">
<ERROR Find="\b(ll)[i]\b" ReplaceBy="Il">
<!-- Zamijeni sva "l" s "I" na početku riječi s velikim slovima -->
<ERROR Find="\b(l)[A-ZĆČĐŠŽ]" ReplaceBy="I">
<!-- Zamijeni sva "l" s "I" unutar riječi s velikim slovima -->
<ERROR Find="[A-ZĆČĐŠŽ](l)[A-ZĆČĐŠŽ]" ReplaceBy="I">
<!-- Zamijeni sva "l" s "I" na kraju riječi s velikim slovima -->
<ERROR Find="[A-ZĆČĐŠŽ][A-ZĆČĐŠŽ](l)" ReplaceBy="I">
<!-- Zamijeni sva "I" s "l" unutar riječi s malim slovima ili prvoj riječi u rečenici -->
<ERROR Find="[A-ZĆČĐŠŽa-zćčđšž](I)[a-zćčđšž]" ReplaceBy="l">
<!-- Zamijeni sva "I" s "l" na kraju riječi s malim slovima (uključujući znakove interpunkcije na kraju) -->
<ERROR Find="[a-zćčđšž](I)[a-zćčđšž\s\.!?:;,'\x22)]" ReplaceBy="l">
<ERROR Find="[a-zćčđšž](I)" ReplaceBy="l">
<!-- Zamijeni sva "I" s "l" unutar riječi s hrvatskim znakovima -->
<ERROR Find="[A-Za-zĆČĐŠŽćčđšž](I)[a-zćčđšž]" ReplaceBy="l">
<!-- Zamijeni sva "L" s "I" na početku riječi kada slijedi bilo koje slovo osim "aeiouj" -->
<ERROR Find="\b(L)[bcdfghklmnprstvz\ćčđšž]" ReplaceBy="I">
<!-- Zamijeni sva "l" s "I" na početku riječi kada slijedi bilo koje slovo osim "aeiouj" -->
<ERROR Find="\b(l)[bcdfghklmnprstvz\ćčđšž]" ReplaceBy="I">
<!-- Zamijeni sva "I" s "l" na početku riječi kada slijedi "aeiouj" -->
<ERROR Find="\b(I)[aeijou]" ReplaceBy="l">

<!-- Zamijeni sva sama "l" s "I" -->
<ERROR Find="\b(l)\b" ReplaceBy="I">
<!-- Zamijeni sva sama "I" s "i" ako prethode i slijede mala slova -->
<ERROR Find="[a-zćčđšž]( I )[a-zćčđšž]" ReplaceBy=" i ">

<!-- Izbriši razmak ispred dvotočke ako prethodi broj "1 :", "2 :"... "n :" s "n:" -->
<ERROR Find="\d( :)" ReplaceBy=":">
<!-- Zamijeni ",,," ili više sa "..." -->
<ERROR UseREOnlyToFind="False" Find=",{2,}" ReplaceBy="...">
<!-- "--" ili više sa "..." -->
<ERROR UseREOnlyToFind="False" Find="-{2,}" ReplaceBy="...">

<!-- Navodnici i apostrofi ("\x22" je '"' navodnik) -->
<ERROR Find="(“)" ReplaceBy=""">
<ERROR Find="(”)" ReplaceBy=""">
<ERROR Find="(`)" ReplaceBy="'">
<ERROR Find="(´)" ReplaceBy="'">
<ERROR Find="(‘)" ReplaceBy="'">
<ERROR Find="(’)" ReplaceBy="'">
<ERROR UseREOnlyToFind="False" Find="''" ReplaceBy=""">
<!-- '"' dva puta ili više zamijeni s jednim '"' -->
<ERROR UseREOnlyToFind="False" Find="\x22{2,}" ReplaceBy=""">

<!-- Razmak iza apostrofa, npr. "I' d" to "I'd", "I' LL" to "I'LL", etc. -->
<ERROR Find="(?i)[A-ZÁ-Úa-zá-ú]('\s|\s')(ll|ve|s|m|d)\b" ReplaceBy="'">
<!-- F "Hasn 't" and "Hasn' t" -->
<ERROR Find="[\.\s](')" ReplaceBy="'">
<!-- <ERROR Find="(?i)[A-ZÁ-Úa-zá-ú]('\s|\s')t\b" ReplaceBy="'"> -->
<!-- Zamijeni sva "I'" s "l'" -->
<ERROR Find="(I)[\']" ReplaceBy="l">

<!-- Zamijeni sve glagole s 5 i više slova "**(a)(e)(i)ti ću" s "**(a)(e)(i)t ću" i "**(a)(e)(i)ti će*" s "**(a)(e)(i)t će*" -->
<!-- Glagoli i imenice s četiri slova koja završavaju na "ati" su izuzeci i ne mijenjanju se!!! (ćati, dati, lati, mati, rati, sati, tati, vati) -->
<!-- Riječi s četiri slova koja završavaju na "eti" su izuzeci i ne mijenjanju se!!! (četi, meti, peti, teti) -->
<ERROR Find="[A-Za-zćčđšž][a-zćčđšž][a|e|i](ti )ć[eu]" ReplaceBy="t ">
<ERROR Find="[A-Za-zćčđšž][a-zćčđšž][a|e|i](ti)\r?\nć[eu]" ReplaceBy="t">
<!-- Izuzeci su  glagoli s četiri slova koji se mijenjaju (žeti, biti, liti, miti, piti, riti, šiti, viti) ! -->
<ERROR Find="\b[ž|Ž](eti )ć[eu]" ReplaceBy="et ">
<ERROR Find="\b[ž|Ž](eti)\r?\nć[eu]" ReplaceBy="et">
<ERROR Find="\b[b|B|l|L|m|M|p|P|r|R|š|Š|v|V](iti )ć[eu]" ReplaceBy="it ">
<ERROR Find="\b[b|B|l|L|m|M|p|P|r|R|š|Š|v|V](iti)\r?\nć[eu]" ReplaceBy="it">

<!-- Izuzeci koji se ne mijenjaju: -->
<!-- Ostaje "niti ću (ćeš, će, ćemo, ćete)" -->
<ERROR Find="(?i)\bni(t )ć[eu]" ReplaceBy="ti ">
<ERROR Find="(?i)\bni(t)\r?\nć[eu]" ReplaceBy="ti">
<!-- Ostaje "naniti će" (SF serije: naniti ili nanoboti) -->
<ERROR Find="(nanit )će\b" ReplaceBy="naniti ">
<ERROR Find="(nanit)\r?\nće\b" ReplaceBy="naniti">

<!-- Izuzeci koji se ne mijenjaju, dodaje se "t": -->
<!-- Mijenja se "pati ću (ćeš, će, ćemo, ćete)" u "patit ću (ćeš, će, ćemo, ćete)" -->
<ERROR Find="(?i)\b(pati )ć[eu]" ReplaceBy="patit ">
<ERROR Find="(?i)\b(pati)\r?\nć[eu]" ReplaceBy="patit">
<!-- Mijenja se "jati ću (ćeš, će, ćemo, ćete)" u "jatit ću (ćeš, će, ćemo, ćete)" -->
<ERROR Find="(?i)\b(jati )ć[eu]" ReplaceBy="jatit ">
<ERROR Find="(?i)\b(jati)\r?\nć[eu]" ReplaceBy="jatit">
<!-- Mijenja se "leti ću (ćeš, će, ćemo, ćete)" u "letjet ću (ćeš, će, ćemo, ćete)" -->
<ERROR Find="(?i)\b(leti )ć[eu]" ReplaceBy="letjet ">
<ERROR Find="(?i)\b(leti)\r?\nć[eu]" ReplaceBy="letjet">
<!-- Mijenja se "hiti ću (ćeš, će, ćemo, ćete)" u "hitit ću (ćeš, će, ćemo, ćete)" -->
<ERROR Find="(?i)\b(hiti )ć[eu]" ReplaceBy="hitit ">
<ERROR Find="(?i)\b(hiti)\r?\nć[eu]" ReplaceBy="hitit">
<!-- Mijenja se "kiti ću (ćeš, će, ćemo, ćete)" u "kitit ću (ćeš, će, ćemo, ćete)" -->
<ERROR Find="(?i)\b(kiti )ć[eu]" ReplaceBy="kitit ">
<ERROR Find="(?i)\b(kiti)\r?\nć[eu]" ReplaceBy="kitit">

<!-- Zamijeni sva "S" i "s" sa "SA", "Sa" i "sa" kad su na kraju prvog reda -->
<ERROR Find="\b(s)\b\r?\n" ReplaceBy="sa"> <!-- radi -->
<ERROR Find="[a-z]\s\b(S)\b\r?\n[a-z]" ReplaceBy="sa"> <!-- radi -->
<ERROR Find="[A-Z]\s\b(S)\b\r?\n[a-z]" ReplaceBy="SA"> <!-- radi -->
<ERROR Find="\b(S)\b\r?\n" ReplaceBy="Sa"> <!-- radi -->
<ERROR Find="\b(Sa)\b\r?\n[A-Z][A-Z]" ReplaceBy="SA"> <!-- radi -->
<ERROR Find="\b(Sa)\b\r?\n\x22[A-Z][A-Z]" ReplaceBy="SA"> <!-- radi -->
<!-- ovaj dio mora biti ispred ostalih "s" i "sa" -->
<!-- inače (s)\r?\n -> "sa" mijenja npr. "s"(novi red)"stilom" u "sa"(novi red)"satilom" -->



<!-- Zamijeni sva "Sa" i "sa" sa "S" i "s" ako ne slijedi riječ sa "š,Š,s,S,z,Z,ž,Ž,6,7" -->
<ERROR Find="\b(sa)\b\s[^sSšŠzZžŽ67\r?\n]" ReplaceBy="s">
<ERROR Find="\b(s \x22)[sSšŠzZžŽ67]" ReplaceBy="sa "">
<ERROR Find="\b(Sa)\b\s[^sSšŠzZžŽ67\r?\n]" ReplaceBy="S">
<ERROR Find="\b(SA)\b\s[^sSšŠzZžŽ67\r?\n]" ReplaceBy="S">
<ERROR Find="\b(S \x22)[sšzž67]" ReplaceBy="Sa "">
<ERROR Find="\b(S \x22)[SŠZŽ][a-z]" ReplaceBy="Sa "">
<ERROR Find="\b(S \x22)[SŠZŽ]" ReplaceBy="SA "">

<ERROR Find="\b(sa)\r?\n[^sSšŠzZžŽ67\x22]" ReplaceBy="s">
<ERROR Find="\b(sa)\r?\n\x22[abcčćdđefghijklmnopqrtuvwxyABCČĆDĐEFGHIJKLMNOPQRSTUVWXYZŽ]" ReplaceBy="s">
<ERROR Find="\b(s)\r?\n\x22[SšŠzZžŽ67]" ReplaceBy="sa">
<ERROR Find="\b(Sa)\r?\n[^sSšŠzZžŽ67\x22]" ReplaceBy="S">
<ERROR Find="\b(Sa)\r?\n\x22[abcčćdđefghijklmnopqrtuvwxyABCČĆDĐEFGHIJKLMNOPQRTUVWXYZŽ]" ReplaceBy="S">
<ERROR Find="\b(SA)\r?\n[^sSšŠzZžŽ67\x22]" ReplaceBy="S">
<ERROR Find="\b(SA)\r?\n\x22[abcčćdđefghijklmnopqrstuvwxyABCČĆDĐEFGHIJKLMNOPQRTUVWXYZŽ]" ReplaceBy="S">
<ERROR Find="\b(S)\r?\n\x22[sšzž67]" ReplaceBy="Sa">
<ERROR Find="\b(S)\r?\n\x22[SŠZŽ]" ReplaceBy="SA">
<ERROR Find="\b(S)\r?\n\x22[SŠZŽ][a-z]" ReplaceBy="Sa">

<!-- Zamijeni sva "S" i "s" sa "Sa" i "sa" ako slijedi riječ sa "š,Š,z,Z,ž,Ž,s,S" ili broj "6, 7, 6x, 7x, 16, 17, 1xx, 1xxx..." -->
<ERROR Find="\b(S )\b[šzžs][a-z]" ReplaceBy="Sa ">
<ERROR Find="\b(S )\b[ŠZŽS][a-z]" ReplaceBy="Sa ">
<ERROR Find="\b(S )\b[ŠZŽS][A-Z]" ReplaceBy="SA ">
<ERROR Find="\b(s )\b[šŠzZžŽsS67]" ReplaceBy="sa ">
<!-- ...bilo koji broj u istom redu koji počinje sa 6 ili 7 -->
<ERROR Find="[A-Z]( S )[67]" ReplaceBy=" SA ">
<ERROR Find="\b(S )[67]" ReplaceBy="Sa ">
<!-- ...16 ili 17 u istom redu -->
<ERROR Find="\b(s 1)[67]\b" ReplaceBy="sa 1">
<ERROR Find="[A-Z]( S 1)[67]\b" ReplaceBy=" SA 1">
<ERROR Find="\b(S 1)[67]\b" ReplaceBy="Sa 1">
<!-- ...stotice u istom redu koje počinju sa 1 -->
<ERROR Find="\b(s )[1][0-9][0-9]\b" ReplaceBy="sa ">
<ERROR Find="[A-Z]( S )[1][0-9][0-9]\b" ReplaceBy=" SA ">
<ERROR Find="\b(S )[1][0-9][0-9]\b" ReplaceBy="Sa ">
<!-- ... 100000 u istom redu - 100000000 nisu uključeni jer se obično pišu s točkama: 100.000.000 :-) -->
<ERROR Find="\b(s )[1][0-9][0-9][0-9][0-9][0-9]\b" ReplaceBy="sa ">
<ERROR Find="[A-Z]( S )[1][0-9][0-9][0-9][0-9][0-9]\b" ReplaceBy=" SA ">
<ERROR Find="\b(S )[1][0-9][0-9][0-9][0-9][0-9]\b" ReplaceBy="Sa ">

<!-- Zamijeni sva "S" i "s" sa "Sa" i "sa" ako slijedi broj "6, 7, 6x, 7x, 16, 17, 1xx, 1xxx..." U DRUGOM REDU -->
<!-- ...bilo koji broj u drugom redu koji počinje sa 6 ili 7 -->
<ERROR Find="\b(s)\b\r?\n[67]" ReplaceBy="sa">
<ERROR Find="[A-Z]( S)\r?\n[67]" ReplaceBy=" SA">
<ERROR Find="\b(S)\r?\n[67]" ReplaceBy="Sa">
<!-- ...16 ili 17 u drugom redu -->
<ERROR Find="\b(s)\r?\n[1][67]\b" ReplaceBy="sa">
<ERROR Find="[A-Z]( S)\r?\n[1][67]\b" ReplaceBy=" SA">
<ERROR Find="\b(S)\r?\n[1][67]\b" ReplaceBy="Sa">
<!-- ...stotice u drugom redu koje počinju s 1 -->
<ERROR Find="\b(s)\r?\n[1][0-9][0-9]\b" ReplaceBy="sa">
<ERROR Find="[A-Z]( S)\r?\n[1][0-9][0-9]\b" ReplaceBy=" SA">
<ERROR Find="\b(S)\r?\n[1][0-9][0-9]\b" ReplaceBy="Sa">
<!-- ... 100000 u drugom redu  - 100000000 nisu uključeni jer se obično pišu s točkama: 100.000.000 :-) -->
<ERROR Find="\b(s)\r?\n[1][0-9][0-9][0-9][0-9][0-9]\b" ReplaceBy="sa">
<ERROR Find="[A-Z]( S)\r?\n[1][0-9][0-9][0-9][0-9][0-9]\b" ReplaceBy=" SA">
<ERROR Find="\b(S)\r?\n[1][0-9][0-9][0-9][0-9][0-9]\b" ReplaceBy="Sa">

<!-- Zamijeni sva "S" i "s" sa "Sa" i "sa" ako slijedi riječ "mnom" -->
<ERROR Find="\b(s)\b\s(\mnom)\b" ReplaceBy="sa">
<ERROR Find="\b(S)\b\s(\mnom)\b" ReplaceBy="Sa">
<ERROR Find="\b(S)\b\s(\MNOM)\b" ReplaceBy="SA">
<ERROR Find="\b(s ili bez)\b" ReplaceBy="sa ili bez">
<ERROR Find="\b(S ili bez)\b" ReplaceBy="Sa ili bez">
<!-- Zamijeni sva "S" i "s" sa "Sa" i "sa" ako slijedi riječ "mnom" U DRUGOM REDU -->
<ERROR Find="\b(s)\r?\n(\mnom)\b" ReplaceBy="sa">
<ERROR Find="\b(S)\r?\n(\mnom)\b" ReplaceBy="Sa">
<ERROR Find="\b(S)\r?\n(\MNOM)\b" ReplaceBy="SA">
<ERROR Find="\b(s)\r?\n(ili bez)\b" ReplaceBy="sa">
<ERROR Find="\b(S)\r?\n(ili bez)\b" ReplaceBy="Sa">

<!-- Zamijeni sva "samnom" u "sa mnom" -->
<ERROR Find="\b(samnom)\b" ReplaceBy="sa mnom">
<ERROR Find="\b(Samnom)\b" ReplaceBy="Sa mnom">
<ERROR Find="\b(SAMNOM)\b" ReplaceBy="SA MNOM">

<!-- Zamijeni sva "S" i "s" sa "Sa" i "sa" ako slijedi riječ "ps..." ili "ks..." -->
<ERROR Find="\b(s ps)" ReplaceBy="sa ps">
  <ERROR Find="\b(s Ps)" ReplaceBy="sa Ps">
  <ERROR Find="\b(S ps)" ReplaceBy="Sa ps">
  <ERROR Find="\b(S Ps)" ReplaceBy="Sa Ps">
  <ERROR Find="\b(S PS)" ReplaceBy="SA PS">
  <ERROR Find="\b(s ks)" ReplaceBy="sa ks">
  <ERROR Find="\b(s Ks)" ReplaceBy="sa Ks">
  <ERROR Find="\b(S Ks)" ReplaceBy="Sa Ks">
<ERROR Find="\b(S ks)" ReplaceBy="Sa ks">
  <ERROR Find="\b(S KS)" ReplaceBy="SA KS">
<ERROR Find="\b(s)\b\r?\n(\ps)" ReplaceBy="sa">
<ERROR Find="\bsa\b\r?\n(psa)" ReplaceBy="ps">
<ERROR Find="\b(s)\b\r?\n(\Ps)" ReplaceBy="sa">
<ERROR Find="\bsa\b\r?\n(Psa)" ReplaceBy="Ps">
<ERROR Find="\b(S)\b\r?\n(\ps)" ReplaceBy="Sa">
<ERROR Find="\b(S)\b\r?\n(\PS)" ReplaceBy="SA">
<ERROR Find="\bSA\b\r?\n(PSA)" ReplaceBy="PS">
<ERROR Find="\b(S)\b\r?\n(\Ps)" ReplaceBy="Sa">
<ERROR Find="\b(s)\b\r?\n(\PS)" ReplaceBy="sa">
<ERROR Find="\b(s)\b\r?\n(\ks)" ReplaceBy="sa">
<ERROR Find="\bsa\b\r?\n(ksa)" ReplaceBy="ks">
<ERROR Find="\b(s)\b\r?\n(\Ks)" ReplaceBy="sa">
<ERROR Find="\bsa\b\r?\n(Ksa)" ReplaceBy="Ks">
<ERROR Find="\b(S)\b\r?\n(\ks)" ReplaceBy="Sa">
<ERROR Find="\b(S)\b\r?\n(\KS)" ReplaceBy="SA">
<ERROR Find="\bSA\b\r?\n(KSA)" ReplaceBy="KS">
<ERROR Find="\b(S)\b\r?\n(\Ks)" ReplaceBy="Sa">
<ERROR Find="\b(s)\b\r?\n(\KS)" ReplaceBy="sa">

<!-- Rijetkosti -->
<!-- Izuzetak za "I" s "l" kada slijedi: Ionako, Ijedan, Iole -->
<ERROR Find="\b(lonako)\b" ReplaceBy="Ionako">
<ERROR Find="\b(ljedan)\b" ReplaceBy="Ijedan">
<ERROR Find="\b(ljedn)" ReplaceBy="Ijedn">
<ERROR Find="\b(lole)\b" ReplaceBy="Iole">
<ERROR Find="[\.][\s](lako)\b" ReplaceBy="Iako">
<ERROR Find="(-lako)\b" ReplaceBy="-Iako">
<ERROR Find="(- lako)\b" ReplaceBy="- Iako">
<ERROR Find="[a-z][\s](Iako)\b" ReplaceBy="lako">
  <ERROR Find="\.\r?\n(lako)\b" ReplaceBy="Iako">
  <ERROR Find="^(lako)\b" ReplaceBy="Iako">
<ERROR Find="\b(lon)\b" ReplaceBy="Ion">
<ERROR Find="\b(lons)" ReplaceBy="Ions">
<ERROR Find="\b(loni)" ReplaceBy="Ioni">
<ERROR Find="\b(lono)" ReplaceBy="Iono">
<ERROR Find="\b(Mls)" ReplaceBy="Mis">
<ERROR Find="\b(Nlj)" ReplaceBy="Nij">
<ERROR Find="\b(Nlk)" ReplaceBy="Nik">
<ERROR Find="\b(Nls)" ReplaceBy="Nis">
<ERROR Find="\b(Nlš)" ReplaceBy="Niš">
<ERROR Find="\b(ALi)" ReplaceBy="Ali">

<!-- Kad se NEODREĐENE ZAMJENICE slažu s veznicima i, ni (itko, išta, ikakav, nitko, ništa, nikakav…) -->
<!-- koriste se s prijedlozima te se oni umeću između veznika i odnosne zamjenice -->
<ERROR Find="\b(od nikoga)\b" ReplaceBy="ni od koga">
<ERROR UseReOnlyToFind="False" Find="\b(od)\r?\n(nikoga)\b" ReplaceBy="ni od koga">
<ERROR Find="\b(za ništa)\b" ReplaceBy="ni za što">
<ERROR UseReOnlyToFind="False" Find="\b(za)\r?\n(ništa)\b" ReplaceBy="ni za što">
<ERROR Find="\b(pred ičim)\b" ReplaceBy="i pred čim">
<ERROR UseReOnlyToFind="False" Find="\b(pred)\r?\n(ičim)\b" ReplaceBy="i pred čim">
<ERROR Find="\b(pred ničim)\b" ReplaceBy="ni pred čim">
<ERROR UseReOnlyToFind="False" Find="\b(pred)\r?\n(ničim)\b" ReplaceBy="ni pred čim">
<ERROR Find="\b(s nikakvim)\b" ReplaceBy="ni s kakvim">
<ERROR UseReOnlyToFind="False" Find="\b(s)\r?\n(nikakvim)\b" ReplaceBy="ni s kakvim">
<ERROR Find="\b(s nikim)\b" ReplaceBy="ni s kim">
<ERROR UseReOnlyToFind="False" Find="\b(s)\r?\n(nikim)\b" ReplaceBy="ni s kim">
<ERROR Find="\b(s ikim)\b" ReplaceBy="i s kim">
<ERROR UseReOnlyToFind="False" Find="\b(s)\r?\n(ikim)\b" ReplaceBy="i s kim">
<ERROR Find="\b(uz nikakav)\b" ReplaceBy="ni uz kakav">
<ERROR UseReOnlyToFind="False" Find="\b(uz)\r?\n(nikakav)\b" ReplaceBy="ni uz kakav">
<ERROR Find="\b(zbog ničega)\b" ReplaceBy="ni zbog čega">
<ERROR UseReOnlyToFind="False" Find="\b(zbog)\r?\n(ničega)\b" ReplaceBy="ni zbog čega">

<!-- <ERROR Find="\b(III)\b" ReplaceBy="III"> -->

<!-- Lokacija u USA "Iowa" -->
<ERROR Find="\b(lowa)\b" ReplaceBy="Iowa">
<ERROR Find="\b(lowe)\b" ReplaceBy="Iowe">
<ERROR Find="\b(lowi)\b" ReplaceBy="Iowi">
<ERROR Find="\b(lowu)\b" ReplaceBy="Iowu">

<!-- Ime ili prezime "Lloyd" -->
<ERROR Find="\b(Iloyd)" ReplaceBy="Lloyd"> -->

<!-- Ispravak nule i velikog 'O' -->
<ERROR Find="[0-9](O)" ReplaceBy="0">
<ERROR Find="[0-9](\.O)" ReplaceBy=".0">
<ERROR Find="[0-9](,O)" ReplaceBy=",0">
<ERROR Find="[A-Z](0)" ReplaceBy="O">
<ERROR Find="\b(0)[A-Za-z]" ReplaceBy="O">

<!-- Briši razmak ispred zareza -->
<ERROR Find="[A-ZĆČĐŠŽa-zćčđšž]( ,)" ReplaceBy=",">
<!-- Dodaj razmak iza zareza -->
<ERROR Find="(,)[A-ZĆČĐŠŽa-zćčđšž]" ReplaceBy=", ">

<!-- Razmak iza točke -->
<ERROR Find="[a-su-zá-úńä-ü](\.)[^(\s\n\.\*\?\!\x22\,)]" ReplaceBy=". "> <!-- osim kad je zadnje t (rijec kolt) -->
<!-- Oznaka za kalibar. Npr. "Colt .45" -->
<!-- Da bi radilo, da bi ovaj razmak bio dopušten, u SW idite Alt+I i odcekirajte "Razmaci ispred točke" -->
<ERROR Find="(t\.)[0-9][0-9]" ReplaceBy="t .">
<!-- Razmak iza uzastopnih točaka (npr. "...") -->
  <ERROR Find="(\.\.)[^(\x22\s\n\.\?\!\,)]" ReplaceBy=".. ">
<!-- Razmak iza 3 točke ("...") -->
<ERROR Find="(\.\.\.)[\x22][a-z]" ReplaceBy="... ">
  <ERROR Find="(\.\.\.)[^(\x22\s\n\.\?\!\,)]" ReplaceBy="... ">

<!-- Zamijeni dvije točke trima ("..")->("...") -->
<ERROR Find="^(\.\.)[^\.]" ReplaceBy="..."> <!-- na početku 1. reda, ne slijedi točka -->
<ERROR Find="[^\.](\.\.)[^\.]" ReplaceBy="..."> <!-- ne prethodi i ne slijedi točka -->
<ERROR Find="[^\.](\.\.)$" ReplaceBy="..."> <!-- ne prethodi točka, na kraju reda -->

<!-- Briši razmak iza "..." kad je na početku 1. reda. Izbrišite ovu liniju ukoliko vam ne odgovara -->
<ERROR UseREOnlyToFind="False" Find="^(\.\.\.) " ReplaceBy="...">
<ERROR UseREOnlyToFind="False" Find="^(\x22\.\.\.) " ReplaceBy=""...">
<!-- Briši razmak iza "..." kad je na početku 2. reda. Izbrišite ovu liniju ukoliko vam ne odgovara -->
<ERROR Find="\r?\n(\.\.\.\s)" ReplaceBy="...">
<ERROR Find="\r?\n\x22(\.\.\.\s)" ReplaceBy="...">
<!-- Briši "," prije "..." -->
<ERROR Find="(\,\.\.\.)" ReplaceBy="...">
<!-- Briši "," poslije "..." -->
<ERROR Find="(\.\.\.\,)" ReplaceBy="...">
<!-- Briši "- " prije "..." -->
<ERROR Find="(\-\s\.\.\.)" ReplaceBy="-...">
<ERROR Find="(\-\.\.\.\s)" ReplaceBy="-...">
<!-- Zamijeni "- -" sa "..." -->
<ERROR Find="(\-\s\-)" ReplaceBy="... ">

</SWOCR>
Naslov: Odg: OCR skripta za SW
Autor: MilanRS - 14.12.2010. 20:16:10
Pozdrav za Stridera.
Juče sam iz tvoje skripte preuzeo one tri linije za ispravljanje **ti ću -> **t ću.
:)
Naslov: Odg: OCR skripta za SW
Autor: Strider - 14.12.2010. 20:43:15
Pozdrav za Stridera.
Juče sam iz tvoje skripte preuzeo one tri linije za ispravljanje **ti ću -> **t ću.
:)
Pozdrav druže Milane!
Drago mi je da netko to koristi. Za tebe nisam ni sumnjao da hoćeš! :D Baš sam prije par dana kolegi dome-nasty poslao skripte koje imam (uključujući i onu tvoju koja skida crte u prvom redu i spaja drugi red i crtu  clapp), radi te greške. Ima izvandredne titlove, pa je šteta da se "provuče" samo ta greška.

Btw, imam problema kad sidnem s ekipom na ćakulu, pa ih tu i tamo ispravim... "dogodilo je se"->"dogodilo se", "s nikim"->"ni s kim", "s avionom"->"avionom"! Nadam se da ti nemaš sličnih problema? Ja ću se morat suzdržavat ubuduće! :-X Nisu svi ka' dome-nasty, čiji je odgovor (ukratko) na pitanje "Triba li ti?" bio "Šalji! Fala!"! Eh, da je više tako susretljivih i razumnih ljudi. Koliko sam samo pokušavao privuć ljude da naprave SR rječnike za B3S SubTranslator da si olakšaju posao... a nitko se nije javio! (možda je i napravljeno, samo ne znam?!) :(
Naslov: Odg: OCR skripta za SW
Autor: MilanRS - 14.12.2010. 21:28:02
Btw, imam problema kad sidnem s ekipom na ćakulu, pa ih tu i tamo ispravim... "dogodilo je se"->"dogodilo se", "s nikim"->"ni s kim", "s avionom"->"avionom"! Nadam se da ti nemaš sličnih problema? Ja ću se morat suzdržavat ubuduće! :-X

Nemam takvih problema, u govoru ne ispravljam nikoga, samo u pismenoj formi. ;D
Što se tiče moje situacije, nemam velikih problema sa pravopisom, a skripte pravim da bismo mogli prije gledanja serije ispraviti tuđe greške u prevodima.
Naslov: Odg: OCR skripta za SW
Autor: magila - 30.12.2010. 06:52:42
Instalirao sam Win7 64-bitni. Stavio sam K-Lite_Codec_Pack_64bit_420. Sve lepo radi (*.mkv), osim što mi SW 4.0 ne radi za većinu (*.avi) fajlova! Pukne program.
Ne zavisi od verzije SW-a nego je do kodeka. Ne mogu da sinhronizujem avije! Imam tri sezone Fringe da sinh., 7. i 8. sezonu Charmes. Kuku. Pomagajte!
Šta da radim? Ima li negde okačeno uputstvo za "SW frendly" codecs?
Naslov: Odg: OCR skripta za SW
Autor: faks86 - 30.12.2010. 22:41:45
Imao sam sličan problem. Otvori DirectVob pa General/Loading/ izaberi Do not load. Nadam se da će pomoći, ili probaj da ga deinstaliraš.  ;)
Naslov: Odg: OCR skripta za SW
Autor: magila - 31.12.2010. 08:58:17
Super! Radi! Ali i dalje kodeci ne prikazuju svaki avi. Sada bar ne zaglavljuje.
Probaću deinstalaciju.
Naslov: Odg: OCR skripta za SW
Autor: pejafor3 - 04.02.2011. 13:43:35
Mrzi me da čitam.
Gde je ona skripta koja prepravlja
Ari-jevo u Arijevo
Mark-ovo u Markovo
...
Naslov: Odg: OCR skripta za SW
Autor: MilanRS - 04.02.2011. 21:41:18
Mrzi me da čitam.
Mene mrzi da pišem. :P

Ali, ipak evo.

Gde je ona skripta koja prepravlja
Ari-jevo u Arijevo
Mark-ovo u Markovo
...

Link do posta na 10. strani (http://www.prijevodi-online.org/smf/index.php/topic,142.msg111072.html#msg111072)
Naslov: Odg: OCR skripta za SW
Autor: pejafor3 - 05.02.2011. 12:46:19
Mrzi me da čitam.
Mene mrzi da pišem. :P

Ali, ipak evo.

Gde je ona skripta koja prepravlja
Ari-jevo u Arijevo
Mark-ovo u Markovo
...

Link do posta na 10. strani (http://www.prijevodi-online.org/smf/index.php/topic,142.msg111072.html#msg111072)

Milane, ne vidim više dobro, a i starim, dok ja pronađem ovde poruku, dotle serem na drugoj strani, pa se onda sav pogubim.... ne znam više šta sam srao i šta sam tražio!  rofl

Hvala...  clapp
Naslov: Odg: OCR skripta za SW
Autor: ExtraJa - 09.02.2011. 15:03:55
Možete li meni reći kako ovu skriptu da aktiviram, tj. da je učinim dostupnom u SW-u. Lijepo je skinem ubacim u OCRScripts u SW instalacionom direktoriju ali kad pokrenem program tamo mi nije dostupna već imam samo MilanRS2 i onu defaultnu a ove nigdje kao da je nisam ni dodao?
Naslov: Odg: OCR skripta za SW
Autor: petko - 09.02.2011. 15:10:03
Zavisi na koju skriptu misliš.
Neke idu u OCRScripts a neke u PascalScripts.
Ove druge dostupne su preko menija Tools/Pascal Scripts.

:)
Naslov: Odg: OCR skripta za SW
Autor: ExtraJa - 09.02.2011. 15:17:16
Mislio sam na ovu o kojoj su razgovarali u porukama iznad, koja briše crticu iz npr. Mark-ovo.
A sad gdje ide ne bi znao ja sam mislio da je to ocr ali kako nisam stručan moguće je da griješim?  :-[
Naslov: Odg: OCR skripta za SW
Autor: MilanRS - 09.02.2011. 15:20:47
Ako u folderu OCR Scripts imaš sve tri, biće i u SW meniju lijevo.
Probaj isključiti SW i uključiti.
Naslov: Odg: OCR skripta za SW
Autor: ExtraJa - 09.02.2011. 15:34:09
Ne znam šta mu je bilo tek nakon nekih 10-tak gašenja i pokretanja prepoznao je ovu skriptu!
Ostaje još samo da je isprobam i sve će biti za 10., nego da sad ne bude da sam bezveze pisao da pitam ima li gdje ovdje objašnjenje za rad sa ovim pascal skriptama (naravno ako je za takvo nešto uputstvo uopšte potrebno, te da li su one potrebne za rad prosječog korisnika SW-a - kao što sam ja)?  :)
Naslov: Odg: OCR skripta za SW
Autor: MilanRS - 02.04.2011. 18:17:26
Poslije 9 mjeseci postavljena osvježena verzija MilanRS2 skripte.
Otkrivene greške su ispravljene, nešto novo dodato.

Ako primijetite da skripta nešto radi pogrešno ili ne radi nešto što bi bilo dobro da radi,
molio bih da mi javite ili ovdje ili na privatnu poruku.
Naslov: Odg: OCR skripta za SW
Autor: hajo0309 - 02.04.2011. 19:43:50
Imam jednu malu zamjerku na tvoje titlove. Ona mi baš jako upada u oči.

68
00:04:02,534 --> 00:04:05,131
Hitna skrb je pametan potez. -Većina
naših hitnih slučajeva su...

69
00:04:05,166 --> 00:04:08,458
...sitne stvari. Iščašeni zglobovi, bol u
grlu, potres mozga... -To mi odgovara.

Tri točke na kraju 68. i početku 69. linije nisu potrebne. One se nikad ne stavljaju kod prelaska jedne rečenice u dvije linije.
To je ružno i glupo. Gledatelj nije idiot kojemu se trebaju ovakve stvari "crtati". Ovako to treba izgledati:

68
00:04:02,534 --> 00:04:05,131
Hitna skrb je pametan potez. -Većina
naših hitnih slučajeva su

69
00:04:05,166 --> 00:04:08,458
sitne stvari. Iščašeni zglobovi, bol u
grlu, potres mozga... -To mi odgovara.

Milane, jel bi se mogla napraviti skripta da briše te tri točke na početku i kraju svake linije?
Naslov: Odg: OCR skripta za SW
Autor: nebojsa66 - 02.04.2011. 19:48:30
Pa to mislim da ima opcija u SW-u.

Btw, hvala Milane puno na skripti, legendarna je!  clapp
Naslov: Odg: OCR skripta za SW
Autor: MilanRS - 02.04.2011. 19:54:05
Evo da uklanja tri tačke sa početka i tri tačke sa kraja linije.
Ali, pazi, može se javiti greška u slučaju kad završava rečenica s "..."
pa će onda ostati nezavršena rečenica.

1
Niste se predstavili...

2
Zovem se Mark.

->

1
Niste se predstavili

2
Zovem se Mark.

Zato se preporučuje koristiti je samo preko F12, F11, F12, F11...
Naslov: Odg: OCR skripta za SW
Autor: hajo0309 - 02.04.2011. 19:59:44
Hvala, ispobat ću ju definitivno. clapp
Naslov: Odg: OCR skripta za SW
Autor: pejafor3 - 04.04.2011. 12:40:19
A da li može da se napravi jedna skripta koja će dodavati/zatvarati Italic liniju sa </i>

Primer:
<i> Ovo je primer linije koja treba da se zatvori.

Znači, ako skripta nađe <i> ispred linije, treba da doda </i> ukoliko ga nema.

Primer:
<i> Ovo je primer linije koja treba da se zatvori.</i>

Meni lično nije problem što nema </i> kada je cela linija u pitanju jer ne gledam na kućnim plejerima, ali vidim da većina plejera muči muku sa tim.

I poruka se sjebala  rofl



Naslov: Odg: OCR skripta za SW
Autor: MilanRS - 04.04.2011. 17:52:15
Popravio sam ti poruku. ;D

Što se tiče mene i RegExa, ne može.
Više puta sam pokušavao da u Replace dio ubacim tag, ali bezuspješno.

Jedina nada ostaje pascal i neko ko je dobar sa pascalom. :)
Naslov: Odg: OCR skripta za SW
Autor: MilanRS - 16.04.2011. 18:28:43
Skripta ne briše crticu ako je na početku drugog reda italic tag.

Duše ljudi žive i nakon smrti.
<i>- Gledali ste...</i>

Da biste i to omogućili, poslije 232. linije u skripti,
ispod ova dva reda:
<!-- Brisanje razmaka iza crte - na početku 2. reda -->
<ERROR Find="[\n](- )[0-9A-ZŠĆŽČĐ\x22\x3C]" ReplaceBy="-">
dodajte još:
<ERROR Find="[\n][\x3C][i|b|u][\x3E](- )[0-9A-ZŠĆŽČĐ\x22\x3C]" ReplaceBy="-">

To će biti u osvježenoj verziji ali ne uskoro jer nema drugih dodataka ili korekcija.
Naslov: Odg: OCR skripta za SW
Autor: annorax - 20.04.2011. 18:29:09
Zamolio bih za malu pomoć.
Skinuo sam sa sajta onu paskalovu skriptu koja pravi razmak od 125 ms između linija (ako on već ne postoji), ali King Eric mi je savjetovao da stavim razmak od 200 ms. Gdje i kako se to podešava? Kad idem na Tools -> Pascal Scripts -> Gap125 ne nude mi se nikakve opcije, skripta se samo automatski izvrši.
Hvala unaprijed.  :)
Naslov: Odg: OCR skripta za SW
Autor: King Eric - 20.04.2011. 18:34:05
Odi u C:\Program Files\Urusoft\Subtitle Workshop\PascalScripts, pronađi skriptu, otvori je u Notepadu, i promijeni broj tri u pet u liniji teksta:
DesiredGap := Round(3 * 1/FPS * 1000); // Desired transition time set to 3 frames.

Ovako treba izgledati:
DesiredGap := Round(5 * 1/FPS * 1000); // Desired transition time set to 5 frames.


Naslov: Odg: OCR skripta za SW
Autor: danielko - 28.04.2011. 10:07:40
Zdravo, svima.

A, sta je sa podignuti titlom?
Kako je to moguce realizirati, jer staviti samo 2-3 "entera" u titl, na reload subtitle, SW to obrise,
a vrlo je bitno da kad ima neki "priljepen" tekst u video, da ovozmozimo gledaoci da to procitu,
a da  se pritome tekst ne mesa.

Hvala i pozdrav iz Makedonije
Naslov: Odg: OCR skripta za SW
Autor: pejafor3 - 28.04.2011. 10:49:55
Zdravo, svima.

A, sta je sa podignuti titlom?
Kako je to moguce realizirati, jer staviti samo 2-3 "entera" u titl, na reload subtitle, SW to obrise,
a vrlo je bitno da kad ima neki "priljepen" tekst u video, da ovozmozimo gledaoci da to procitu,
a da  se pritome tekst ne mesa.

Hvala i pozdrav iz Makedonije

SW nije nije predviđen za te stvari ali...
Treba ti ALT kôd za ENTER.
(http://usefulshortcuts.com/alt-codes/)
Možeš da probaš da stavljaš "space" ali ne sa tastature nego sa kodom ALT+0160
Tada dobijaš razmak, a SW ne vidi to kao razmak nego kao karakter i onda ti neće obrisati.
Naslov: Odg: OCR skripta za SW
Autor: danielko - 28.04.2011. 11:03:45
Zdravo, svima.

A, sta je sa podignuti titlom?
Kako je to moguce realizirati, jer staviti samo 2-3 "entera" u titl, na reload subtitle, SW to obrise,
a vrlo je bitno da kad ima neki "priljepen" tekst u video, da ovozmozimo gledaoci da to procitu,
a da  se pritome tekst ne mesa.

Hvala i pozdrav iz Makedonije

SW nije nije predviđen za te stvari ali...
Treba ti ALT kôd za ENTER.
(http://usefulshortcuts.com/alt-codes/)
Možeš da probaš da stavljaš "space" ali ne sa tastature nego sa kodom ALT+0160
Tada dobijaš razmak, a SW ne vidi to kao razmak nego kao karakter i onda ti neće obrisati.


Hvala puno, care :)
Naslov: Odg: OCR skripta za SW
Autor: japa - 06.05.2011. 00:22:26
Super skripta. Mislim da bi trebalo bit obavezno korištenje ove skripte ako se prijevod radi u SW (a boljeg programa nema).  :)

P.S.
Žao mi je što ju nisam koristio prije nego sam stavio svoj prvi prijevod. Mislim da ću uploadat novu verziju kad prođe ovu skriptu.  ;D
Naslov: Odg: Osnovne upute i savjeti za izradu titlova
Autor: prijatel-MKD - 10.05.2011. 00:16:44
 
Citat:  © prijatel-MKD from mk.titlovi.com
Nekoliko korisnih i cesto potrebne Paskal skripte u SW 2.51

1 - Insert subtitle (only in translation)
Omogucava da se doda novi prazni titl samo u prevodnom delu. Novi dodani titl ce biti dodan odmah nakon selektovanog titla u listu, pri tome sadrzaj i tekst kojeg imate u vec postojecih titlova od selektovanog nadole bice pomereni za jedan titl nadole u listu bez bilo kakve promjene u vremenskom rasporedu za prikaz titlova.

2-Copies original text into translation (selected lines only)
Omogucuje vam da kopirate sadrzaj i tekst selektiranih titlova u osnovnu listu (jedan ili vise titlova odjednom) iz originalnog u prevodnom delu. Pri ovome, ukoliko selektirane titlove u prevodnom delu sadrzi bilo sta, taj ce sadrzaj biti automatski obrisan i zamjenjen sadrzajem koji ima titl iz originalnog dela.

3-Join subtitles (only from translation)
Spajanje dva posledovatelnih titlova, pri cemu se spajanje izvrsava samo u prevodnom delu.
Sadrzaj titlova kojih se nalaze ispod selektiranih titlova u listu bice pomeren za jedan titl prema gore.
Ukoliko selektirate vise od dva posledovatelna titlova (Primer za tri selektirana titlova), dobicete po malo neocekivani rezultat, tj. dvojno/duplo spajanje na 1+2 i 2+3. Zbog ovoga, ukoliko zelite spojiti tri posledovatelna titlova samo u prevodnom delu, to spajanje trebate izvrsiti u dva koraka spajanjem po dva titlova 1+2 i (1+2)+3 i tako dobiti jedan sacinjen od sva tri titlova.

4-Delete subtitle (only from translation)
Brisanje jednog selektiranog titla samo u prevodnom delu.
Ukoliko imate seletiranih veci broj titlova u osnovnu listu, samo prvi od njih ce biti obrisan.
Pri ovom se brise i sadrzaj obrisanog titla u prevodnom delu, ako zelite sacuvati/zadrzati sadrzaj trebate upotrebiti skriptu za spajanje titlova.
Sadrzaj titlova nakon obrisanog titla bice pomeren za jedan titl prema gore bez bilo kakve promjene u vremenskom rasporedu za prikaz titlova.

5-Remuve First Dash
Obrisati crtu "Tire" tamo gde je ima i na pocetku ispred teksta u prvom tekstualnom redu. Brisu se sve prve crtice (-) u svih titlova odjednom.
U one titlove gde ima crticu kao znak za drugi, treci, itd. sugovornik, te se crtice ne brisu, brise samo prvu crticu ukoliko je ima na pocetku titla za prvog sugovornika.

6-Add Dotted Line
Dadati jednu jedinu tacku (.) u svih titlova odjednom, u celom u celom filmskom prevodu (titl fajl).
Jer pri snimanju titl-fajlova i titl projekat u SW nepovratno se gube sve prazne titlove koji sto nemaju ikakav sadrzaj u njima, ovo je vrlo korisna skripta pri izradu novog titl-fajla (novi filmski prevod) od belog lista.
Kad u SW dodate novi titl preko taster "Insert", taj novi titl nema sadrzaj u njemu i bice izgubljen ako se fajl snimi kao takav s praznim titlovima.
Titleri koji ujednom i prevode najcesce odmah upisuju i prevod, ali ako vi trebate samo sastaviti vremensku skriptu za prikaz titlova za neki drugi jezik i necete vi prevoditi, a morate dodati bilo kakav sadrzaj u svaki titl kako ih nebi izgubili pri snimanju, ovo je jedna vrlo korisna skripta koja vam moze ustediti puno vremena.


- Da bi moglu upotrebiti Paskal skripte, trebate ih kopirati/smjestiti u programskom folderu SW-a s pocetno postavljeni instalacioni put/folder:
C:\Program Files\URUSoft\Subtitle Workshop\PascalScripts

Ukoliko ste vi sami promjenili osnovni put za instalaciju SW-a i instalirali ste ga na drugu lokaciju ili drugu particiju, soodvetno se menja i gore pomenuti put/folder.

Izvrsavanje komande s Paskal skriptima vrsi se preko meni "Tools / Pascal Scripts / ...."
(http://i25.servimg.com/u/f25/12/65/90/87/pascal10.jpg)

U meni listu se automatki podredzuju po azbucnom/abecednom redom pri cemu brojeve imaju prednost i soodvetno dobijaju kratenice/precice: Sift+Ctrl+1 za prvu skriptu; Sift+Ctrl+2 za drugu skriptu; itd.

Paskal skripte RAR arhiva  ShotGun5 (http://prijatel.webs.com/_private/1-PascalScripts_SW251.rar)

I na kraju ovo najbitnije.
Jer se Paskal skripte uglavnom odnose na prevodni deo, ukoliko vam je potrebno da izvresite promjene u originalnom delu sve sto trebate je da privremeno zamjenite pozicije originalnog i prevodnog dela uz tastere Shift+Ctrl+W.
Naslov: Odg: OCR skripta za SW
Autor: hajo0309 - 29.09.2011. 16:00:52
Kod tipkanja često mi se dogodi da uz prvo slovo u rečenici i drugo lupim velikim slovom.
Npr. KAko si? -DObro
Je l' bi se mogla napraviti skripta koja bi detektirala to? :)
Naslov: Odg: OCR skripta za SW
Autor: MilanRS - 21.12.2011. 13:16:05
Za one koji ne vole u titlu kad neispravno piše glagol na -ti ispred: ću, ćeš, će, ćemo, ćete, će,
 evo jedna skripta. Isprobao sam je, za razliku od ranijih pokušaja, ova ne pravi lažno pozitivne alarme.
 Isprobajte i vi, ako se slučajno desi da nešto pogrešno ispravlja, javite.
 Inače, poslije ću je ugraditi u standardnu OCR skriptu MilanRS2.ocr.
 
 
Potpredsjednik, čovek najodgovorniji
 za taj napad, htjeti će te iskoristiti.
     Potpredsjednik, čovek najodgovorniji
 za taj napad, htjet će te iskoristiti.

Izgledati će još gore ako mu raznesu
 helikopter dok je u njemu. Reci mu to.
     Izgledat će još gore ako mu raznesu
 helikopter dok je u njemu. Reci mu to.

Želim prisustvovati. Dozvoliti će mi.     Želim prisustvovati. Dozvolit će mi.


 Edit: Pošto ovo može od ispravnog napraviti pogrešno, mora se koristiti kao posebna skripta pa sa F9 i F12/F11 kretati se od greške do greške i vidjeti da li treba ispraviti ili ostaviti.
Naslov: Odg: OCR skripta za SW
Autor: igor_MD - 21.12.2011. 21:55:24
Hvala, milane. moglo bi dobro doći, ali ja ne znam šta s ovime  :-[
Naslov: Odg: OCR skripta za SW
Autor: Commandoguru - 21.12.2011. 22:23:42
Snimi attachment kao rar file, otpakiraj, i stavi otpakirano među OCRskripte na hard disku u instalaciji SW-a.
Naslov: Odg: OCR skripta za SW
Autor: Strider - 23.12.2011. 20:56:18
Za one koji ne vole u titlu kad neispravno piše glagol na -ti ispred: ću, ćeš, će, ćemo, ćete, će,
 evo jedna skripta. Isprobao sam je, za razliku od ranijih pokušaja, ova ne pravi lažno pozitivne alarme.
 Isprobajte i vi, ako se slučajno desi da nešto pogrešno ispravlja, javite.
 Inače, poslije ću je ugraditi u standardnu OCR skriptu MilanRS2.ocr.
 
 
Potpredsjednik, čovek najodgovorniji
 za taj napad, htjeti će te iskoristiti.
     Potpredsjednik, čovek najodgovorniji
 za taj napad, htjet će te iskoristiti.

Izgledati će još gore ako mu raznesu
 helikopter dok je u njemu. Reci mu to.
     Izgledat će još gore ako mu raznesu
 helikopter dok je u njemu. Reci mu to.

Želim prisustvovati. Dozvoliti će mi.     Želim prisustvovati. Dozvolit će mi.
Druže Milane, što je s ovim riječima koje slijede?!
1) Riječi s četiri slova koja završavaju na "ati" su izuzeci i ne mijenjanju se!!! (ćati, dati, lati, mati, rati, sati, tati, vati)
2) Riječi s četiri slova koja završavaju na "eti" su izuzeci i ne mijenjanju se!!! (četi, meti, peti, teti)
3) Izuzeci s četiri slova koji se mijenjaju (žeti, biti, liti, miti, piti, riti, šiti, viti) !
4) Izuzeci koji se ne mijenjaju:
 Ostaje "niti ću (ćeš, će, ćemo, ćete)"
 Ostaje "naniti će" (SF serije: naniti ili nanoboti)


Nažalost, nije to baš toliko jednostavno da bi uspilo u samo jednom retku.  :(

U mojoj staroj skripti sam to odavno pokušao (i donekle dobro napravio, s par izuzetaka  :-[)
<!-- Zamijeni sve riječi s 5 i više slova "**(a)(e)(i)ti ću" s "**(a)(e)(i)t ću" i "**(a)(e)(i)ti će*" s "**(a)(e)(i)t će*" -->
<!-- Riječi s četiri slova koja završavaju na "ati" su izuzeci i ne mijenjanju se!!! (ćati, dati, lati, mati, rati, sati, tati, vati) -->
<!-- Riječi s četiri slova koja završavaju na "eti" su izuzeci i ne mijenjanju se!!! (četi, meti, peti, teti) -->
<ERROR Find="[A-Za-zćčđšž][a-zćčđšž][a|e|i](ti )ć[eu]" ReplaceBy="t ">
<ERROR Find="[A-Za-zćčđšž][a-zćčđšž][a|e|i](ti)\r?\nć[eu]" ReplaceBy="t">
<!-- Izuzeci s četiri slova koji se mijenjaju (žeti, biti, liti, miti, piti, riti, šiti, viti) ! -->
<ERROR Find="\b[ž|Ž](eti )ć[eu]" ReplaceBy="et ">
<ERROR Find="\b[ž|Ž](eti)\r?\nć[eu]" ReplaceBy="et">
<ERROR Find="\b[b|B|l|L|m|M|p|P|r|R|š|Š|v|V](iti )ć[eu]" ReplaceBy="it ">
<ERROR Find="\b[b|B|l|L|m|M|p|P|r|R|š|Š|v|V](iti)\r?\nć[eu]" ReplaceBy="it">

<!-- Izuzeci koji se ne mijenjaju: -->
<!-- Ostaje "niti ću (ćeš, će, ćemo, ćete)" -->
<ERROR Find="(?i)\bni(t )ć[eu]" ReplaceBy="ti ">
<ERROR Find="(?i)\bni(t)\r?\nć[eu]" ReplaceBy="ti">
<!-- Ostaje "naniti će" (SF serije: naniti ili nanoboti) -->
<ERROR Find="(nanit )će\b" ReplaceBy="naniti ">
<ERROR Find="(nanit)\r?\nće\b" ReplaceBy="naniti">

<!-- Izuzeci koji se ne mijenjaju, dodaje se "t": -->
<!-- Mijenja se "pati ću (ćeš, će, ćemo, ćete)" u "patit ću (ćeš, će, ćemo, ćete)" -->
<ERROR Find="(?i)\b(pati )ć[eu]" ReplaceBy="patit ">
<ERROR Find="(?i)\b(pati)\r?\nć[eu]" ReplaceBy="patit">
<!-- Mijenja se "jati ću (ćeš, će, ćemo, ćete)" u "jatit ću (ćeš, će, ćemo, ćete)" -->
<ERROR Find="(?i)\b(jati )ć[eu]" ReplaceBy="jatit ">
<ERROR Find="(?i)\b(jati)\r?\nć[eu]" ReplaceBy="jatit">
<!-- Mijenja se "leti ću (ćeš, će, ćemo, ćete)" u "letjet ću (ćeš, će, ćemo, ćete)" -->
<ERROR Find="(?i)\b(leti )ć[eu]" ReplaceBy="letjet ">
<ERROR Find="(?i)\b(leti)\r?\nć[eu]" ReplaceBy="letjet">
<!-- Mijenja se "hiti ću (ćeš, će, ćemo, ćete)" u "hitit ću (ćeš, će, ćemo, ćete)" -->
<ERROR Find="(?i)\b(hiti )ć[eu]" ReplaceBy="hitit ">
<ERROR Find="(?i)\b(hiti)\r?\nć[eu]" ReplaceBy="hitit">
<!-- Mijenja se "kiti ću (ćeš, će, ćemo, ćete)" u "kitit ću (ćeš, će, ćemo, ćete)" -->
<ERROR Find="(?i)\b(kiti )ć[eu]" ReplaceBy="kitit ">
<ERROR Find="(?i)\b(kiti)\r?\nć[eu]" ReplaceBy="kitit">
Naslov: Odg: OCR skripta za SW
Autor: MilanRS - 23.12.2011. 21:16:07
Slabije se razumijem u tu problematiku jer u srpskom ide spojeno i bez t, ali zapada mi za oko kad pročitam "Pobijediti ćemo" pa sam zato pokušao ovo da napravim.
Već mi je Igor javio za probleme sa npr. "Dijamanti će ostati" i sličnim slučajevima.

Napravio sam da pronalazi samo slučajeve ću/ćeš/će/ćemo/ćete/će, ne i kada su oni početak riječi, npr. ćurka pa sam mislio da je time riješen problem. Pošto nije, ovo neće moći biti sastavni dio skripte milanrs2.ocr.

milanrs2.ocr ne smije pri F9 i F10 ništa pokvariti, a treba ispraviti što više pogrešnog.
Pošto ovo može od ispravnog napraviti pogrešno, mora se koristiti kao posebna skripta pa sa F9 i F12/F11 kretati se od greške do greške i vidjeti da li treba ispraviti ili ostaviti.

Srećom, nisu toliko česte greške oko toga kod prevodilaca pa samo pojedine titlove treba provjeravati i ovom skriptom.
Naslov: Odg: OCR skripta za SW
Autor: Strider - 24.12.2011. 17:21:59
Baci oko na onaj kod koji sam stavio u postu prije, a imaš i cilu skriptu na drugoj stranici ovog topika (Odgovor #24 - napravio sam update maloprije). Slobodno iskoristi za svoju skriptu bilo što, ukoliko ti se učini zanimljivim. Svima nam je u interesu imati što ispravnije titlove.  ;)

Ovaj dio kod mene prilično dobro ispravlja inverziju pomoćnog glagola i infinitiva. Pošto se nađe opisnih pridjeva onda bi nakon primjenjene one skripte (F10), trebalo naknadno proć titl postepeno sa sljedećom skriptom (F9/F12/F11):
<!----------------------------------------------->
<!--     Subtitle Workshop OCR Script file     -->
<!--       Copyright © 2001-2004 URUSoft       -->
<!--           http://www.urusoft.net          -->
<!----------------------------------------------->

<SWOCR WordChars="0123456789abcdefghijklmnopqrstuvwxyzABCDEFGHIJKLMNOPQRSTUVWXYZ_ńŃáéíóúÁÉÍÓÚäëďöü">


<!-- Zamijeni sve riječi s "**(u)(s)ti ću" s "**(u)(s)t ću" i "**(u)(s)ti će*" s "**(u)(s)t će*" -->
<!-- ubačeno radi opisnih pridjeva, dok se glagoli i dalje mijenjaju!!! -->
<ERROR Find="[A-Za-z][u|s](ti )ć[eu]" ReplaceBy="t ">
<ERROR Find="[A-Za-z][u|s](ti)\r?\nć[eu]" ReplaceBy="t">

<ERROR Find="[A-Za-z](\x22)[A-Za-z]" ReplaceBy=" "">
</SWOCR>
Naslov: Odg: OCR skripta za SW
Autor: princo - 01.01.2012. 14:18:08
Pokušavam da riješim problem sa tagovima pošto plejeri koje ja imam nikako ne mogu da ih prikažu. Pokušao sam da ih sve eliminišem praveći skripte po uzoru na onu za uklanjanje font taga. Međutim, nisam uspio. Može li mi neko pomoći?
Naslov: Odg: OCR skripta za SW
Autor: petko - 01.01.2012. 14:28:06
Na urusoftovom forumu već postoji paskal skripta za uklanjanje tagova:

// Remove style tags. Made by Bedazzle 2007.01.08.
// Fast implementation, use with care!

program RemoveStyleTags;

// ---------------------------------------------

var
  n: Integer;
  i: Integer;

  p1: Integer;
  p2: Integer;

  txt: String;

begin
  n := GetSubtitleCount;

  for i := 0 to n-1 do
  begin
     txt := GetSubtitleText(i);

     p1 := pos('<', txt);
     p2 := pos('>', txt);

     while ((p1>0) and (p2>0)) do
     begin
       txt := copy(txt, 1, p1-1) + copy(txt, p2+1, length(txt)-p2);

       p1 := pos('<', txt);
       p2 := pos('>', txt);
     end;


     SetSubtitleText(i, txt);
  end;
end.
Naslov: Odg: OCR skripta za SW
Autor: MilanRS - 01.01.2012. 16:19:55
Nisam ni ja znao za tu pascal skriptu pa sam napravio OCR prije 12 mjeseci.
Potrebno je dva puta F10 jer prvi put ukloni samo u prvim redovima, a drugi ostale. :)
 
 
Naslov: Odg: OCR skripta za SW
Autor: princo - 01.01.2012. 18:15:11
Iskreno se zahvaljujem za oba rjesenja.
Naslov: Odg: OCR skripta za SW
Autor: princo - 02.01.2012. 19:52:55
Pitanje za MilanRS: Pokusao sam da ispravim tvoj skript za uklanjanje font tagova, međutim ne uspijevam. Trebalo bi biti jednostavno: umjesto dijela u kome opisujes font ubaciti slovo i (ili b za bold). Međutim, ništa se ne dešava. Možeš li pomoći?
Paskal skripta za uklanjane tagova radi bez greške, ali ne ispravlja "-" u prvom redu (naravno nije ni receno da to radi).
Naslov: Odg: OCR skripta za SW
Autor: MilanRS - 02.01.2012. 20:24:29
To nije bio cilj jer bold i italic podržavaju (skoro) svi plejeri za razliku od font tagova.
Ali napravih još te dvije linije za otvarajuće i zatvarajuće bold i italik.
Preimenovao sam skriptu i ona ide odvojeno od one koja uklanja samo font tagove.


Naslov: Odg: OCR skripta za SW
Autor: Veleno - 02.01.2012. 20:36:06
Milane, može li se skripta urediti da ispravlja i/ili briše nepotrebne italice?

<i>Dokaži.</i> -Kako? <i>-Ako tvrdiš da si
ono što jesi, saznat ćeš.</i></i>

-Tko je to? <i>-Tko je to?
Jesi li policajac?</i> -NCIS.</i>
Naslov: Odg: OCR skripta za SW
Autor: princo - 02.01.2012. 23:29:23
Zahvaljujem se još jednom. Dodao sam onaj segment za ispravku crtice u prvom redu i sve radi savršeno. Imam tri eksterna plejera (LG, Infinity i Weg) i nijedan ne koristi tagove. Izgleda prilično glupo kada se u tekstu pojavi tag, pogotovo onaj za font.
Naslov: Odg: OCR skripta za SW
Autor: MilanRS - 07.01.2012. 15:14:56
Milane, može li se skripta urediti da ispravlja i/ili briše nepotrebne italice?

<i>Dokaži.</i> -Kako? <i>-Ako tvrdiš da si
ono što jesi, saznat ćeš.</i></i>

-Tko je to? <i>-Tko je to?
Jesi li policajac?</i> -NCIS.</i>

Mogu napraviti da kad je na kraju </i></i> prebaci u </i>.
Ali ne znam napraviti (možda uopšte nije izvodljivo sa RegExom) da ukloni tag sa kraja ako je neparni zatvarajući.
Jedino da ga ukloni uvijek, ali onda se može desiti ovakva situacija:

<i>Dokaži.</i> -Kako? <i>-Ako tvrdiš da si
ono što jesi, saznat ćeš.

To je opet regularno jer nije neophodan zatvarajući italik na kraju reda, od otvarajućeg će sve biti nakošeno.
Samo što ne izgleda onako kako smo navikli.
Pa ako želiš, napraviću to, nije puno posla.



Separator stotica u našim jezicima je tačka ili razmak, nikako zarez.
Zarez razdvaja cijeli dio od decimalnog ostatka.
Ubaciću u novo izdanje skripte i ovo:
    <ERROR Find="[0-9](\.)[0-9][0-9]" ReplaceBy=",">
    <ERROR Find="[0-9](,)[0-9][0-9][0-9]\D" ReplaceBy=".">

cifra,cifracifracifra -> cifra.cifracifracifra
1,000 -> 1.000
5,123 -> 5.123
1,499,000.00 -> 1.499.000,00
1,499,000,00 -> 1.499.000,00

Ako ovo iz nekog razloga nije u redu, recite.
Naslov: Odg: OCR skripta za SW
Autor: Veleno - 07.01.2012. 15:47:28
Milane, ako nije problem, napravi. Ja ću je koristiti.
Naslov: Odg: OCR skripta za SW
Autor: MilanRS - 07.01.2012. 16:19:48
Prvi prolaz (F10):
 Gdje su dva zatvarajuća, ostaće samo jedan.
 Gdje je jedan, obrisaće ga.
 
 Drugi prolaz:
 Gdje je ostao jedan zatvarajući, obrisaće i njega.
(Nepotrebno. Dovoljan je samo prvi prolaz za ispravno tagovan titl.)
 
 
 
Naslov: Odg: OCR skripta za SW
Autor: Tweegy - 22.01.2012. 12:58:10
Da li postoji skripta koja uklanja ovakvu crticu | između reči?
Naslov: Odg: OCR skripta za SW
Autor: petko - 22.01.2012. 13:05:18
Hoćeš da ukloniš prelom redova? To se radi preko ctrl+shift+u.
Naslov: Odg: OCR skripta za SW
Autor: Tweegy - 22.01.2012. 13:13:48
Ne. Primer:

Da, pa, najmanje što možeš
da uradiš|je da ih pročitaš.

Ceo titl je takav. Ovakva crtica u svakoj liniji
između reči, pa ako postoji skripta.....
Naslov: Odg: OCR skripta za SW
Autor: petko - 22.01.2012. 13:35:41
Onda će jedan search & replace (ctrl+r) završiti posao.
Naslov: Odg: OCR skripta za SW
Autor: CroRiper - 12.02.2012. 21:31:00
Pitanje:  postoji li neka skripta ili neka druga mogućnost provjere da li na kraju titla i prije velikog slova fale interpunkcijski znakovi? Naime dogodi mi se da nekad izostavim znak pa ostane prazno.
Naslov: Odg: OCR skripta za SW
Autor: MilanRS - 13.02.2012. 00:31:17
Nemoguće je jer prije velikog slova ne ide tačka ako je neko ime,
a na kraju ne ide ništa ako je samo dio rečenice koja se nastavlja u sljedećem redu.
Ostaje samo ručna provjera.
Naslov: Odg: OCR skripta za SW
Autor: dome-nasty - 18.03.2012. 17:41:37
Instalirao sedmicu prije nekih mjesec dana i sve 5 ali sad primjetih da mi ocr skripta u SW koju sam prije koristio, milanRS2 tj. ona koja briše prvu crticu i razmak iza ostalih, ne radi kao prije.

Sada izbriše prvu crticu ali ostaje razmak iza ostalih crtica a CTRL+I javlja grešku na istim crticama kao nepotrebni razmak.

Da bi stvar bila bolja ako nema razmaka niti prve crtice, skripta pri automatskom ispravku grešaka sama napravi taj razmak ???
Naslov: Odg: OCR skripta za SW
Autor: King Eric - 18.03.2012. 17:47:53
Alt+I -> Advanced i isprazni polje Space after characters. Zapravo, možeš sva četiri isprazniti.

(http://img546.imageshack.us/img546/4299/screenshot2012031817460.png)
Naslov: Odg: OCR skripta za SW
Autor: dome-nasty - 18.03.2012. 18:37:43
Hvala care, tj kralju  ;)

Radio sam i komletnu instalaciju svih programa na novi HDD pa sam jednostavno zaboravio na prijašnje postavke a bilo je so easy...
Naslov: Odg: OCR skripta za SW
Autor: lijencina - 28.03.2012. 00:46:02
imam isti problem kao dome, naisao sam na prijevod koji ima crticu ispred teksta u prvom redu,
i ne javlja nista, koristim MilanRS2 skriptu, i obrisao sam ova cetiri polja ali i dalje isto
Naslov: Odg: OCR skripta za SW
Autor: MilanRS - 28.03.2012. 02:04:11
Alt+I, pod Fix treba da bude čekirano OCR Errors.
Naslov: Odg: OCR skripta za SW
Autor: lijencina - 28.03.2012. 11:16:24
pod Fix kad sam cekirao nista, ali onda sam pod Check for i sada radi
hvala
Naslov: Odg: OCR skripta za SW
Autor: MilanRS - 28.03.2012. 11:26:09
Pod Check treba da bi ti prikazivalo u greškama (Ctrl+I),
a pod fix treba da bi ti ispravljalo greške.
Čak i ako nije odabrano pod Check, a jeste pod Fix,
poslije F9 i F10 ispraviće sve.
Ali najbolje je da bude odabrano na oba mjesta da se zna šta se dešava.
Naslov: Odg: OCR skripta za SW
Autor: lijencina - 28.03.2012. 11:56:59
oznacio sam oba dva, i sad fino radi, ispravilo je sve greske  smileyNO1
Naslov: Odg: OCR skripta za SW
Autor: Gordon Freeman - 29.03.2012. 08:50:33
Može li neka skripta da reši problem koji mi izlazi kada pristisnem CTRL+I hearing interupdet?
Naslov: Odg: OCR skripta za SW
Autor: Commandoguru - 29.03.2012. 08:59:51
Pa u postavkama za kontrolu (Alt+I) iskljući kvačicu kod hearing impaired kod Check for i Fix
Naslov: Odg: OCR skripta za SW
Autor: Homer99 - 08.05.2012. 18:22:47
Stalno bi pokazuje titl ispod titla u SW-u kada ucitam film... kako da to resim?
Naslov: Odg: OCR skripta za SW
Autor: Veleno - 08.05.2012. 20:40:34
Isključi direct VobSub.
Naslov: Odg: OCR skripta za SW
Autor: MilanRS - 27.11.2012. 18:10:03
Za one koji koriste navodnike u svojim prevodima, a nije im zgodno sa altom upisivati i , mogu da napišu prevod koristeći " i ", pa da na kraju izvrše zamjenu koristeći skriptu navodnici.ocr.
(Ovo se preporučuje samo onima koji već koriste skriptu MilanRS2 i imaju ispravno podešen SW tako da im na kraju prevoda a prije pokretanja skripte zarez skripta MilanRS2 pokazuje 0 grešaka.)


Odaberete je lijevo, zatim F9 pa F10. Ako želite da pratite izmjene, pređite na prvu liniju u titlu, F9, zatim sa F12 skočite na prvu liniju sa " pa sa F11 neka se zamijeni. Ponavljajte F12 (skok na narednu liniju) i F11 (zamjena navodnika) do kraja prevoda.

Naslov: Odg: OCR skripta za SW
Autor: MilanRS - 11.02.2013. 16:48:21
U drugom postu ove teme nalazi se link za preuzimanje skripte MilanRS3. To je najnovija verzija, tj. preimenovao sam MilanRS2 u MilanRS3 zbog velike pauze od posljednjeg ažuriranja i većeg broja izmjena. Ako neko ne bude zadovoljan novom skriptom, uvijek može ponovo skinuti staru i/ili javiti se na PM i reći utiske i prijedloge.
Naslov: Odg: OCR skripta za SW
Autor: MilanRS - 31.03.2013. 15:36:24
Ako želite da aktivirate uklanjanje ... na početku rečenice,
otvorite skriptu MilanRS3 u Notepadu (ili Notepad++) pa na kraju skripte izbrišite ove znakove koji isključuju liniju.


(http://i.imgur.com/OwqWlQA.jpg)


Poslije toga će izgledati ovako:
<!-- Kad red počinje sa ...pa malo slovo -->
   <ERROR Find="^(\.\.\.)[a-zšđčćž\x22\x3C]" ReplaceBy="">
Naslov: Odg: OCR skripta za SW
Autor: Veleno - 31.03.2013. 20:42:21
Hvala, Milane.  smileyNO1
Naslov: Odg: OCR skripta za SW
Autor: HeadBurn3r. - 15.08.2013. 16:06:46
Postavim MilanRS2 skriptu u C:\Program Files\Urusoft\Subtitle Workshop\OCRScripts, ali ne mogu da je izaberem u SW-u.  :-\ Šta li bi to moglo biti?

(http://i41.tinypic.com/9zokyr.jpg)
Naslov: Odg: OCR skripta za SW
Autor: MilanRS - 20.08.2013. 19:59:07
Ili ti pokreće SW iz Program Files (x86) a ovo je u onom drugom ili nisi restartovao SW po ubacivanju skripte u folder.
Naslov: Odg: OCR skripta za SW
Autor: suadnovic - 09.09.2013. 11:56:22
Pozdrav za vredne momke. Mene interesuje mogućnost pravljenja skripte koja bi uklonila sledeću anomaliju(e) u titlovima:
Često puta druga linija prevoda počinje velikim slovom, iako se u prvoj liniji rečenica nije završila, tj. nema tačke na kraju.
Takođe, često sam nailazio na grešku da nakon tačke, tj. kraja rečenice, naredna rečenica počinje malim slovom.

Dakle, može li se napisati skripta koja bi uklonila odjednom ove dve anomalije, i slične, ako usput još nešto nekome padne na pamet?
Naslov: Odg: OCR skripta za SW
Autor: MilanRS - 09.09.2013. 12:30:12
1
Dobro došli, gospodine Andriću.
Da li imate problema sa

2
Stojanovićem
iz Duge Njive?

I ovdje bi trebalo da "s" bude malo?


1
Šta rekoste? -Pom. načelnika policije.

Ovdje bi trebalo da bude veliko "n"?

Ovi izuzeci onemogućavaju automatsko mijenjanje.
Ostaje samo da homo sapiens čita i odluči da li treba da se mijenja ili ne.
Naslov: Odg: OCR skripta za SW
Autor: suadnovic - 09.09.2013. 13:23:57
@MilanRS
Ja za editovanje titla često koristim EmEditor, i tu postoje mogućnosti pravljenja makroa, što iskreno verujem da bi moglo biti rešenje ovog "mog problema". Probaću da kontaktiram autora aplikacije, da vidim može li se šta uraditi. Naravno, bićete obavešteni. No, Milanov odgovor me je pomalo razočarao, bio sam ubeđen da se takva skripta može naparaviti. Nisam vičan tome, ali u toj skripti bi trebali da se koriste logički operatori, te sve što ona treba da pita za liniju titla, jeste: ima li tačku na kraju i počinje li naredna linija velikim slovom. Prosto mi je neverovatno da se to ne može uraditi.
Naslov: Odg: OCR skripta za SW
Autor: MilanRS - 09.09.2013. 13:40:01
te sve što ona treba da pita za liniju titla, jeste: ima li tačku na kraju i počinje li naredna linija velikim slovom. Prosto mi je neverovatno da se to ne može uraditi.

Kažem da se to može uraditi ali šta ćeš u slučaju da ima tačku na kraju a naredna linija ne počinje velikim slovom jer NE TREBA da počinje velikim slovom? (Kao što je navedeno u primjeru iznad)
Ako izmijeni, od ispravnog dobićemo pogrešno.
Naslov: Odg: OCR skripta za SW
Autor: suadnovic - 09.09.2013. 15:01:41
Oprosti Milane, opet mi nije baš najjasnije. To je algoritam sa dva slučaja, u zavisnosti od toga ima li prva linija tačku na kraju ili ne. Oba ta slučaja bi trebala imati dva podslučaja, u zavisnosti od toga kako počinje naredna linija, malim ili velikim slovom. Uz još jedno izvinjenje da sam možda uporan, a ne znam prave mogućnosti jezika za pisanje scripte. Teoretski gledano, jedna skripta bi bila dovoljna za oba moja problema. :ceska:
Naslov: Odg: OCR skripta za SW
Autor: MilanRS - 09.09.2013. 16:13:25
Hajde da pokušamo raščlaniti problem.

Znači, ako prva linija ima tačku na kraju
a druga počinje malim slovom,
treba da to početno malo slovo uvijek prebaci u veliko?
Naslov: Odg: OCR skripta za SW
Autor: suadnovic - 09.09.2013. 17:02:57
Tako je, ako se prva linija završava tačkom, ako je prvo slovo u narednoj liniji malo, menja ga u veliko, u suprotnom ostavlja titl kakav jeste. Pod uslovom naravno da jezik razlikuje malo od velikog slova.
Ako se ne završava tačkom, onda opet gleda prvo početno slovo narednog reda, pa ako je malo, ne dira ga, a ako je veliko, pretvara ga u malo.
Stim, što tu mogu da zasmetaju crtice u drugoj liniji titla, no valjda skripra može nju da ignoriše, tj. ako je prvi karakter - da nju ignoriše i pređe na naredni simbol, ignorišući i prazan prostor po potrebi.
Loše vesti sa http://www.emeditor.com, sele se tako da na eventualni makro treba pričekati. Uzgred, ljudi bi mislim trebali da probaju EmEditor, sjajan program, da ja sad tu ne glumim reklamnog agenta. Može se skinuti zadnja verzija 13.0.4  torrentom, recimo.
Naslov: Odg: OCR skripta za SW
Autor: lemonzoo - 09.09.2013. 17:18:15
Mislim da ti je MilanRS objasnio, ali evo dva moja primjera


Dobar dan, je li tu g.
novinar Suad Nović? Moram razgovarati s njim.





Halo. Jesam li dobila
Suada Novića?



Iz ova dva primjera ti je jasno zašto ta skripta nema smisla.
Naslov: Odg: OCR skripta za SW
Autor: MilanRS - 09.09.2013. 17:23:44
Evo i realnih primjera na koje bi se taj algoritam primijenio.
Serija: Closer S04E02.

183
00:16:51,860 --> 00:16:55,614
Ovo je njezin šef. Pom.
nač. Will Pope. -Drago mi je.

313
00:27:56,406 --> 00:28:00,661
Naš je odvjetnik zvao pom.
nač. Popea! On nije izdao nalog!

Šta bi se desilo kad bi taj algoritam naišao na ovo u titlu?
Naslov: Odg: OCR skripta za SW
Autor: suadnovic - 09.09.2013. 17:54:44
Momci, svi ste u pravu, no morate priznati da to nisu tako česte situacije, a odavno sam naučio da kod svakog titla konačna obrada mora biti ručna. U najgorem slučaju, takvih situacija ne može biti više no u desetak redova (da ne preterah sa optimizmom). Takva skripta bila bi korisna ako naletite na titlove na nekom "egzotičnom jeziku", te ste prisiljeni koristiti prevodioca, poput Google translate, koji upravo pravi gornje anomalije, i to u svakom redu titla. Evo ja priznah da mi je motivacija za takvu skriptu vrlo lična, no osnovno pitanje ostaje: MOŽE LI SE ONA NAPRAVITI?
@LemonzOO
Tvoje se lako popravlja: U SW treba sa Search + replase, zameniti g. sa gdin, pre primene "NAŠE SKRIPTE", dok je situacija

Halo. Jesam li dobila
Suada Novića? (Otkud znaš kako se zovem?)

stvarno izuzetno retka, u svakom slučaju, pre primene skripte, treba pregledati titl.

A Search + replase bi rešio i Milanov primer, uz rizik da red bude predugačak.

Priča se vrti oko skripti, tako da nije zgore priupitati i ovo: RemoveFirstDash odlično radi svoj posao, ali samo ukoliko linija titla nije u italiku. Sa italikom je nemoćna. Može li se tu nešto popraviti kod nje?
Naslov: Odg: OCR skripta za SW
Autor: igniss - 09.09.2013. 20:42:23
Da li vama radi Mr. -> g.? Meni ne.
Naslov: Odg: OCR skripta za SW
Autor: MilanRS - 09.09.2013. 21:10:37
Ne radi nikome jer to takođe nije sigurno uvijek pa ne može biti aktivno.
Nalazi se zakomentarisano. Otvori u Notepad++ ili običnom pa nađi sljedeće i ukloni oznake za komentar.
(http://i.imgur.com/7pKBVDi.jpg)

Ali ovo radi samo ako je ispred Mr tačka pa razmak. I opet se ne zna da li treba veliko ili malo g.
Zato bi trebalo da se ide od greške do greške i provjeri.

Ako hoćeš da ti pronalazi sve Mr., dodaj ovu liniju ispod posljednje od tih koje su isključene.
<ERROR Find=" Mr\. " ReplaceBy="g. ">

P.S. Sad vidim da je ovo gore što je isključeno zapravo neispravno. Promakla mi je tačka bez obrnute kose crte.
Treba dodati \ ispred tačke.
( Mr\. )
( Mrs\. )
( Mrs\. )
Naslov: Odg: OCR skripta za SW
Autor: igniss - 09.09.2013. 22:13:12
Ma uradio sam sve to i pre nego što sam postavio pitanje, ali mi ništa ne radi. Mr. Bamble ne postaje g. Bamble, iako lepo stoji
<ERROR Find="( Mr\.) " ReplaceBy="g. ">

EDIT:
Rešeno! Iako sam podesio da SW radi sa izmenjenom skriptom MilanRS3, pri ponovnom pokretanju mi je vratio MilanRS2, pa se zbog toga ništa nije dešavalo.
Naslov: Odg: OCR skripta za SW
Autor: suadnovic - 30.09.2013. 18:32:03
Kod adaptacije titla sa hrvatskog na srpski, najdosadniji deo posla mi je da ispravljam stvari poput ovih:
vrijeme--->vreme
počet ću --->  počeću
primit ću --->  primiću
uopšte, želeo bih skriptu koja bi
it će, at će, et će, ut će  prevodila redom u iće, aće, eće, uće
i pritom nezavisno od dužine prve reči
(valjda se mogu koristiti neki džokeri, da sad ne lupim nešto, valjda bi to trebalo da bude nešto poput
*it će, *at će, *et će, *ut će ---> *iće, *aće, *eće, *uće
a ono gore
*ije*--->*e*

Zamolih danas Milana, valjda će i on nešto uraditi. Mislim da ovo nije nikakav problem.
Ima tu i nekih problema,
 sa ijekavicom,
doživjet će ---> doživeće
(ovo je ako se dobro sećam,neka palatalizacija)
srest ću ---> srešću
a biće ih sigurno još, te bi i o tome trebalo povesti računa.

Naslov: Odg: OCR skripta za SW
Autor: donrile86 - 02.10.2013. 12:23:56
Jedno kratko pitanje.
Iz ne znam kog razloga sam obrisao sve skripte iz foldera "OCRScripts" i "PascalScripts" ukljucujuci i one default koje vec postoje nakon instalacije SW-a. Lako cu da vratim sve "ove vase", ali interesuje me da li one default skripte imaju neku bitnu ulogu, tj da li mi trebaju ili ne? I kako ih, eventualno, vratiti?


Hvala svima.
Naslov: Odg: OCR skripta za SW
Autor: igor_MD - 02.10.2013. 12:36:04
Ne trebaju. No te preocupes.

Namjesti sve ko šta na sajtu piše i vrati MilanRS3, CPS_petko, CPS-fix i Gap.
Ama ništa drugo ti ne treba.


(I guess  ;D)
Naslov: Odg: OCR skripta za SW
Autor: donrile86 - 02.10.2013. 12:37:18
Pretpostavljao sam da mi ne trebaju. Hvala puno.
Naslov: Odg: OCR skripta za SW
Autor: suadnovic - 15.10.2013. 18:31:45
 U vezi onog mog posta malo više o zameni velikih i malih slova na početku druge linije titla, stvar se, kao što sam i pretpostavljao, može srediti EmEdior-om. Treba koristiti ovaj makro
http://www.emeditor.com/forums/topic/makro-for-subtitles/#post-17281
Testirao sam ga, radi savršeno.
Ako vas zanima šta se dešava, evo pogledajte na ovom primeru engleskog titla za film So This Is Christmas (2013)
http://www.mediafire.com/?25gpc1palhh5m6i
Propustite engleski titl kroz Automatskog prevodioca u SubtitleEdit-u, da dobijete "loš" prevod, a potom na njega primenite gornji makro. Rezultat je u drugom fajlu iz mediafire linka.
A ubeđen sam da bi se mogao napraviti i ekvivalent za Milanovu skriptu. Stvar je  tome da makro, ako je dobro napisan, nikad neće da zezne, a nažalost OCR skripte, bar kod mene, nekad rade, nekad ne rade, a da pojma nemam zašto i šta se dešava. Mogu samo da se nerviram.
Naslov: Odg: OCR skripta za SW
Autor: suadnovic - 15.10.2013. 19:03:22
Skinite zip sa ovog linka, biće mnogo jasnije
http://www.sk.rs/forum/showthread.php?p=1807296#post1807296
Naslov: Odg: OCR skripta za SW
Autor: hajo0309 - 03.07.2014. 22:14:12
Jel bi se mogla napraviti skripta koja bi produživala trajanje linija?
Znači, da produžuje na 2 sekunde  one linije koje prekratko traju, a ne mogu se spojiti s prethodnom ili sljedećom linijom.
Naslov: Odg: OCR skripta za SW
Autor: lemonzoo - 03.07.2014. 22:18:15
Ima to već.
CTRL+L

(http://abload.de/img/silversurfer1998-199978rrn.jpg)

CTRL+SHIFT+Y
 
(http://abload.de/img/silversurfer1998-1999ylrie.jpg)

CPS-Fix (http://www.prijevodi-online.org/smf/index.php/topic,11546.msg298617.html#msg298617) (produžava sve linije koje može ako imaju cps slabiji od 15)

Podesi ovako.
Samo što poslije ovoga uvijek moraš upotrijebiti skriptu GAP radi razmaka.
Naslov: Odg: OCR skripta za SW
Autor: hajo0309 - 03.07.2014. 23:21:02
Cpsfix/gap koristim redovno.
Ovo ctrl+L je to upravo ono što trebam. Hvala. smileyNO1
Naslov: Odg: OCR skripta za SW
Autor: suadnovic - 03.08.2014. 01:14:00
Interesuje me zašto SW ne pravi razmak svuda u titlu iza - ,iako je podešen za to.
Primer:
8
00:00:39,284 --> 00:00:42,215
Pitam se što bi tata
rekao na sve ovo. -Čudno.
Inače, pravi razmak iza -  u drugom dijalogu linije. Kako se ovo može popraviti?

Razlog je verovatno što bi se pokvarila vremena, pa bi ono gore izgledalo

8'
00:00:39,284 - - > 00:00:42,215
Pitam se što bi tata
rekao na sve ovo. - Čudno.

i titl ne bi bio valjan. Valjala bi neka skripta, koja ne bi dirala vremena.

Naslov: Odg: OCR skripta za SW
Autor: petko - 03.08.2014. 12:13:52
Ocr skripta u SW nema uticaja na linije sa tajmingom, nego samo na deo sa prevodom.
Naslov: Odg: OCR skripta za SW
Autor: suadnovic - 03.08.2014. 12:17:42
Fino ako je tako, ali kako da se postigne razmak posle svake - ?
Naslov: Odg: OCR skripta za SW
Autor: aj12345 - 30.09.2014. 11:57:26
Da li ima neka skripta ili podesavanje u SW za Overlapping u kojem je kraj i pocetak isti pa da mi napravi razmak za 005ms da mi kraj bude 49:055 a pocetak 49:060 ili da kraj bude 49:060 a pocetak 49:065.

(http://s5.postimg.org/s5b43jjd3/Overlaping.png)
Naslov: Odg: OCR skripta za SW
Autor: petko - 30.09.2014. 12:08:51
Ovo će ti pomoći: http://www.prijevodi-online.org//Tutorial/upute_pocetnicima/Gap.rar (http://www.prijevodi-online.org//Tutorial/upute_pocetnicima/Gap.rar).
Arhivu raspakuj i skriptu stavi u folder C:\Program Files\Urusoft\Subtitle Workshop\PascalScripts.
Pozivaćeš je iz menija Tools/Pascal Scripts.
Naslov: Odg: OCR skripta za SW
Autor: zzoe - 30.09.2014. 12:11:53
U SW ideš na:
Tools -> Informations and Errors -> Settings
tu možeš da podesiš da ti automatski ispravlja preklapanja. Posle možeš da pustiš da ti popravi u celom fajlu ili samo na obeleženim linijama. Srediće ih ali bez pauze.

Ako koristiš SW6, onda imaš opciju: Edit -> Timings -> Set pause
gde možeš da podesiš koliko hoćeš pauzu između linija.

A ako koristiš SW 2.51, onda kao što ti je petko napisao.
Naslov: Odg: OCR skripta za SW
Autor: GrayGhost PrijevodiOnline - 30.09.2014. 15:02:58
ako koristiš SW 2.51:
otvori gap.pas u notepadu
promeni ovo:
DesiredGap := Round(1 * 1/FPS * 1000); // Desired transition time set to 1 frames.
u ovo:
DesiredGap := Round(1 * 0.12/FPS * 1000); // Desired transition time set to 1 frames.
i imaćeš razliku od 5 ms
Naslov: Odg: OCR skripta za SW
Autor: lemonzoo - 30.09.2014. 15:07:50
Kakvih tvojih 5 ms? Bolje da poveća gap nego da smanjuje. Ne valjda da su vremena tako blizu jer to u nekim plejerima stvara probleme. Kod mene je namješteno na 125 ms.
Naslov: Odg: OCR skripta za SW
Autor: aj12345 - 30.09.2014. 19:55:19
Hvala svima.
Naslov: Odg: OCR skripta za SW
Autor: Vic Mackey - 04.11.2014. 23:01:39
Imam problem sa SW-om, pa bih vas zamolio za malu pomoć.

Elem, godinama sam koristio SW na starom racunaru sa XP-om. Nedavno sam (konačno) clapp prešao na Windows 7. Od drugara sam dobio update programa i trenutna verzija SW-a mi je 2.52.1.67. Primetio sam neke sitne novine (u donjem desnom uglu mi se pored vremena za "početak", "kraj" i "trajanje" pojavila i četvrta opcija "CPS". Ne znam još uvek čemu služi, ali to sada i nije toliko bitno).

Mnogo veći problem je u tome što sam jednostavno "izgubio" slova Č i Đ. I veliko i malo. Naime, u režimu prevođenja, u delu gde kucam ono što sam preveo, uredno otkucam oba navedena slova, ona se pojave, ali gore u titlu koji pravim, kao i u video prikazu izlazi samo C umesto Č (dakle bez kvačice), a u slučaju slova Đ, izlazi mi samo D! U čemu je problem?

Malo sam čačkao po programu, ali nisam uspeo da odgonetnem u čemu je problem. Možda su mi pogrešno podešene one 3 opcije s leve strane po sredini. Trenutno mi je postavljeno: 1) ANSI, 2) East Europe, 3) Default. Ne sećam se kako mi je ranije to bilo podešeno, mada sam probao razne kombinacije, ali bez rezultata. Ako neko zna u čemu je problem, neka mi odgovori.

Hvala unapred.
Naslov: Odg: OCR skripta za SW
Autor: MilanRS - 05.11.2014. 21:04:39
Ili uzmi SW 2.51 ili SW 6.
Treba da bude EastEurope.
Probaj pa javi da li je sve kako treba.
Naslov: Odg: OCR skripta za SW
Autor: Vic Mackey - 06.11.2014. 22:17:44
Problem rešen!

Na kraju sam se dosetio da odem u Control Panel/Region and Language i da sva moguća podešavanja postavim na Serbian (Latin). Posle toga, sve je došlo na svoje mesto. Dakle problem nije ni bio do SW-a, ali u svakom slučaju, hvala na savetima!
Naslov: Odg: OCR skripta za SW
Autor: alfred - 05.02.2016. 18:26:59
Pozdrav
Neki dan sam morao napraviti reinstal Windoza i više ne znam kako namjestiti neke stvari u SW-u.
Naime prije mi je bilo namješteno tako da kad god bi otvorio bilo kakav titl automatski bi popravljao početnu crticu u titlu.
Sad mi to fali a ne znam kako to urediti.Probao sam sa milanovim ocr skriptama 2 i 3 i neće.Hoće jedino ako ručno pustim kugijevu pas skriptu.
SW je namješten onako kako je preporučio King Eric.Da li  treba negdje drugdje nešto upisivati više ne znam jer sam to radio skoro prije nekih 6 god. pa je sve ishlapilo odonda.Svaka pomoć je dobrodošla

Hvala i pozdrav
Naslov: Odg: OCR skripta za SW
Autor: nebojsa66 - 06.02.2016. 00:40:03
Jedino što mi pada na pamet jest da podesiš na alt+I da ti popravlja greške pri učitavanju, ali to popravlja sve greške, samo crtice ne znam kako bi išlo. i kako si namjestio bio da to radi.  ???
Naslov: Odg: OCR skripta za SW
Autor: MilanRS - 06.02.2016. 02:20:32
Alt + I pa u poljima Space before characters i Space after characters izbriši sve.

(http://i.imgur.com/xdP3UDF.jpg)
Naslov: Odg: OCR skripta za SW
Autor: alfred - 06.02.2016. 08:42:04
Je, tako mi je namješteno ali se ništa ne događa.Prije reinstalacije windoza se u SW-u sigurno popravljalo i nešto drugo ne samo crtice ali to se je vidjelo i to čim otvorim titl crtice si nestale.Ništa, probat ću reinstalaciju Sw-a pa ćemo vidjeti.Hvala svejedno
Pozzz

Poslano sa mog Redmi Note 2 koristeći Tapatalk

Naslov: Odg: OCR skripta za SW
Autor: alfred - 06.02.2016. 22:43:43
Napravio reinstal i dalje ne popravlja crticu na početku titla u jednom redu i nepotrebne razmake kako je prije radilo.
To mi je inače bila brzinska provjera i sređivanje titla.
Samo da napomenem da neće ni sa jednom Milanovom skriptom ni 2 niti 3, samo sa Kugijevom pas skriptom u 2 prolaza sa dvije njegove skripte
Čak sam i čekirao u kartici Ugađanja-provjeri i popravi cticu u jednom redu i neće.
Zbilja više ne znam di je kvaka
Naslov: Odg: OCR skripta za SW
Autor: MilanRS - 07.02.2016. 00:02:22
Alt+I
Pod tabovima Check for i Fix
neka bude odabrano
OCR Errors.

(http://i.imgur.com/PHqAyBn.jpg)

Sad se sjetih da ima i to podešavanje koje nikad nisam koristio:

(http://i.imgur.com/3u3l22E.jpg)
Naslov: Odg: OCR skripta za SW
Autor: alfred - 07.02.2016. 07:33:49
Da to je to
Hvala Milane

Poslano sa mog Redmi Note 2 koristeći Tapatalk

Naslov: Odg: OCR skripta za SW
Autor: ameo - 06.08.2016. 22:50:32
<ERROR Find="(Odkad )" ReplaceBy="Otkad ">
<ERROR Find="(Odkako )" ReplaceBy="Otkako ">

Primijetio sam nešto što bi se moglo dodat, odnosno zamijenit sa ovim gore postojećim.
Naime, i u hrvatskom i u srpskom [kolega provjerio], nijedna točna riječ u sebi nema zaredom ovaj skup slova

[odp] i [odk]

te bi bilo dobro uvrstiti zamjene:

odp -> otp
otpisati
odk -> otk
otkopan, potkova...

postoji mnoštvo riječi koje bi se time automatski mogle ispraviti u točne verzije
Naslov: Odg: OCR skripta za SW
Autor: igor_MD - 06.08.2016. 23:15:22

Primijetio sam nešto što bi se moglo dodat, odnosno zamijenit sa ovim gore postojećim.
Naime, i u hrvatskom i u srpskom [kolega provjerio], nijedna točna riječ u sebi nema zaredom ovaj skup slova

[odp] i [odk]

Ispodprosječan post.  ;D

Šalim se.
Ovim bi se možda petljao i u neke toponime, akronime, strane riječi, igre riječi itd. Ja ne bih.
Naslov: Odg: OCR skripta za SW
Autor: ameo - 06.08.2016. 23:24:46
U Leksikon stranih reči i izraza sam zapravo najprije pogledao. I nema ništa slično.

Jedna jedina iznimka je 'jodkalija' (a naravno da sva pravila imaju iznimke) koja je takva rijetkost
u govoru da je zanemarivo, a mislim da bi nam i kemičari oprostili na tome.
Naslov: Odg: OCR skripta za SW
Autor: lemonzoo - 07.08.2016. 00:01:06
Vjerojatno možeš u novi red ubaciti sve te iznimke na koje naletiš za koje će skripta napraviti štetu.

Ispotprosječan  -> Ispodprosječan
jotkalija -> jodkalija
Naslov: Odg: OCR skripta za SW
Autor: ameo - 07.08.2016. 16:25:04
btw. ispotprosječan nije eventualna greška ovoga,  :facepalm da se razumijemo - to se on samo šalio, na račun disleksičara valjda .  :P
Naslov: Odg: OCR skripta za SW
Autor: lemonzoo - 30.08.2016. 22:55:58
Prijedlog za ubacivanje:
nisma -> nisam
Nisma -> Nisam
LA -> L. A. (samo u slučajevima kad ima crticu za padež: LA-a, LA-u, LA-ovom...)
eyj -> ey


Ako je moguće ovo izvesti, djeluje komplicirano.
Kada je riječ od preko tri znaka i prva dva budu veliko slovo, ostala malo.

POzdrav -> Pozdrav
MOžemo -> Možemo
Naslov: Odg: OCR skripta za SW
Autor: lemonzoo - 18.05.2017. 15:40:28
Može li se dodati da se razmak od dva ili više (praznih) polja pretvori u jedno polje? Ljudima nekad to zna ostati u nepažnji.

"  " -> " "
"   " -> " "
Naslov: Odg: OCR skripta za SW
Autor: MilanRS - 18.05.2017. 17:35:02
Imaš to podešavanje u SW-u.
 pravilaf
Naslov: Odg: OCR skripta za SW
Autor: lemonzoo - 18.05.2017. 17:49:19
Kod mene je samo namješteno da prijavljuje greške, nije da briše. Za automatska prepravljanja sam samo podesio OCR-greške, ostalo sve pješke. Tako mi jednostavnije jer dosta tih automatskih samo pravi komplikacije.
Pravi li ovo neku štetu ili samo briše razmake? Da uključim.
Naslov: Odg: OCR skripta za SW
Autor: MilanRS - 18.05.2017. 20:03:51
Samo briše razmake. A u Srbiji na nacionalnim frekvencijama je praksa da se stavi više razmaka kod promjene govornika tako da ako bi se ovo dodalo u skriptu, prekršilo bi se pravilo neremećenja TV standarda iz regiona.

Prvi red, prvi govornik, duga
rečenica. Dobro?     -Da.
Naslov: Odg: OCR skripta za SW
Autor: lemonzoo - 18.05.2017. 20:32:07
Testirao sam, SW briše i razmake ispred interpunkcijskih znakova. A to pravi štetu kad se pišu kalibri, na primjer. Onda ću i dalje pješke, nevermind.
Naslov: Odg: OCR skripta za SW
Autor: ameo - 12.09.2017. 16:13:18
uvrstite li


edjen -
> eđen
u ocr u hrvatskom to pokriva oko 370 riječi.
pr. sredjen - sređen // naredjen - naređen
Naslov: Odg: OCR skripta za SW
Autor: lemonzoo - 12.09.2017. 17:06:32
Dobra ideja. Imam spisak od 646.013 hrvatskih riječi i nigdje mi nije našlo "edjen".
Naslov: Odg: OCR skripta za SW
Autor: ameo - 28.05.2018. 11:17:39
-[/size]>[/color][/size][/font] šč  [preko 300 riječi]

[/size]-[/color]>[/color][/font][/size][size=78%] [/size][/font]šć [preko 1000 riječi]
Naslov: Odg: OCR skripta za SW
Autor: sabko - 09.08.2018. 17:48:00
Šta mislite bi li bio dobar dodatak OCR skripti da kad se ukuca znak koji može biti iznad nekog slova, pa to slovo da promijeni u njega?

Primjera radi:
^a >> â
`A >> À
^e >> ê
:u >> ü (ako naša ASCII tabela ovo podržava, kao i neka druga strana slova)
itd.

Ali mogu i naša slova:
´c >> ć
itd...

Neka od ovih slova se mogu i otkucati bez onog četvoroznamenkastog koda (je li ono bi Alt+kod?) u SW (npr. AltGr+3+^, pa "a" će dati "â"), ali neka ne mogu, pa ne bi bilo zgoreg da ovo bude neki opšti princip, jer zna zatrebati...

Uglavnom, ne bi bilo zgoreg za svako slovo koje bi moglo zatrebati...
Naslov: Odg: OCR skripta za SW
Autor: ameo - 09.12.2018. 21:21:53
pa kad klikneš alt i držiš ga, klikneš prvo znak koji ti treba, pa onda slovo (dok još držiš alt) i pojavi se ono što trebaš.
nema smisla to automatizirat.
Naslov: Odg: OCR skripta za SW
Autor: sabko - 09.12.2018. 22:42:12
Skontao sam u međuvremenu.
Većina može.
Ne moraš držati slovo nakon znaka. Samo dok je znak (AltGr+3, pustiš, pa a i dobiješ â). :)