Autor Tema: OCR skripta za SW  (Posjeta: 178832 )

0 članova i 1 Gost pregledava ovu temu.

Offline pejafor3

  • VIP
  • Senior član
  • *****
  • Postova: 1306
  • Spol: Muški
Odg: OCR skripta za SW
« Odgovor #210 : 04.02.2011. 13:43:35 »
Mrzi me da čitam.
Gde je ona skripta koja prepravlja
Ari-jevo u Arijevo
Mark-ovo u Markovo
...
« Zadnja izmjena: 04.02.2011. 13:48:18 pejafor3 »
Shave the Cheerleader, Shave the world!

Offline MilanRS

  • ...
  • Administrator
  • Izuzetak
  • *****
  • Postova: 10706
  • Spol: Muški
Odg: OCR skripta za SW
« Odgovor #211 : 04.02.2011. 21:41:18 »
Mrzi me da čitam.
Mene mrzi da pišem. :P

Ali, ipak evo.

Gde je ona skripta koja prepravlja
Ari-jevo u Arijevo
Mark-ovo u Markovo
...

Link do posta na 10. strani

Offline pejafor3

  • VIP
  • Senior član
  • *****
  • Postova: 1306
  • Spol: Muški
Odg: OCR skripta za SW
« Odgovor #212 : 05.02.2011. 12:46:19 »
Mrzi me da čitam.
Mene mrzi da pišem. :P

Ali, ipak evo.

Gde je ona skripta koja prepravlja
Ari-jevo u Arijevo
Mark-ovo u Markovo
...

Link do posta na 10. strani

Milane, ne vidim više dobro, a i starim, dok ja pronađem ovde poruku, dotle serem na drugoj strani, pa se onda sav pogubim.... ne znam više šta sam srao i šta sam tražio!  rofl

Hvala...  clapp
« Zadnja izmjena: 05.02.2011. 12:47:55 pejafor3 »
Shave the Cheerleader, Shave the world!

Offline ExtraJa

  • Prevoditelj početnik
  • Regularni forumaš
  • ***
  • Postova: 67
  • Spol: Muški
Odg: OCR skripta za SW
« Odgovor #213 : 09.02.2011. 15:03:55 »
Možete li meni reći kako ovu skriptu da aktiviram, tj. da je učinim dostupnom u SW-u. Lijepo je skinem ubacim u OCRScripts u SW instalacionom direktoriju ali kad pokrenem program tamo mi nije dostupna već imam samo MilanRS2 i onu defaultnu a ove nigdje kao da je nisam ni dodao?

Offline petko

  • Shpadoinkle!
  • Administrator
  • Izuzetak
  • *****
  • Postova: 5318
  • Spol: Muški
  • Ako kaniš pobijediti, ne smiješ izgubiti.
Odg: OCR skripta za SW
« Odgovor #214 : 09.02.2011. 15:10:03 »
Zavisi na koju skriptu misliš.
Neke idu u OCRScripts a neke u PascalScripts.
Ove druge dostupne su preko menija Tools/Pascal Scripts.

:)




I refuse to prove that I exist, says God…
…for proof denies faith, and without faith I am nothing.
Douglas Adams
       

Offline ExtraJa

  • Prevoditelj početnik
  • Regularni forumaš
  • ***
  • Postova: 67
  • Spol: Muški
Odg: OCR skripta za SW
« Odgovor #215 : 09.02.2011. 15:17:16 »
Mislio sam na ovu o kojoj su razgovarali u porukama iznad, koja briše crticu iz npr. Mark-ovo.
A sad gdje ide ne bi znao ja sam mislio da je to ocr ali kako nisam stručan moguće je da griješim?  :-[

Offline MilanRS

  • ...
  • Administrator
  • Izuzetak
  • *****
  • Postova: 10706
  • Spol: Muški
Odg: OCR skripta za SW
« Odgovor #216 : 09.02.2011. 15:20:47 »
Ako u folderu OCR Scripts imaš sve tri, biće i u SW meniju lijevo.
Probaj isključiti SW i uključiti.

Offline ExtraJa

  • Prevoditelj početnik
  • Regularni forumaš
  • ***
  • Postova: 67
  • Spol: Muški
Odg: OCR skripta za SW
« Odgovor #217 : 09.02.2011. 15:34:09 »
Ne znam šta mu je bilo tek nakon nekih 10-tak gašenja i pokretanja prepoznao je ovu skriptu!
Ostaje još samo da je isprobam i sve će biti za 10., nego da sad ne bude da sam bezveze pisao da pitam ima li gdje ovdje objašnjenje za rad sa ovim pascal skriptama (naravno ako je za takvo nešto uputstvo uopšte potrebno, te da li su one potrebne za rad prosječog korisnika SW-a - kao što sam ja)?  :)

Offline MilanRS

  • ...
  • Administrator
  • Izuzetak
  • *****
  • Postova: 10706
  • Spol: Muški
Odg: OCR skripta za SW
« Odgovor #218 : 02.04.2011. 18:17:26 »
Poslije 9 mjeseci postavljena osvježena verzija MilanRS2 skripte.
Otkrivene greške su ispravljene, nešto novo dodato.

Ako primijetite da skripta nešto radi pogrešno ili ne radi nešto što bi bilo dobro da radi,
molio bih da mi javite ili ovdje ili na privatnu poruku.

Offline daxdavor

  • Ubojica sa šerajzlinom
  • PO moderator
  • Izuzetak
  • *****
  • Postova: 5746
  • Spol: Muški
  • Ni med cvetjem ni pravice
  • Google map koordinata: Moja lokacija
Odg: OCR skripta za SW
« Odgovor #219 : 02.04.2011. 19:43:50 »
Imam jednu malu zamjerku na tvoje titlove. Ona mi baš jako upada u oči.

68
00:04:02,534 --> 00:04:05,131
Hitna skrb je pametan potez. -Većina
naših hitnih slučajeva su...

69
00:04:05,166 --> 00:04:08,458
...sitne stvari. Iščašeni zglobovi, bol u
grlu, potres mozga... -To mi odgovara.

Tri točke na kraju 68. i početku 69. linije nisu potrebne. One se nikad ne stavljaju kod prelaska jedne rečenice u dvije linije.
To je ružno i glupo. Gledatelj nije idiot kojemu se trebaju ovakve stvari "crtati". Ovako to treba izgledati:

68
00:04:02,534 --> 00:04:05,131
Hitna skrb je pametan potez. -Većina
naših hitnih slučajeva su

69
00:04:05,166 --> 00:04:08,458
sitne stvari. Iščašeni zglobovi, bol u
grlu, potres mozga... -To mi odgovara.

Milane, jel bi se mogla napraviti skripta da briše te tri točke na početku i kraju svake linije?

The snooty, snotty, toity, hoity, farty, arty, decaffeinated, fruit-flavored tea-bag, semi-skimmed cream of Gasforth elite.

Offline nebojsa66

  • Šone Šeset Šes
  • PO moderator
  • Heroj član
  • *****
  • Postova: 2718
  • Spol: Muški
  • Kormilo na mjesečini
Odg: OCR skripta za SW
« Odgovor #220 : 02.04.2011. 19:48:30 »
Pa to mislim da ima opcija u SW-u.

Btw, hvala Milane puno na skripti, legendarna je!  clapp

Nisam lud, majka me testirala!

Offline MilanRS

  • ...
  • Administrator
  • Izuzetak
  • *****
  • Postova: 10706
  • Spol: Muški
Odg: OCR skripta za SW
« Odgovor #221 : 02.04.2011. 19:54:05 »
Evo da uklanja tri tačke sa početka i tri tačke sa kraja linije.
Ali, pazi, može se javiti greška u slučaju kad završava rečenica s "..."
pa će onda ostati nezavršena rečenica.

1
Niste se predstavili...

2
Zovem se Mark.

->

1
Niste se predstavili

2
Zovem se Mark.

Zato se preporučuje koristiti je samo preko F12, F11, F12, F11...

Offline daxdavor

  • Ubojica sa šerajzlinom
  • PO moderator
  • Izuzetak
  • *****
  • Postova: 5746
  • Spol: Muški
  • Ni med cvetjem ni pravice
  • Google map koordinata: Moja lokacija
Odg: OCR skripta za SW
« Odgovor #222 : 02.04.2011. 19:59:44 »
Hvala, ispobat ću ju definitivno. clapp

The snooty, snotty, toity, hoity, farty, arty, decaffeinated, fruit-flavored tea-bag, semi-skimmed cream of Gasforth elite.

Offline pejafor3

  • VIP
  • Senior član
  • *****
  • Postova: 1306
  • Spol: Muški
Odg: OCR skripta za SW
« Odgovor #223 : 04.04.2011. 12:40:19 »
A da li može da se napravi jedna skripta koja će dodavati/zatvarati Italic liniju sa </i>

Primer:
<i> Ovo je primer linije koja treba da se zatvori.

Znači, ako skripta nađe <i> ispred linije, treba da doda </i> ukoliko ga nema.

Primer:
<i> Ovo je primer linije koja treba da se zatvori.</i>

Meni lično nije problem što nema </i> kada je cela linija u pitanju jer ne gledam na kućnim plejerima, ali vidim da većina plejera muči muku sa tim.

I poruka se sjebala  rofl



« Zadnja izmjena: 04.04.2011. 17:50:09 MilanRS »
Shave the Cheerleader, Shave the world!

Offline MilanRS

  • ...
  • Administrator
  • Izuzetak
  • *****
  • Postova: 10706
  • Spol: Muški
Odg: OCR skripta za SW
« Odgovor #224 : 04.04.2011. 17:52:15 »
Popravio sam ti poruku. ;D

Što se tiče mene i RegExa, ne može.
Više puta sam pokušavao da u Replace dio ubacim tag, ali bezuspješno.

Jedina nada ostaje pascal i neko ko je dobar sa pascalom. :)

Offline MilanRS

  • ...
  • Administrator
  • Izuzetak
  • *****
  • Postova: 10706
  • Spol: Muški
Odg: OCR skripta za SW
« Odgovor #225 : 16.04.2011. 18:28:43 »
Skripta ne briše crticu ako je na početku drugog reda italic tag.

Duše ljudi žive i nakon smrti.
<i>- Gledali ste...</i>

Da biste i to omogućili, poslije 232. linije u skripti,
ispod ova dva reda:
<!-- Brisanje razmaka iza crte - na početku 2. reda -->
<ERROR Find="[\n](- )[0-9A-ZŠĆŽČĐ\x22\x3C]" ReplaceBy="-">
dodajte još:
<ERROR Find="[\n][\x3C][i|b|u][\x3E](- )[0-9A-ZŠĆŽČĐ\x22\x3C]" ReplaceBy="-">

To će biti u osvježenoj verziji ali ne uskoro jer nema drugih dodataka ili korekcija.

Offline annorax

  • Valar morghulis, valar dohaeris.
  • Prevoditelj extra
  • Senior član
  • *****
  • Postova: 1135
  • Spol: Muški
  • Bifrost cross may those who die...
Odg: OCR skripta za SW
« Odgovor #226 : 20.04.2011. 18:29:09 »
Zamolio bih za malu pomoć.
Skinuo sam sa sajta onu paskalovu skriptu koja pravi razmak od 125 ms između linija (ako on već ne postoji), ali King Eric mi je savjetovao da stavim razmak od 200 ms. Gdje i kako se to podešava? Kad idem na Tools -> Pascal Scripts -> Gap125 ne nude mi se nikakve opcije, skripta se samo automatski izvrši.
Hvala unaprijed.  :)
She is watching from on high,
she knows who lives or dies,
she will take me to the sky...

Vorfelan Rhinata Morie

Offline King Eric

  • Old staff
  • Izuzetak
  • *****
  • Postova: 5537
  • Spol: Muški
Odg: OCR skripta za SW
« Odgovor #227 : 20.04.2011. 18:34:05 »
Odi u C:\Program Files\Urusoft\Subtitle Workshop\PascalScripts, pronađi skriptu, otvori je u Notepadu, i promijeni broj tri u pet u liniji teksta:
DesiredGap := Round(3 * 1/FPS * 1000); // Desired transition time set to 3 frames.

Ovako treba izgledati:
DesiredGap := Round(5 * 1/FPS * 1000); // Desired transition time set to 5 frames.



Offline danielko

  • Novi član
  • *
  • Postova: 4
Odg: OCR skripta za SW
« Odgovor #228 : 28.04.2011. 10:07:40 »
Zdravo, svima.

A, sta je sa podignuti titlom?
Kako je to moguce realizirati, jer staviti samo 2-3 "entera" u titl, na reload subtitle, SW to obrise,
a vrlo je bitno da kad ima neki "priljepen" tekst u video, da ovozmozimo gledaoci da to procitu,
a da  se pritome tekst ne mesa.

Hvala i pozdrav iz Makedonije

Offline pejafor3

  • VIP
  • Senior član
  • *****
  • Postova: 1306
  • Spol: Muški
Odg: OCR skripta za SW
« Odgovor #229 : 28.04.2011. 10:49:55 »
Zdravo, svima.

A, sta je sa podignuti titlom?
Kako je to moguce realizirati, jer staviti samo 2-3 "entera" u titl, na reload subtitle, SW to obrise,
a vrlo je bitno da kad ima neki "priljepen" tekst u video, da ovozmozimo gledaoci da to procitu,
a da  se pritome tekst ne mesa.

Hvala i pozdrav iz Makedonije

SW nije nije predviđen za te stvari ali...
Treba ti ALT kôd za ENTER.
(http://usefulshortcuts.com/alt-codes/)
Možeš da probaš da stavljaš "space" ali ne sa tastature nego sa kodom ALT+0160
Tada dobijaš razmak, a SW ne vidi to kao razmak nego kao karakter i onda ti neće obrisati.
Shave the Cheerleader, Shave the world!

Offline danielko

  • Novi član
  • *
  • Postova: 4
Odg: OCR skripta za SW
« Odgovor #230 : 28.04.2011. 11:03:45 »
Zdravo, svima.

A, sta je sa podignuti titlom?
Kako je to moguce realizirati, jer staviti samo 2-3 "entera" u titl, na reload subtitle, SW to obrise,
a vrlo je bitno da kad ima neki "priljepen" tekst u video, da ovozmozimo gledaoci da to procitu,
a da  se pritome tekst ne mesa.

Hvala i pozdrav iz Makedonije

SW nije nije predviđen za te stvari ali...
Treba ti ALT kôd za ENTER.
(http://usefulshortcuts.com/alt-codes/)
Možeš da probaš da stavljaš "space" ali ne sa tastature nego sa kodom ALT+0160
Tada dobijaš razmak, a SW ne vidi to kao razmak nego kao karakter i onda ti neće obrisati.


Hvala puno, care :)

Offline japa

  • Novi član
  • *
  • Postova: 16
Odg: OCR skripta za SW
« Odgovor #231 : 06.05.2011. 00:22:26 »
Super skripta. Mislim da bi trebalo bit obavezno korištenje ove skripte ako se prijevod radi u SW (a boljeg programa nema).  :)

P.S.
Žao mi je što ju nisam koristio prije nego sam stavio svoj prvi prijevod. Mislim da ću uploadat novu verziju kad prođe ovu skriptu.  ;D

Offline prijatel-MKD

  • Mlađi član
  • **
  • Postova: 291
  • Spol: Muški
Odg: Osnovne upute i savjeti za izradu titlova
« Odgovor #232 : 10.05.2011. 00:16:44 »
 
Citat:  © prijatel-MKD from mk.titlovi.com
Nekoliko korisnih i cesto potrebne Paskal skripte u SW 2.51

1 - Insert subtitle (only in translation)
Omogucava da se doda novi prazni titl samo u prevodnom delu. Novi dodani titl ce biti dodan odmah nakon selektovanog titla u listu, pri tome sadrzaj i tekst kojeg imate u vec postojecih titlova od selektovanog nadole bice pomereni za jedan titl nadole u listu bez bilo kakve promjene u vremenskom rasporedu za prikaz titlova.

2-Copies original text into translation (selected lines only)
Omogucuje vam da kopirate sadrzaj i tekst selektiranih titlova u osnovnu listu (jedan ili vise titlova odjednom) iz originalnog u prevodnom delu. Pri ovome, ukoliko selektirane titlove u prevodnom delu sadrzi bilo sta, taj ce sadrzaj biti automatski obrisan i zamjenjen sadrzajem koji ima titl iz originalnog dela.

3-Join subtitles (only from translation)
Spajanje dva posledovatelnih titlova, pri cemu se spajanje izvrsava samo u prevodnom delu.
Sadrzaj titlova kojih se nalaze ispod selektiranih titlova u listu bice pomeren za jedan titl prema gore.
Ukoliko selektirate vise od dva posledovatelna titlova (Primer za tri selektirana titlova), dobicete po malo neocekivani rezultat, tj. dvojno/duplo spajanje na 1+2 i 2+3. Zbog ovoga, ukoliko zelite spojiti tri posledovatelna titlova samo u prevodnom delu, to spajanje trebate izvrsiti u dva koraka spajanjem po dva titlova 1+2 i (1+2)+3 i tako dobiti jedan sacinjen od sva tri titlova.

4-Delete subtitle (only from translation)
Brisanje jednog selektiranog titla samo u prevodnom delu.
Ukoliko imate seletiranih veci broj titlova u osnovnu listu, samo prvi od njih ce biti obrisan.
Pri ovom se brise i sadrzaj obrisanog titla u prevodnom delu, ako zelite sacuvati/zadrzati sadrzaj trebate upotrebiti skriptu za spajanje titlova.
Sadrzaj titlova nakon obrisanog titla bice pomeren za jedan titl prema gore bez bilo kakve promjene u vremenskom rasporedu za prikaz titlova.

5-Remuve First Dash
Obrisati crtu "Tire" tamo gde je ima i na pocetku ispred teksta u prvom tekstualnom redu. Brisu se sve prve crtice (-) u svih titlova odjednom.
U one titlove gde ima crticu kao znak za drugi, treci, itd. sugovornik, te se crtice ne brisu, brise samo prvu crticu ukoliko je ima na pocetku titla za prvog sugovornika.

6-Add Dotted Line
Dadati jednu jedinu tacku (.) u svih titlova odjednom, u celom u celom filmskom prevodu (titl fajl).
Jer pri snimanju titl-fajlova i titl projekat u SW nepovratno se gube sve prazne titlove koji sto nemaju ikakav sadrzaj u njima, ovo je vrlo korisna skripta pri izradu novog titl-fajla (novi filmski prevod) od belog lista.
Kad u SW dodate novi titl preko taster "Insert", taj novi titl nema sadrzaj u njemu i bice izgubljen ako se fajl snimi kao takav s praznim titlovima.
Titleri koji ujednom i prevode najcesce odmah upisuju i prevod, ali ako vi trebate samo sastaviti vremensku skriptu za prikaz titlova za neki drugi jezik i necete vi prevoditi, a morate dodati bilo kakav sadrzaj u svaki titl kako ih nebi izgubili pri snimanju, ovo je jedna vrlo korisna skripta koja vam moze ustediti puno vremena.


- Da bi moglu upotrebiti Paskal skripte, trebate ih kopirati/smjestiti u programskom folderu SW-a s pocetno postavljeni instalacioni put/folder:
C:\Program Files\URUSoft\Subtitle Workshop\PascalScripts

Ukoliko ste vi sami promjenili osnovni put za instalaciju SW-a i instalirali ste ga na drugu lokaciju ili drugu particiju, soodvetno se menja i gore pomenuti put/folder.

Izvrsavanje komande s Paskal skriptima vrsi se preko meni "Tools / Pascal Scripts / ...."


U meni listu se automatki podredzuju po azbucnom/abecednom redom pri cemu brojeve imaju prednost i soodvetno dobijaju kratenice/precice: Sift+Ctrl+1 za prvu skriptu; Sift+Ctrl+2 za drugu skriptu; itd.

Paskal skripte RAR arhiva  ShotGun5

I na kraju ovo najbitnije.
Jer se Paskal skripte uglavnom odnose na prevodni deo, ukoliko vam je potrebno da izvresite promjene u originalnom delu sve sto trebate je da privremeno zamjenite pozicije originalnog i prevodnog dela uz tastere Shift+Ctrl+W.
« Zadnja izmjena: 10.05.2011. 00:24:40 prijatel-MKD »
0123456789 - Само десет цифри, а толку многу главоболие!!!
© prijatel-MKD

Offline daxdavor

  • Ubojica sa šerajzlinom
  • PO moderator
  • Izuzetak
  • *****
  • Postova: 5746
  • Spol: Muški
  • Ni med cvetjem ni pravice
  • Google map koordinata: Moja lokacija
Odg: OCR skripta za SW
« Odgovor #233 : 29.09.2011. 16:00:52 »
Kod tipkanja često mi se dogodi da uz prvo slovo u rečenici i drugo lupim velikim slovom.
Npr. KAko si? -DObro
Je l' bi se mogla napraviti skripta koja bi detektirala to? :)

The snooty, snotty, toity, hoity, farty, arty, decaffeinated, fruit-flavored tea-bag, semi-skimmed cream of Gasforth elite.

Offline MilanRS

  • ...
  • Administrator
  • Izuzetak
  • *****
  • Postova: 10706
  • Spol: Muški
Odg: OCR skripta za SW
« Odgovor #234 : 21.12.2011. 13:16:05 »
Za one koji ne vole u titlu kad neispravno piše glagol na -ti ispred: ću, ćeš, će, ćemo, ćete, će,
 evo jedna skripta. Isprobao sam je, za razliku od ranijih pokušaja, ova ne pravi lažno pozitivne alarme.
 Isprobajte i vi, ako se slučajno desi da nešto pogrešno ispravlja, javite.
 Inače, poslije ću je ugraditi u standardnu OCR skriptu MilanRS2.ocr.
 
 
Potpredsjednik, čovek najodgovorniji
 za taj napad, htjeti će te iskoristiti.
     Potpredsjednik, čovek najodgovorniji
 za taj napad, htjet će te iskoristiti.

Izgledati će još gore ako mu raznesu
 helikopter dok je u njemu. Reci mu to.
     Izgledat će još gore ako mu raznesu
 helikopter dok je u njemu. Reci mu to.

Želim prisustvovati. Dozvoliti će mi.     Želim prisustvovati. Dozvolit će mi.


 Edit: Pošto ovo može od ispravnog napraviti pogrešno, mora se koristiti kao posebna skripta pa sa F9 i F12/F11 kretati se od greške do greške i vidjeti da li treba ispraviti ili ostaviti.
« Zadnja izmjena: 16.02.2012. 15:35:15 MilanRS »

Offline igor_MD

  • Prevoditelj extra
  • Mlađi član
  • *****
  • Postova: 376
  • Spol: Muški
Odg: OCR skripta za SW
« Odgovor #235 : 21.12.2011. 21:55:24 »
Hvala, milane. moglo bi dobro doći, ali ja ne znam šta s ovime  :-[

Offline Commandoguru

  • Prevoditelj
  • Senior član
  • ****
  • Postova: 1112
  • Spol: Muški
  • Smotani
Odg: OCR skripta za SW
« Odgovor #236 : 21.12.2011. 22:23:42 »
Snimi attachment kao rar file, otpakiraj, i stavi otpakirano među OCRskripte na hard disku u instalaciji SW-a.
A guy with a BIG fuckin gun is not more dangerous than a guy with a club... It's only a matter of range and reach... :D

Offline Strider

  • Regularni forumaš
  • *
  • Postova: 50
  • Spol: Muški
    • Few little things...
Odg: OCR skripta za SW
« Odgovor #237 : 23.12.2011. 20:56:18 »
Za one koji ne vole u titlu kad neispravno piše glagol na -ti ispred: ću, ćeš, će, ćemo, ćete, će,
 evo jedna skripta. Isprobao sam je, za razliku od ranijih pokušaja, ova ne pravi lažno pozitivne alarme.
 Isprobajte i vi, ako se slučajno desi da nešto pogrešno ispravlja, javite.
 Inače, poslije ću je ugraditi u standardnu OCR skriptu MilanRS2.ocr.
 
 
Potpredsjednik, čovek najodgovorniji
 za taj napad, htjeti će te iskoristiti.
     Potpredsjednik, čovek najodgovorniji
 za taj napad, htjet će te iskoristiti.

Izgledati će još gore ako mu raznesu
 helikopter dok je u njemu. Reci mu to.
     Izgledat će još gore ako mu raznesu
 helikopter dok je u njemu. Reci mu to.

Želim prisustvovati. Dozvoliti će mi.     Želim prisustvovati. Dozvolit će mi.
Druže Milane, što je s ovim riječima koje slijede?!
1) Riječi s četiri slova koja završavaju na "ati" su izuzeci i ne mijenjanju se!!! (ćati, dati, lati, mati, rati, sati, tati, vati)
2) Riječi s četiri slova koja završavaju na "eti" su izuzeci i ne mijenjanju se!!! (četi, meti, peti, teti)
3) Izuzeci s četiri slova koji se mijenjaju (žeti, biti, liti, miti, piti, riti, šiti, viti) !
4) Izuzeci koji se ne mijenjaju:
 Ostaje "niti ću (ćeš, će, ćemo, ćete)"
 Ostaje "naniti će" (SF serije: naniti ili nanoboti)


Nažalost, nije to baš toliko jednostavno da bi uspilo u samo jednom retku.  :(

U mojoj staroj skripti sam to odavno pokušao (i donekle dobro napravio, s par izuzetaka  :-[)
<!-- Zamijeni sve riječi s 5 i više slova "**(a)(e)(i)ti ću" s "**(a)(e)(i)t ću" i "**(a)(e)(i)ti će*" s "**(a)(e)(i)t će*" -->
<!-- Riječi s četiri slova koja završavaju na "ati" su izuzeci i ne mijenjanju se!!! (ćati, dati, lati, mati, rati, sati, tati, vati) -->
<!-- Riječi s četiri slova koja završavaju na "eti" su izuzeci i ne mijenjanju se!!! (četi, meti, peti, teti) -->
<ERROR Find="[A-Za-zćčđšž][a-zćčđšž][a|e|i](ti )ć[eu]" ReplaceBy="t ">
<ERROR Find="[A-Za-zćčđšž][a-zćčđšž][a|e|i](ti)\r?\nć[eu]" ReplaceBy="t">
<!-- Izuzeci s četiri slova koji se mijenjaju (žeti, biti, liti, miti, piti, riti, šiti, viti) ! -->
<ERROR Find="\b[ž|Ž](eti )ć[eu]" ReplaceBy="et ">
<ERROR Find="\b[ž|Ž](eti)\r?\nć[eu]" ReplaceBy="et">
<ERROR Find="\b[b|B|l|L|m|M|p|P|r|R|š|Š|v|V](iti )ć[eu]" ReplaceBy="it ">
<ERROR Find="\b[b|B|l|L|m|M|p|P|r|R|š|Š|v|V](iti)\r?\nć[eu]" ReplaceBy="it">

<!-- Izuzeci koji se ne mijenjaju: -->
<!-- Ostaje "niti ću (ćeš, će, ćemo, ćete)" -->
<ERROR Find="(?i)\bni(t )ć[eu]" ReplaceBy="ti ">
<ERROR Find="(?i)\bni(t)\r?\nć[eu]" ReplaceBy="ti">
<!-- Ostaje "naniti će" (SF serije: naniti ili nanoboti) -->
<ERROR Find="(nanit )će\b" ReplaceBy="naniti ">
<ERROR Find="(nanit)\r?\nće\b" ReplaceBy="naniti">

<!-- Izuzeci koji se ne mijenjaju, dodaje se "t": -->
<!-- Mijenja se "pati ću (ćeš, će, ćemo, ćete)" u "patit ću (ćeš, će, ćemo, ćete)" -->
<ERROR Find="(?i)\b(pati )ć[eu]" ReplaceBy="patit ">
<ERROR Find="(?i)\b(pati)\r?\nć[eu]" ReplaceBy="patit">
<!-- Mijenja se "jati ću (ćeš, će, ćemo, ćete)" u "jatit ću (ćeš, će, ćemo, ćete)" -->
<ERROR Find="(?i)\b(jati )ć[eu]" ReplaceBy="jatit ">
<ERROR Find="(?i)\b(jati)\r?\nć[eu]" ReplaceBy="jatit">
<!-- Mijenja se "leti ću (ćeš, će, ćemo, ćete)" u "letjet ću (ćeš, će, ćemo, ćete)" -->
<ERROR Find="(?i)\b(leti )ć[eu]" ReplaceBy="letjet ">
<ERROR Find="(?i)\b(leti)\r?\nć[eu]" ReplaceBy="letjet">
<!-- Mijenja se "hiti ću (ćeš, će, ćemo, ćete)" u "hitit ću (ćeš, će, ćemo, ćete)" -->
<ERROR Find="(?i)\b(hiti )ć[eu]" ReplaceBy="hitit ">
<ERROR Find="(?i)\b(hiti)\r?\nć[eu]" ReplaceBy="hitit">
<!-- Mijenja se "kiti ću (ćeš, će, ćemo, ćete)" u "kitit ću (ćeš, će, ćemo, ćete)" -->
<ERROR Find="(?i)\b(kiti )ć[eu]" ReplaceBy="kitit ">
<ERROR Find="(?i)\b(kiti)\r?\nć[eu]" ReplaceBy="kitit">

Offline MilanRS

  • ...
  • Administrator
  • Izuzetak
  • *****
  • Postova: 10706
  • Spol: Muški
Odg: OCR skripta za SW
« Odgovor #238 : 23.12.2011. 21:16:07 »
Slabije se razumijem u tu problematiku jer u srpskom ide spojeno i bez t, ali zapada mi za oko kad pročitam "Pobijediti ćemo" pa sam zato pokušao ovo da napravim.
Već mi je Igor javio za probleme sa npr. "Dijamanti će ostati" i sličnim slučajevima.

Napravio sam da pronalazi samo slučajeve ću/ćeš/će/ćemo/ćete/će, ne i kada su oni početak riječi, npr. ćurka pa sam mislio da je time riješen problem. Pošto nije, ovo neće moći biti sastavni dio skripte milanrs2.ocr.

milanrs2.ocr ne smije pri F9 i F10 ništa pokvariti, a treba ispraviti što više pogrešnog.
Pošto ovo može od ispravnog napraviti pogrešno, mora se koristiti kao posebna skripta pa sa F9 i F12/F11 kretati se od greške do greške i vidjeti da li treba ispraviti ili ostaviti.

Srećom, nisu toliko česte greške oko toga kod prevodilaca pa samo pojedine titlove treba provjeravati i ovom skriptom.

Offline Strider

  • Regularni forumaš
  • *
  • Postova: 50
  • Spol: Muški
    • Few little things...
Odg: OCR skripta za SW
« Odgovor #239 : 24.12.2011. 17:21:59 »
Baci oko na onaj kod koji sam stavio u postu prije, a imaš i cilu skriptu na drugoj stranici ovog topika (Odgovor #24 - napravio sam update maloprije). Slobodno iskoristi za svoju skriptu bilo što, ukoliko ti se učini zanimljivim. Svima nam je u interesu imati što ispravnije titlove.  ;)

Ovaj dio kod mene prilično dobro ispravlja inverziju pomoćnog glagola i infinitiva. Pošto se nađe opisnih pridjeva onda bi nakon primjenjene one skripte (F10), trebalo naknadno proć titl postepeno sa sljedećom skriptom (F9/F12/F11):
<!----------------------------------------------->
<!--     Subtitle Workshop OCR Script file     -->
<!--       Copyright © 2001-2004 URUSoft       -->
<!--           http://www.urusoft.net          -->
<!----------------------------------------------->

<SWOCR WordChars="0123456789abcdefghijklmnopqrstuvwxyzABCDEFGHIJKLMNOPQRSTUVWXYZ_ńŃáéíóúÁÉÍÓÚäëďöü">


<!-- Zamijeni sve riječi s "**(u)(s)ti ću" s "**(u)(s)t ću" i "**(u)(s)ti će*" s "**(u)(s)t će*" -->
<!-- ubačeno radi opisnih pridjeva, dok se glagoli i dalje mijenjaju!!! -->
<ERROR Find="[A-Za-z][u|s](ti )ć[eu]" ReplaceBy="t ">
<ERROR Find="[A-Za-z][u|s](ti)\r?\nć[eu]" ReplaceBy="t">

<ERROR Find="[A-Za-z](\x22)[A-Za-z]" ReplaceBy=" "">
</SWOCR>
« Zadnja izmjena: 24.12.2011. 17:23:35 Strider »