Autor Tema: Ripovanje hardkodiranih titlova  (Posjeta: 15779 )

0 članova i 1 Gost pregledava ovu temu.

Offline sabko

  • Prevoditelj
  • Član
  • ****
  • Postova: 882
  • Spol: Muški
Odg: Ripovanje hardkodiranih titlova
« Odgovor #60 : 04.10.2018. 13:37:11 »
Pokušavao sam uraditi OCR HC titla na engleskom i uobičajenom metodom nije davalo najbolje rezultate. Tj. bilo je previše posla (mogao sam i prekucati).
Zato sam napravio sebi međukorak u Photoshopu. Tj. pripremiti ono što će Abbyy prepoznavati.
Od ovoga:

dobijem ovakvo nešto:

Znači, usput će i isjeći ono bijelo nepotrebno okolo (tj. uglavnom gore)

Podešavanje:

1. - Na particiji C napraviti direktorij OCR
Dakle, trebate imati direktorij C:\\OCR

2. Raspakirati negdje ove akcije
http://www.mediafire.com/file/66594t557e2xtq3/OCR_titl_v1_%2528by_sabko%2529.7z/file

3. Otvoriti Photoshop i pronaći paletu s akcijama.
* Obično je desno - ikonica kao za PLAY (trokutić s jednim ćoškom desno).
* Ako je nema onda na meniju odabrati Window i štiklirati Actions. Trebala bi se pojaviti na desnoj strani.

4. Na paleti s akcijama u gornjem desnom ćošku odabrati ikonicu njenog menija (mala strelica prema dolje i 4 vodoravne linije).
Na tom meniju odabrati: Load actions.
Pomoću browse pronaći gdje su akcije raspakirane i odabrati priloženi file OCR titl.atn

Kad ovo jednom uradite ne morate više raditi.


Priprema slika za OCR

1. Odradite vađenje slika pomoću VideoSubFindera

2. Otvorite Photoshop i na meniju odaberete
File/Automate/Batch
* Ukoliko imate slika otprije (od nekog drugog titla) u folderu C:\\OCR pobrišite ih prije ovog koraka, da se ne bi pomiješale s rezultatima.

3. Kad se otvori prozorčić staviti sljedeće postavke:

Set: OCR titl
Action: Priprema titla za OCR ili Priprema tila za OCR 2 (po potrebi)
Source: Folder
Kliknete dugme "Chose" i odaberete folder RGBImages, odnosno folder gdje je VideoSubFinder povadio RGB slike.
Ostale postavke:
Sv ispod ne treba biti štiklirano
Destination: None


4. Stisnete dugme OK i pustite Photoshop da radi.

Ovo bi moglo malo potrajati, ali ako je sve kako treba nemate nikakve interakcije, tj. možete raditi nešto drugo.

5. Slike iz foldera OCR učitate u Abbyy FineReader i dalje radite kao i obično.

Set akcija koji prilažem trenutno ima 2 akcije. Ako se pokaže potreba može ih biti još.
- Prva akcija (Priprema titla za OCR) je malo brža, ali zato može ostaviti dosta nečistoća na mjestima gdje je pozadina videa svjetlija.
- Druga akcija (Priprema titla za OCR 2) je po mom mišljenju bolji izbor i preporučujem da se ona koristi. Ona koliko je moguće počisti pozadinu. Jasno, ne može počistiti sve. Isto moguće da malo iskrza neka slova i da negdje previše istanji kvačice, tačke i slične manje karaktere (ili ih skroz ukine), ali u većini slučajeva koje sam testirao Abbyy FR se dobro snalazi s rezultatom.

Kako god. Probao sam OCR s RGB slikama i sa slikama ovako obrađenim i s ovim sam imao puno manje posla kod OCR-a (nekoliko minuta za titl).

Možete i kombinirati ove 2 metode. Recimo ovako:
- Propustite slike kroz "Priprema za OCR"
- Otvorite folder OCR. Uključite da vam folder prikazuje "Extra large icons" i gdje vidite nečistoće originale tih slika prevučete u PS (Otvorite Photoshop, a onda iz foldera bukvalno prevučete slike iz RGB foldera)
- Pokrenete opet onaj Batch, samo sad stavite da je
Source: Opened Files
Odaberete akciju "Priprema za OCR 2"

ili:
- Otvorite sliku (pomoću PS) iz RGB foldera za koju rezultat bio loš prvom metodom
- Desno na paleti s akcijama odaberete akciju koju želite upotrijebiti i stisnete ispod ikonicu PLAY (opet onaj trokutić)

U oba slučaja nema veze što već postoji slika s istim nazivom. PS će je "prepisati".
« Zadnja izmjena: 04.10.2018. 13:48:56 sabko »

Offline lemonzoo

  • Uvijek u pravu
  • Prevoditelj extra
  • Izuzetak
  • *****
  • Postova: 21155
  • Spol: Muški
    • let's chat
Odg: Ripovanje hardkodiranih titlova
« Odgovor #61 : 04.10.2018. 14:10:29 »
Ja to radim preko Irfana.
https://www.prijevodi-online.org/smf/index.php/topic,12581.msg336301.html#msg336301

Dobar program za takvo obrađivanje slika je esrXP, on odradi isto kao što si ti dobio u Photoshopu. Samo što je prednost što ne moraš vaditi slike, on direktno radi preko videa. I on sam povadi slike na kraju.

Offline sabko

  • Prevoditelj
  • Član
  • ****
  • Postova: 882
  • Spol: Muški
Odg: Ripovanje hardkodiranih titlova
« Odgovor #62 : 04.10.2018. 14:22:28 »
Ako ti Irfan daje dobre rezultate, imaš i xNView. On je najbolji od takvih programa. Isto ima batch i hrpu naprednih opcija.
Može puštati i video. Nije mi palo na pamet, možda ima i neki plugin za vađenje titlova. Treba provjeriti.

Ovaj esrXP djeluje zanimljivo. Probat ću.
Vjerovatno da kod dosta titlova može.

No, mislim da se s Photoshopom ne može ništa mjeriti. Jer ono što je meni zaokupilo pažnju su slike s jako svijetlom pozadinom. A ovaj titl iz primjera je zalijepljen tako da ima samo sjenu dolje desno, dok gore lijevo nema nikakve ivice. Teško da bih dobio ičim tako dobre rezultate.
Mislim, imam dosta iskustva s obradom slika i jednostavno neke stvari može samo PS.

Offline lemonzoo

  • Uvijek u pravu
  • Prevoditelj extra
  • Izuzetak
  • *****
  • Postova: 21155
  • Spol: Muški
    • let's chat
Odg: Ripovanje hardkodiranih titlova
« Odgovor #63 : 04.10.2018. 14:38:10 »
Objasnit ću ti preko PP-a kako ide esrXP pa testiraj ako ti se bude dalo.

Offline sabko

  • Prevoditelj
  • Član
  • ****
  • Postova: 882
  • Spol: Muški
Odg: Ripovanje hardkodiranih titlova
« Odgovor #64 : 04.10.2018. 14:41:39 »
Ma snaći ću se...  Ne djeluje previše komplicirano na osnovu ovoga što sam vidio...  :)

Kako god, najvažnije je da se ono što bi oduzelo vremena što više automatizira.

Offline sabko

  • Prevoditelj
  • Član
  • ****
  • Postova: 882
  • Spol: Muški
Odg: Ripovanje hardkodiranih titlova
« Odgovor #65 : 04.10.2018. 15:52:47 »
Evo i macro za Word, da ne morate svaki put koristi Find & Replace:

Sub OCRani_titl()
'
' OCRani_titl Macro
'
'
    Application.Browser.Previous
    Selection.HomeKey Unit:=wdStory
    Selection.TypeText Text:="00:00:00,000 --> 00:00:00,000"
    Selection.TypeParagraph
    Selection.Find.ClearFormatting
    Selection.Find.Replacement.ClearFormatting
    With Selection.Find
        .Text = "^m"
        .Replacement.Text = "^p00:00:00,000 --> 00:00:00,000^p"
        .Forward = True
        .Wrap = wdFindContinue
        .Format = False
        .MatchCase = False
        .MatchWholeWord = False
        .MatchWildcards = False
        .MatchSoundsLike = False
        .MatchAllWordForms = False
    End With
    Selection.Find.Execute Replace:=wdReplaceAll
    With Selection.Find
        .Text = "^p^p^p"
        .Replacement.Text = "^p___^p^p"
        .Forward = True
        .Wrap = wdFindContinue
        .Format = False
        .MatchCase = False
        .MatchWholeWord = False
        .MatchWildcards = False
        .MatchSoundsLike = False
        .MatchAllWordForms = False
    End With
    Selection.Find.Execute Replace:=wdReplaceAll
End Sub

Dodaje i tekst na početku i pronalazi i linije bez teksta - Tu stavlja "___".
Ovo zadnje zato što bi neki editori titlova mogli izbrisati prazne linije, pa ne bi odgovaralo spašenom timingu.

Morate omogućiti macroe u wordu, a ovo zalijepite onda u VBA unutar New Macros.
« Zadnja izmjena: 04.10.2018. 22:01:44 sabko »

Tags: