Pokušavao sam uraditi OCR HC titla na engleskom i uobičajenom metodom nije davalo najbolje rezultate. Tj. bilo je previše posla (mogao sam i prekucati).
Zato sam napravio sebi međukorak u Photoshopu. Tj. pripremiti ono što će Abbyy prepoznavati.
Od ovoga:
dobijem ovakvo nešto:
Znači, usput će i isjeći ono bijelo nepotrebno okolo (tj. uglavnom gore)
Podešavanje:
1. - Na particiji C napraviti direktorij OCR
Dakle, trebate imati direktorij C:\\OCR
2. Raspakirati negdje ove akcije
http://www.mediafire.com/file/66594t557e2xtq3/OCR_titl_v1_%2528by_sabko%2529.7z/file3. Otvoriti Photoshop i pronaći paletu s akcijama.
* Obično je desno - ikonica kao za PLAY (trokutić s jednim ćoškom desno).
* Ako je nema onda na meniju odabrati Window i štiklirati Actions. Trebala bi se pojaviti na desnoj strani.
4. Na paleti s akcijama u gornjem desnom ćošku odabrati ikonicu njenog menija (mala strelica prema dolje i 4 vodoravne linije).
Na tom meniju odabrati: Load actions.
Pomoću browse pronaći gdje su akcije raspakirane i odabrati priloženi file OCR titl.atn
Kad ovo jednom uradite ne morate više raditi.
Priprema slika za OCR
1. Odradite vađenje slika pomoću VideoSubFindera
2. Otvorite Photoshop i na meniju odaberete
File/Automate/Batch
* Ukoliko imate slika otprije (od nekog drugog titla) u folderu C:\\OCR pobrišite ih prije ovog koraka, da se ne bi pomiješale s rezultatima.
3. Kad se otvori prozorčić staviti sljedeće postavke:
Set: OCR titl
Action: Priprema titla za OCR ili Priprema tila za OCR 2 (po potrebi)
Source: Folder
Kliknete dugme "Chose" i odaberete folder RGBImages, odnosno folder gdje je VideoSubFinder povadio RGB slike.
Ostale postavke:
Sv ispod ne treba biti štiklirano
Destination: None
4. Stisnete dugme OK i pustite Photoshop da radi.
Ovo bi moglo malo potrajati, ali ako je sve kako treba nemate nikakve interakcije, tj. možete raditi nešto drugo.
5. Slike iz foldera OCR učitate u Abbyy FineReader i dalje radite kao i obično.
Set akcija koji prilažem trenutno ima 2 akcije. Ako se pokaže potreba može ih biti još.
- Prva akcija (Priprema titla za OCR) je malo brža, ali zato može ostaviti dosta nečistoća na mjestima gdje je pozadina videa svjetlija.
- Druga akcija (Priprema titla za OCR 2) je po mom mišljenju bolji izbor i preporučujem da se ona koristi. Ona koliko je moguće počisti pozadinu. Jasno, ne može počistiti sve. Isto moguće da malo iskrza neka slova i da negdje previše istanji kvačice, tačke i slične manje karaktere (ili ih skroz ukine), ali u većini slučajeva koje sam testirao Abbyy FR se dobro snalazi s rezultatom.
Kako god. Probao sam OCR s RGB slikama i sa slikama ovako obrađenim i s ovim sam imao puno manje posla kod OCR-a (nekoliko minuta za titl).
Možete i kombinirati ove 2 metode. Recimo ovako:
- Propustite slike kroz "Priprema za OCR"
- Otvorite folder OCR. Uključite da vam folder prikazuje "Extra large icons" i gdje vidite nečistoće originale tih slika prevučete u PS (Otvorite Photoshop, a onda iz foldera bukvalno prevučete slike iz RGB foldera)
- Pokrenete opet onaj Batch, samo sad stavite da je
Source: Opened Files
Odaberete akciju "Priprema za OCR 2"
ili:
- Otvorite sliku (pomoću PS) iz RGB foldera za koju rezultat bio loš prvom metodom
- Desno na paleti s akcijama odaberete akciju koju želite upotrijebiti i stisnete ispod ikonicu PLAY (opet onaj trokutić)
U oba slučaja nema veze što već postoji slika s istim nazivom. PS će je "prepisati".