Hromadné zpracování textových a multimediálních dat
Základní informace
Hromadné zpracování dat má v naší firmě dlouholetou tradici. Již v polovině 90tých let jsme se podíleli na převodu kompletních ročníků Lidových novin do fulltextového systému. Tehdy se jednalo o cca 70 milionů článků. Specializujeme se především na hromadné zpracování textových dat (txt, rtf, doc, html, xml ...), přičemž nám v tomto směru velmi pomáhá dobrá znalost programování ve Visual Basicu MS Wordu, ale pochopitelně také Delphi.
Stále populárnější formát PDF umíme zpracovat buď jako vstupní formát (extrakce textů, obrázků ...) nebo i jako výstupní formát - umíme do něj exportovat téměř jakýkoliv soubor nebo formát.
Naší další specializací je "OCR na klíč", kdy zajistíme celé zpracování, počínaje skenováním, přes multijazykové rozpoznání textu, jazykovou kontrolu až po export do požadovaného výstupního formátu.
Dovedeme skombinovat hromadné zpracování s ruční kontrolou a dalšími úpravami (například ořez či barevné korekce). V grafických pracích jsme zpracovávali velké množstí obrázků a fotek, ale i vektorové mapy, do kterých jsme automaticky vkládali přeložené texty.
Pro jeden velmi rozsáhlý projekt vznikla aplikace na řízení nahrávání a dabování, která byla následně doplněna o hromadné převody formátů, výměnu audiostop, konverze videa atd. Aplikace dokonce začalo používat jedno profesionální nahrávací studio.





















