Google åpnet API for OCR
Webtjenester / / December 24, 2019
Ja, de fungerer i Google Books sikkert bringe gode resultater, kan vi begynne å høste. Og nå skal jeg fortelle deg hvordan.
Skannede dokumenter ikke alltid kreve en endring i selve teksten. Men noen ganger hun vil ikke få noen avtale igjen, og en elektronisk kopi av noe og ikke. Selvfølgelig kan du bruke noen billige program OCR, kommer med skanneren, eller kjøpe det (ikke stjele deg) Reader. Men gratis desktop OCR-programvaren kjører også fordi nå tekstene er i økende grad blir fotografert, ikke skannet.
For å laste ned noen bilder (jpeg, png, gif) med tekstgjenkjenning for påfølgende Google API og åpnet i Google Dokumenter. Nå kan du laste opp bilder til et dokumentbibliotek, og Google-serveren vil forvandle det til tekst.
Det er også et anvendelseseksempel som illustrerer hvordan den API:
Men du bør programmerere tenke på å lage sitt eget grensesnitt til disse funksjonene. For eksempel - har du skanner bøker i PNG? Dette er en perversjon, er det ikke? Så der har du kortet i hånden - skrive et program som laster teksten side for side, ikke bryter grensene og forbinder hele lasten i en enkelt tekst.
Men husk, det er begrensninger i API, og den viktigste av dem, synes det for meg - noe som er anerkjent bare Latin så snart den. Også hensyn må tas til tegnhøyde er ikke mindre enn 10 piksler, og den totale størrelsen på bildet ikke overstiger 10 mega.