OCR - Die 191 Sprachen der Texterkennung
Aus IT-Services Dipl.-Ing. Andreas Gross
Wir arbeiten mit Intelligenter Charakter Recognition (ICR)-Software, die 191 verschiedene vordefinierte Schriften und Sprachen (Wörterbücher) unterstützt. Eigene Fachwörterbücher können zusätzlich importiert oder aufgebaut werden:
- 37 Hauptsprachen mit Lateinischen, Kyrillischen, Griechischen oder Armenischen Zeichen, die FineReader Engine auch durch Wörterbücher unterstützt: Armenisch (Ostarmenisch, Westarmenisch, Grabar), Bulgarisch, Katalanisch, Kroatisch, Tschechisch, Dänisch, Niederländisch (Niederlande und Belgien), Englisch, Estnisch, Finnisch, Französisch, Deutsch (neue und alte Rechtschreibung), Griechisch, Ungarisch, Italienisch, Indonesisch, Lettisch, Litauisch, Norwegisch (Bokmal und Nynorsk), Polnisch, Portugiesisch (Portugal und Brasilien), Rumänisch, Russisch, Bashkir, Lettisch, Slowakisch, Slowenisch, Schwedisch, Spanisch, Türkisch, Tatarisch, Ukrainisch.
- 4 Ostasiatische Sprachen mit Wörterbuchunterstützung: Chinesisch (Traditionell und Vereinfacht), Japanisch, Koreanisch.
- Thai
- Hebräisch mit Wörterbuchunterstützung
- 5 FineReader XIX Sprachen mit Wörterbüchern, für die Erkennung von alten Europäischen Dokumenten, gedruckt im 17.-19. Jahrhundert: Englisch, Französisch, Deutsch, Italienisch und Spanisch.
- 133 zusätzliche Sprachen mit lateinischen, kyrillischen und griechischen Buchstaben: Abkhaz, Adyghian, Afrikaans, Agul, Albanisch, Altaisch, Awarisch, Aymarä, Aserbaidschanisch (Kyrillisch), Aserbaidschanisch (Latein), Baskisch, Weißrussisch, Bemba, Blackfoot, Bretonisch, Bugotu, Burjat, Cebuano, Chamorro, Chechen, Chukchee, Chuvash, Korsisch, Krim-Tatarisch, Crow, Dakota, Dargwa, Dungan, Eskimo (kyrillisch), Eskimo (Latein), Ewen, Ewenki, Färingisch, Fidschisnisch, Friesisch, Friulisch, Gagauz, Galizisch, Ganda, Deutsch (Luxemburg), Guarani, Hani, Haussa, Hawaiianisch, Iseländisch, Indonesisch, Inguschetisch, Irisch, Jingpo, Kabardinisch, Kalmükisch, Karatschaiisch-Balkarisch, Karakalpak, Kasubisch, Kawa, Kasachisch, Khakass, Khanty, Kikuyu, Kirgisisch, Kongolesisch, Korjak, Kpelle, Kumykisch, Kurdisch, Lak, Latein, Lesgisch, Luba, Mazedonisch, Malagasisch, Malayisch, Malinke, Maltesisch, Mansi, Maori, Mari, Maya, Miao, Minangkabau, Mohawk, Moldawisch, Mongolisch, Mordwinisch, Nahuati, Nenzisch, Nivkh, Nogaisch, Nyanja, Ojibway, Ossetisch, Papiamento, Provenzalisch, Quechua, Räto-romanishc, Romani, Rundi, Russisch (alte Screibweise), Ruandisch, Samisch (Lappish), Samoanisch, Schottisch-Gaelisch, Selkup, Serbisch (kyrillisch), Serbisch (Latein), Shona, Slovenisch, Somali, Sorbisch, Sotho, Sunda, Suahili, Swasiländisch, Tabassaranisch, Tagalog, Tahitianisch, Tajik, Tok Pisin, Tonganisch, Tswana, Tun, Turkmenisch, Tuwinian, Udmurt, Usbekisch (kyrillisch), Usbekisch (Latein), Walisisch, Wolof, Xhosa, Yakut, Zapotekisch, Zulu.
- 4 künstliche Sprachen: Esperanto, Ido, Interlingua, Okzidentalisch.
- 6 Programmiersprachen: Basic, C/C++, COBOL, Fortran, JAVA, Pascal.
- Einfache chemische Formeln.
- Ziffern.
- Tools für die Entwicklung von benutzerdefinierten Sprachen.


