PDFlib TET - Text Extraction Toolkit
Anwendungsmöglichkeiten von TET
TET wird als Programm-Bibliothek für diverse Entwicklungsumgebungen sowie als Kommandozeilen-Tool für Batch-Prozesse ausgeliefert. Beide Ausführungen bieten den gleichen Funktionsumfang, eignen sich aber für unterschiedliche Einsatzszenarien. Sowohl die TET-Bibliothek als auch das TET-Kommandozeilen-Tool können TETML erzeugen, das XML-basierte Ausgabeformat von TET.
TET unterstützt verschiedene Einsatzvarianten:
Die TET-Software-Bibliothek (Komponente) eignet sich zur...
...Integration in Desktop- oder Server-Anwendungen. Programmierbeispiele für alle unterstützten Sprachbindungen sind im TET-Paket enthalten.
Das TET-Kommandozeilen-Tool eignet sich zur...
...Batch-Verarbeitung von PDF-Dokumenten. Es erfordert keine Programmierung, sondern kann über Kommandozeilen-Optionen gesteuert und damit in komplexe Abläufe integriert werden.
TETML-Ausgabe eignet sich für...
...XML-basierte Workflows und für Entwickler, die mit der Fülle von XML-Werkzeugen und -Sprachen vertraut wie XSLT vertraut sind.
TET-Konnektoren eignen sich zur...
...Integration von TET in verschiedene gängige Software-Pakete wie Datenbanken und Suchmaschinen.
Unterstützte Entwicklungsumgebungen
PDFlib TET läuft überall - auf praktisch allen Computersystemen. Wir bieten 32- und 64-Bit-Pakete an und unterstützen alle gängigen Varianten von Windows, macOS, Linux und Unix sowie IBM System i und IBM Z. TET steht außerdem für die Plattformen mobiler Geräte zur Verfügung, darunter iOS und Android.
Der Kern von TET ist in C und C++ geschrieben und auf Schnelligkeit und geringen Overhead optimiert. Über ein einfaches API (Application Programming Interface) lässt sich die TET-Funktionalität in zahlreichen Programmiersprachen nutzen:
- C und C++
- Java
- .NET und .NET Core
- Objective-C (macOS und iOS)
- Perl
- PHP
- Python
- RPG (IBM i)
- Ruby
Voll funktionsfähige Evaluierungsversionen inklusive Dokumentation und Beispiele können hier herunter geladen werden.