PDFlib TET – Text Extraction Toolkit


Einsatz von TET

TET wird als Software-Bibliothek für diverse Entwicklungsumgebungen sowie als Kommandozeilen-Tool für Batch-Prozesse ausgeliefert. Beide Ausführungen bieten den gleichen Funktionsumfang, eignen sich aber für unterschiedliche Einsatzszenarien. Sowohl die TET-Bibliothek als auch das TET-Kommandozeilen-Tool können TETML erzeugen, das XML-basierte Ausgabeformat von TET.
TET unterstützt verschiedene Einsatzvarianten:

Die TET-Software-Bibliothek (Komponente) eignet sich zur...

Inte­gration in Desktop- oder Server-Anwendungen. Programmierbeispiele für alle unterstützten Sprachbindungen sind im TET-Paket enthalten.

Das TET-Kommandozeilen-Tool eignet sich zur...

Batch-Verarbeitung von PDF-Dokumenten. Es erfordert keine Programmierung, sondern kann über leistungsfähige Kommandozeilen-Optionen gesteuert und damit in komplexe Abläufe integriert werden.

Die TETML-Ausgabe passt in...

XML-basierte Workflows und zu Entwicklern, die mit der Fülle von XML-Werkzeugen und -Sprachen vertraut sind, beispielsweise XSLT.

TET- Konnektoren eignen sich...

dazu, TET in verschiedene gebräuchliche Softwarepakete wie Datenbanken und Suchmaschinen zu integrieren.

 


Die TET-Produktfamilie

Die TET-Produktfamilie beinhaltet die folgenden Produkte:

Das Kernprodukt TET.

TET PDF IFilter ist als separates Produkt erhältlich. Es eignet sich zur Anwendung mit Microsoft-Search-Produkten, zum Beispiel Windows Search, SharePoint und SQL Server.

Das TET Plugin für Adobe Acrobat ist ein kostenloses Tool, um Text und Bilder aus PDF-Dateine zu extrahieren. ES kann dazu verwendet werden, die Stärken von TET interaktiv zu testen.


Unterstützte Entwicklungsumgebungen

PDFlib TET läuft überall – auf praktisch allen Computersystemen. Wir bieten 32- und 64-Bit-Pakete an und unterstützen alle gängigen Varianten von Windows, Mac OS X, Linux und Unix sowie IBM i5/iSeries und zSeries. TET steht außerdem für die Plattformen mobiler Geräte zur Verfügung, darunter iOS, Android und Windows Embedded Compact/CE.

Der Kern von TET ist in C geschrieben und auf Schnelligkeit und geringen Overhead optimiert. Über ein einfaches API (Application Programming Interface) lässt sich die TET-Funktionalität in zahl­reichen Programmiersprachen nutzen:

COM für VB, ASP, Borland Delphi, etc.

C und C++

Java einschließlich Servlets und Java Application Server

.NET für C#, VB.NET, ASP.NET, etc.

Objective-C (Mac OS X und iOS)

Perl

PHP

Python

REALbasic

RPG (IBM i5/iSeries)

Ruby


Voll funktionsfähige Evaluierungsversionen inklusive Dokumentation und Beispiele können hier herunter geladen werden.