PDFlib TET PDF IFilter 5 - Enterprise PDF Search für Windows

PDF IFilter: Extract text

TET PDF IFilter extrahiert Text und Metadaten aus PDF-Dokumenten, um sie Retrieval-Produkten unter Windows zugänglich zu machen. Damit haben Sie die Möglichkeit, die PDF-Dokumente auf Ihrem Desktop-Computer, dem Enterprise-Server oder im Web zu durchsuchen. TET PDF IFilter basiert auf dem patentierten Entwicklungswerkzeug PDFlib Text and Image Extraction Toolkit (TET), mit dem sich Text zuverlässig aus PDF-Dokumenten extrahieren lässt.

TET PDF IFilter ist eine stabile Implementierung der Microsoft IFilter-Schnittstelle zur Voll­textindizierung und arbeitet mit allen Produkten zur Textabfrage zusammen, die die IFilter-Schnittstelle unterstützen, z.B. SharePoint oder SQL Server. Diese Produkte verwenden für jedes Dateiformat, z.B. HTML, ein anderes formatspezifisches Filterprogramm, das IFilter genannt wird. TET PDF IFilter ist ein solches Filterprogramm für PDF-Dokumente. Die Benutzerschnittstelle zum Durchsuchen der Dokumente kann Windows Explorer, ein Web- oder Datenbank-Frontend, ein Abfrageskript oder eine selbst ent­wickelte Anwendung sein. Alternativ zur interaktiven Suche über die Benutzeroberfläche lassen sich Anfragen über eine  Programmierschnittstelle absetzen.

Besondere Vorteile

TET PDF IFilter bietet folgende Vorteile:

Unterstützt westlichen, chinesischen, japanischen und koreanischen Text, sowie von rechts nach links laufende Sprachen wie Arabisch und Hebräisch.

Text aus Lesezeichen, Anmerkungen (Kommentare) und Formularfeldern

Indiziert auch geschützte Dokumente und extrahiert Text sogar aus PDFs, bei denen Acrobat scheitert

Konfigurierbare Metadaten-Indizierung für Properties

Automatische Erkennung von Sprache und Schriftsystem

Patentierte TET-Technologie

PDFlib TET, das die Grundlage von TET PDF IFilter bildet, wurde erstmals 2002 veröffentlicht und bewährt sich weltweit in Server- und Desktop-Systemen. TET extrahiert nicht nur PDF-Seiteninhalte und Metadaten als Rohtext, sondern liefert den Dokumentinhalt alternativ auch im XML-Format.
TET ist auch als kostenloses Plugin für Adobe Acrobat verfügbar. Damit können Sie die hervorragende Text- und Bildextraktion von TET interaktiv testen und evaluieren.

Unternehmensweite Suche in PDF-Dokumenten

TET PDF IFilter ist in thread-sicheren 32- und 64-Bit-Versionen verfügbar. Unternehmensweite Lösungen zur PDF-Textsuche lassen sich mit TET PDF IFilter und allen Produkten von Microsoft und anderen Herstellern umsetzen, die die IFilter-Schnittstelle unterstützen, z.B. die folgenden:

Microsoft SharePoint Server

Microsoft Search Server

Microsoft SQL Server

Microsoft Exchange Server

Mirosoft Site Server

TET PDF IFilter ist mit allen Produkten von Microsoft und anderen Herstellern einsetzbar, die die IFilter-Schnittstelle unterstützen.

Desktop-Suche in PDF-Dokumenten

TET PDF IFilter unterstützt auch die PDF-Suche auf dem Desktop-Computer mit Windows Search, das in Windows integriert ist.

TET PDF IFilter ist für den nicht-kommerziellen Einsatz auf Desktop-Systemen kostenlos verfügbar und bietet damit eine bequeme Basis zum Testen und Evaluieren.