TET PDF IFilter Überblick

PDFlib TET PDF IFilter 5 - Enterprise PDF Search für Windows

TET PDF IFilter extrahiert Text und Metadaten aus PDF-Dokumenten, um sie Retrieval-Produkten unter Windows zugänglich zu machen. Damit haben Sie die Möglichkeit, die PDF-Dokumente auf Ihrem Desktop-Computer, dem Enterprise-Server oder im Web zu durchsuchen. TET PDF IFilter basiert auf dem patentierten Entwicklungswerkzeug PDFlib Text and Image Extraction Toolkit (TET), mit dem sich Text zuverlässig aus PDF-Dokumenten extrahieren lässt.

TET PDF IFilter ist eine stabile Implementierung der Microsoft IFilter-Schnittstelle zur Voll­textindizierung und arbeitet mit allen Produkten zur Textabfrage zusammen, die die IFilter-Schnittstelle unterstützen, z.B. SharePoint oder SQL Server. Diese Produkte verwenden für jedes Dateiformat ein anderes formatspezifisches Filterprogramm, das IFilter genannt wird. TET PDF IFilter ist ein solches Filterprogramm für PDF-Dokumente. Die Benutzerschnittstelle zum Durchsuchen der Dokumente kann Windows Explorer, ein Web- oder Datenbank-Frontend, ein Abfrageskript oder eine selbst ent­wickelte Anwendung sein. Alternativ zur interaktiven Suche über die Benutzeroberfläche lassen sich Anfragen über eine  Programmierschnittstelle absetzen.

Einzigartige Merkmale

TET PDF IFilter bietet folgende Vorteile:

  • Unterstützt westlichen, chinesischen, japanischen und koreanischen Text, sowie von rechts nach links laufende Sprachen wie Arabisch und Hebräisch.
  • Text aus Lesezeichen, Anmerkungen (Kommentare) und Formularfeldern
  • Indiziert auch geschützte Dokumente und extrahiert Text sogar aus PDFs, bei denen Acrobat scheitert
  • Konfigurierbare Metadaten-Indizierung für Dokumenteigenschaften
  • Automatische Erkennung von Sprache und Schriftsystem

Patentierte TET-Technologie

PDFlib TET, das die Grundlage von TET PDF IFilter bildet, wurde erstmals 2002 veröffentlicht und bewährt sich weltweit in Server- und Desktop-Systemen. TET extrahiert nicht nur PDF-Seiteninhalte und Metadaten als Rohtext, sondern liefert den Dokumentinhalt alternativ auch im XML-Format.
TET ist auch als kostenloses Plugin für Adobe Acrobat verfügbar. Damit können Sie die hervorragende Text- und Bildextraktion von TET interaktiv testen und evaluieren.

Unternehmensweite Suche in PDF-Dokumenten

TET PDF IFilter ist in thread-sicheren 32- und 64-Bit-Versionen verfügbar. Unternehmensweite Lösungen zur PDF-Textsuche lassen sich mit TET PDF IFilter und allen Produkten von Microsoft und anderen Herstellern umsetzen, die die IFilter-Schnittstelle unterstützen, z.B. die folgenden:

  • Microsoft SharePoint Server
  • Microsoft Search Server
  • Microsoft SQL Server
  • Microsoft Exchange Server
  • Mirosoft Site Server

TET PDF IFilter ist mit allen Produkten von Microsoft und anderen Herstellern einsetzbar, die die IFilter-Schnittstelle unterstützen.

Desktop-Suche in PDF-Dokumenten

TET PDF IFilter unterstützt auch die PDF-Suche auf dem Desktop-Computer mit Windows Search, das in Windows integriert ist.

TET PDF IFilter ist für den nichtkommerziellen Einsatz auf Desktop-Systemen kostenlos verfügbar und bietet damit eine bequeme Basis zum Testen und Evaluieren.