
TET PDF IFilter extrahiert Text und Metadaten aus PDF-Dokumenten, um sie Retrieval-Produkten unter Windows zugänglich zu machen. Damit haben Sie die Möglichkeit, die PDF-Dokumente auf Ihrem Desktop-Computer, dem Enterprise-Server oder im Web zu durchsuchen. TET PDF IFilter basiert auf dem patentierten Entwicklungswerkzeug PDFlib Text Extraction Toolkit (TET), mit dem sich Text zuverlässig aus PDF-Dokumenten extrahieren lässt.
TET PDF IFilter ist eine stabile Implementierung der Microsoft IFilter-Schnittstelle zur Volltextindizierung und arbeitet mit allen Produkten zur Textabfrage zusammen, die die IFilter-Schnittstelle unterstützen, z.B. SharePoint oder SQL Server. Diese Produkte verwenden für jedes Dateiformat, z.B. HTML, ein anderes formatspezifisches Filterprogramm, das IFilter genannt wird. TET PDF IFilter ist ein solches Filterprogramm für PDF-Dokumente. Die Benutzerschnittstelle zum Durchsuchen der Dokumente kann Windows Explorer, ein Web- oder Datenbank-Frontend, ein Abfrageskript oder eine selbst entwickelte Anwendung sein. Alternativ zur interaktiven Suche mittels Benutzeroberfläche lassen sich Anfragen über eine Programmierschnittstelle absetzen.
PDFlib TET, das die Grundlage von TET PDF IFilter bildet, wurde erstmals 2002 veröffentlicht und hat sich weltweit in Server- und Desktop-Systemen bewährt. TET extrahiert nicht nur PDF-Seiteninhalte und Metadaten als Rohtext, sondern liefert den Dokumentinhalt alternativ auch im XML-Format.
TET ist auch als kostenloses Plugin für Adobe Acrobat verfügbar; mit diesem Plugin können Sie die hervorragende Textextraktion von TET interaktiv testen und evaluieren.
TET PDF IFilter bietet folgende Vorteile:
Indiziert nicht nur Seiteninhalte, sondern auch Metadaten, Lesezeichen, PDF-Anhänge und PDF-Pakete/Portfolios.
Extrahiert Text auch aus PDFs, bei denen Acrobat scheitert
Indiziert XMP-Metadaten in Bildern
Leistung: thread-sicher, schnell und stabil, 32- und 64-Bit
Schlankes Produkt ohne Abhängigkeiten und Seiteneffekte
Automatische Erkennung von Sprache/Schriftsystem
Aktiver Support durch ein engagiertes Team
TET PDF IFilter ist in thread-sicheren nativen 32- und 64-Bit-Versionen verfügbar. Unternehmensweite Lösungen zur Textsuche lassen sich in Kombination mit folgenden Produkten implementieren:
Microsoft Office SharePoint Server (MOSS)
Microsoft Search Server 2008 sowie dem kostenlosen Search Server 2008 Express
Microsoft SQL ServerMicrosoft
Exchange Server
TET PDF IFilter ist mit allen Produkten von Microsoft und anderen Anbietern einsetzbar, die die IFilter-Schnittstelle unterstützen.
TET PDF IFilter lässt sich auch zur Suche nach PDF-Dokumenten auf dem Desktop-Computer einsetzen, zum Beispiel mit folgenden Produkten:
Windows Desktop Search (WDS): in Windows Vista integriert, aber auch als kostenloser Zusatz für Windows XP verfügbar
Windows Indexing Service
TET PDF IFilter ist für den nicht-kommerziellen Einsatz auf Desktop-Systemen kostenlos verfügbar und bietet damit eine bequeme Basis zum Testen und Evaluieren.
PDFlib TET PDF IFilter zum Download bereit.