Station 6

Bildsuchen
Fallbeispiele

In diesem Kapitel werden exemplarisch drei Bildsuchen vorgestellt. Dabei wird aufgezeigt, auf welche Weise nach den Bildern gesucht wird und welche Filtermöglichkeiten es gibt. Es wird in diesem Abschnitt nicht analysiert, ob die Ergebnisse der Recherche zufriedenstellend sind, sondern die Bandbreite der Suchmöglichkeiten soll hier vorgestellt werden.

(Autor: Nicolas Schenk, 06.05.2016)

Prometheus

Prometheus ist ein Online-Bildarchiv, das verschiedene Bilddatenbanken zusammenführt, sodass eine Bildsuche mittels einer einheitlichen Suchmaske in 87 Datenbanken (Stand Februar 2016) möglich ist. Das Archiv wird am Kunsthistorischen Institut der Universität zu Köln betreut. Insgesamt kann man unter knapp 1,5 Millionen digitalisierten Bildern aus Kunst, Kultur und Geschichte suchen.

Bei der erweiterten Suche lassen sich beliebig viele der folgenden Kriterien miteinander verknüpfen: KünstlerIn, Titel, Standort, Fundort, Gattung, Material, Schlagwort, Beschreibung, Datierung, Bildnachweis, rights/reproduction, unspezifiziert (Sonstiges), Bild-ID und Objekt-ID. Die vier letzten Kriterien sind eher für Experten gedacht, die beispielsweise die Objekt-ID des Bildes im Archiv kennen. Außerdem kann man neben der Vorauswahl In allen Datenbanken suchen auch in einzelnen Datenbanken nach Bildern forschen, Datenbanken miteinander kombinieren oder nur in Museums-, Forschungs- oder Institutionsdatenbanken suchen.

Prometheus

Die erweiterte Suche in Prometheus (Screenshot: Nicolas Schenk, CC BY-SA 4.0).

Bildsuche der Bayerischen Staatsbibliothek

Das Münchener Digitalisierungszentrum (MDZ) stellt seit 1997 die Bestände der Bayerischen Staatsbibliothek (BSB) online. Da die Standardsuche sowie die erweiterte Suche mit der Eingabe von Titel- und Autorennamen arbeiten, also der Fokus auf Büchern liegt, wird hier stattdessen die Bildähnlichkeitssuche beschrieben. Die Datengrundlage bilden circa fünf Millionen Bilder aus Handschriften und Drucken des 9. bis 20. Jahrhunderts aus den digitalen Sammlungen der Bayerischen Staatsbibliothek. Die zugrunde liegende Software hat die Kanten- und Farbmerkmale der Digitalisate indexiert, sodass eine Bildähnlichkeitssuche nach Kriterien wie Farben, Texturen und Kontrasten möglich ist.

BSB1

Die Bildähnlichkeitssuche der Bayerischen Staatsbibliothek (Screenshot: Nicolas Schenk, CC BY-SA 4.0).

BSB2

Die Bildähnlichkeitssuche der Bayerischen Staatsbibliothek (Screenshot: Nicolas Schenk, CC BY-SA 4.0).

BSB3

Die Suchoptionen bei der Bildähnlichkeitssuche der Bayerischen Staatsbibliothek (Screenshot: Nicolas Schenk, CC BY-SA 4.0).

 Es gibt 14 Motive, aus denen man zuerst ein Bild auswählen kann (Menschen, Architektur, Wappen, Pflanzen, Tiere, Landkarten, Stadtansichten, Einbände, Titelblätter, Exlibris, Kriegskunst, Fahrzeuge, Waffen und Technik) oder man wählt die Option Zufallsauswahl. Klickt man auf eines der Motive, wird eine Liste von Bildern angezeigt, die zum Motiv passen. Wählt man hier ein Bild aus, kann man nach ähnlichen Motiven forschen. Mittlerweile bietet die BSB auch die Möglichkeit, eine Bildähnlichkeitssuche mit einem selbst hochgeladenen Bild an. Es besteht die Möglichkeit, das Ausgangsbild in Einzelsegmente aufzuteilen und basierend auf einem dieser Segmente eine Ähnlichkeitssuche durchführen zu lassen, also die Recherche auf einen Teil des Bildes zu beschränken. Diese Einzelsegmente werden durch eine Software ermittelt, die das Fraunhofer Heinrich-Hertz-Institut entwickelt hat. Durch die automatische Ermittlung lässt sich auch erklären, warum für die Einzelsegmente in manchen Fällen eher unbrauchbare Segmente wie beispielsweise Flecken vorgeschlagen werden (Thomas Wolf, Bayerische Staatsbibliothek). In den Suchoptionen kann festgelegt werden, ob der Fokus der Ähnlichkeitssuche auf den Farb- oder Kantenmerkmalen liegt oder ob beide Merkmale gleich viel Beachtung finden. Außerdem kann man eine Mindestähnlichkeit festlegen (zwischen 0.0 und 1.0), wobei auf der Seite ein Wert zwischen 0.85 und 0.95 empfohlen wird. Der Wert 1.0 würde Deckungsgleichheit bedeuten, der Wert 0.0 keine Gleichheit. Ein Wert von 0.85 bedeutet beispielsweise eine Ähnlichkeit von 85% nach Farben oder Kanteneigenschaften. Bei einem Wert unter 0.80 lassen sich bereits kaum mehr ähnliche Treffer finden (Thomas Wolf, Bayerische Staatsbibliothek). Zuletzt lässt sich die maximale Trefferanzahl festlegen. Die Treffer ganz oben in der Liste sind die ähnlichsten Bilder. Bei einer maximalen Trefferanzahl von 50 werden also die (wenn vorhandenen) 50 ähnlichsten Bilder angezeigt.

Tineye

Ein völlig anderes Konzept als die beiden zuvor beschriebenen Bildsuchen verfolgt TinEye. Hier kann man in 14 Milliarden Bildern recherchieren. Die Suche wird mittels eines eigens hochgeladenen Bildes oder mittels einer eingegebenen URI durchgeführt. Jedoch ist TinEye nicht darauf ausgelegt, ähnliche Bilder zu finden, sondern es findet das exakt gleiche Bild oder bearbeitete Versionen des Bildes wieder. Voraussetzung ist, dass die Software das jeweilige Bild schon im Internet aufgespürt hat.

Bei dem Abgleich mit den indexierten knapp 13 Milliarden Bildern bezieht TinEye keine eventuell den Bildern anhängenden Metadaten wie beispielsweise Titel, Künstler oder Schlagwörter für die Suche mit ein, sondern verwendet ausschließlich seine eigene Bilderkennungssoftware. Nützlich ist TinEye also beispielsweise dann, wenn man (weitere) Informationen über ein Bild bekommen möchte, das Bild in einer besseren Qualität finden möchte oder aus verschiedenen Gründen herausfinden will, in welcher Form ein bestimmtes Bild im Internet zu finden ist.

Tineye

Die Suchmaske von TinEye (Screenshot: Nicolas Schenk, CC BY-SA 4.0).