Ein kleines Update und ein Ausblick: „Nolm“

Wann kommt Nolm?

Die erste Frage, die immer kommt, wenn ich von Nolm erzähle: Ja wann gibt es endlich Nolm? Nun, die meisten Projekte dauern länger, als man denkt. Das war und ist auch bei Nolm der Fall. Ein Grund war, dass die Index-Daten lange nicht in vollem Umfang verfügbar waren. Nun sind die Daten aber endlich verfügbar. Die Tatsache, dass sich die interne Aufteilung und die verwendeten Datenformate mehrmals verändert haben, trug ebenfalls zur Verzögerung bei. Aber nun ist der Open-Web-Index da und wir arbeiten mit Hochdruck daran, basierend darauf ein neues Suchmaschinen-Projekt in enger Zusammenarbeit mit unseren universitären Partnern zu starten.

Die zweite Frage betrifft eine bestimmte Skepsis, die viele teilen. Wie kann es sein, dass ein so kleiner Laden wie der unsere eine Suchmaschine bauen kann, die dann auch noch funktioniert? Schließlich gibt es da komplexe Anforderungen, etwa das Ranking betreffen. Google zum Beispiel hat tausende von Mitarbeitern, die an der Suche schrauben. Dazu lässt sich folgendes sagen: Ein gutes Ranking braucht nicht unbedingt viele Personen. Bei Google geht es vielmehr immer auch um ständige Anpassung und Optimierung, damit das Werbekonzept passt. Das entfällt bei uns. Zudem fangen wir nicht bei null an. Ranking ist ein – auch dank Google – sehr gut erforschtes Problem. Allerdings ist Ranking anspruchsvoll und in der Tat der zentrale Punkt bei unserem Projekt Nolm:
Nolm ist kein Produkt, sondern ein Forschungsprojekt. Unser Plan ist es, das Ranking nach und nach zu verbessern, während wir Indexgröße und Nutzerzahl langsam hochschrauben. Dafür werden wir zwei Ansätze verfolgen:

Zum Einen haben wir durch den bald 30-jährigen Betrieb von MetaGer schon viel Ranking-Expertise aufgebaut und auch wenn es ein anderer Typ von Suchmaschine ist: Wir werden viel vom MetaGer-Ranking auch auf Nolm übertragen können und müssen eben nicht von 0 anfangen.

Zum Anderen wird Nolm anonymisierte Statistiken erheben, die die Qualität des Ranking messen und verbessern sollen.

Aus dem Nähkästchen: Was schon geht – und was noch nicht geht..

Doch bauen wir die Suchmaschine nun wirklich von der Basis an ganz allein? Nein, das tun wir nicht. Nolm basiert auf vielen Modulen, von denen manche von uns, manche von Partnern und manche von ganz anderen Projekten stammen. Zum Beispiel nutzen wir aktuell intern eine Software namens MOSAIC, die von Forschern der Universität Graz und anderen Mitgliedern des OpenWebSearch.EU-Konsortiums (wie auch uns) entwickelt wird. Das Ziel ist, eine Auswahl von Modulen zu schaffen, aus denen wieder eine Vielzahl von Suchmaschinen unterschiedlicher Größe entstehen kann.

Viel ist bislang geschafft. Viele Grundbausteine von Nolm sind vorhanden und müssen nur verfeinert und stabilisiert werden. Bislang ist die Suche noch langsamer als uns lieb ist, aber auch an der Optimierung wird gearbeitet. Wir haben zum internen Testen eine auch Integration von MetaGer-Ergebnissen in Nolm gebaut. Vielleicht kann sich daraus noch eine kleinere Form der Metasuche entwicklen, wenn das Interesse groß genug ist. Wir wollen bei diesem Projekt sehr viel näher mit unseren Mitgliedern zusammenarbeiten und diesen auch den ersten Zugriff ermöglichen, sodass wir eine wertvolle Quelle von Rückmeldungen zur Verfügung haben.

Wer nicht ständig Suchmaschinen baut (und wer macht das schon…), weiß nicht, was alles dazu gehört, damit eine Suchmaschine am Ende funktioniert. So brauchen wir noch einige Werkzeuge zur Administration. Auch eine Blacklist wird aufgebaut werden müssen, die verhindert, dass auf illegale Ergebnisse zugegriffen werden kann. Dinge wie eine Admin-Oberfläche sowie ein Einrichtungsassistent gehören auch noch auf die To-Do-Liste und werden in den nächsten Monaten entwickelt.

Jeder, wie er’s braucht: Baukasten

Unser allgemeines Ziel ist hierbei, nicht nur eine neue Suchmaschine anzubieten, die auf den Open-Web-Index zugreift, sondern auch einzelne Dienste nach Art eines Baukastenprinzips, das es jedem Nutzer ermöglicht, sich seine eigene Suchmaschine aufzusetzen. Wir hoffen, dass es so in Zukunft wieder mehr kleine und mittelgroße Suchmaschinen geben kann. Dies ist nicht nur für technisch Ambitionierte interessant. Es hat auch handfeste Vorteile für Unternehmen. So könnten Unternehmen eigene Datenbanken und Indexe mit dem Open-Web-Index kombinieren und eine auf das Unternehmen zugeschnittene Lösung erarbeiten. Die Offenheit des Konzepts entspricht genau der Idee der Wissensfreiheit, die uns trägt.

Der ungewisse Blick in die Zukunft

Leider gibt es ein Problem, das die Freude an den neuen Entwicklungen bremst. Fünf Jahre lang wurde die Infrastruktur des offenen Web-Index EU-finanziert ausgebaut. Das Next-Generation-Internet-Programm hat seit 2018 zahlreiche Infrastrukturprojekte gefördert. Jetzt hat sich aber die EU-Kommission entschieden, dass die Finanzierung nicht fortgeführt wird und der Open-Web-Index wie auch viele andere sinnvolle Projekte nicht weiter gefördert werden. Stattdessen scheint man sich mehr auf die Förderung europäischer KI-Modelle zu fokussieren. Die europäische Grundinfrastruktur des Web bleibt dabei auf der Strecke; aus unserer Sicht ein Fehler. Der Index steht nun, muss aber natürlich stetig angepasst werden, um brauchbar zu sein. Nach einen Krisengespräch im Open-Web-Search-Konsortium können wir vorsichtig sagen: Die Zukunft des Open Web Index ist wohl für das nächste Jahr erst mal gesichert, was danach passiert, bleibt aber leider ungewiss. Es wird versucht, eine andere Förderungsmöglichkeit ab 2027 aufzutun.

Zuletzt müssen wir an dieser Stelle nochmal betonen, dass wir nur durch die vielen Neumitgliedschaften des letzten Jahres überhaupt weitermachen können. Wir werden noch weitere Mitglieder brauchen, bevor wir keine roten Zahlen mehr schreiben, aber wir sind optimistisch, dass wir den Bogen kriegen werden.

About the author

Seit 2013 arbeite ich für den SUMA-EV im Bereich Social-Media, Presse- und Öffentlichkeitsarbeit. Vor meiner Tätigkeit beim SUMA-EV habe ich kreatives Schreiben für Kinder unterrichtet und als Autorin gearbeitet.
de_DEDeutsch