{"id":3451,"date":"2020-08-26T10:24:36","date_gmt":"2020-08-26T10:24:36","guid":{"rendered":"https:\/\/suma-ev.de\/?page_id=3451"},"modified":"2020-08-27T12:12:15","modified_gmt":"2020-08-27T12:12:15","slug":"kurzimpulse","status":"publish","type":"page","link":"https:\/\/suma-ev.de\/en\/kurzimpulse\/","title":{"rendered":"Kurzimpulse"},"content":{"rendered":"<figure class=\"wp-block-image size-large\"><img decoding=\"async\" src=\"https:\/\/suma-ev.de\/wp-content\/uploads\/2020\/08\/dog.jpg\" alt=\"\"\/><\/figure>\n\n\n\n<p class=\"has-drop-cap\" style=\"font-size:17px\">Hier finden Sie eine l\u00e4ngere Liste mit Themenbeispielen aus verschiedenen Fachbereichen und Disziplinen. In Klammern hinter den Themen sehen Sie eine Einordnung der Schwierigkeitsgrade aus unserer Sicht.\u00a0<br>\u201eB\u201c bedeutet, dass wir das jeweilige Thema f\u00fcr eine Bachelorarbeit geeignet halten, \u201eM\u201c weist auf ein Masterthesisthema hin. F\u00fcr die Liste erheben wir keinen Anspruch auf Vollst\u00e4ndigkeit, sie soll Ihnen nur Anhaltspunkte f\u00fcr die Vielf\u00e4ltigkeit der Thematik geben.<\/p>\n\n\n\n<h2 class=\"wp-block-heading\">Informatik<\/h2>\n\n\n\n<ul class=\"wp-block-list\"><li>Verteiltes Crawling (Eine gef\u00f6rderte Arbeit vorhanden)(B+M)<\/li><li>Trusted Crawling (B)<ul><li>Signatur der Ergebnisse<\/li><\/ul><\/li><li>Textalgorithmen (B)<ul><li>\u00dcberblick schaffen<\/li><li>Spezialf\u00e4lle der Volltextsuche optimieren<\/li><\/ul><\/li><li>Neuronale Netze bzw. Machine-Learning in Suche und Ranking (B+M)<\/li><li>Crawling zur Suchzeit (B)<ul><li>\u201eRe-Crawling\u201c einer Ergebnisliste<\/li><li>Interaktive Suchagenten<\/li><li>Langzeitsuche<\/li><li>Verlagerung der Suche zum Suchenden &nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;<\/li><\/ul><\/li><li>Lokale Suchindexe auf Personalcomputern (B)<ul><li>Unterst\u00fctzung von Vollsuchmaschinen<\/li><li>Offline-Suche im Browser-Cache<\/li><\/ul><\/li><li>Verteiltes Webarchiv mit IPFS (B)<\/li><li>Kompression von Webseiten (B)<ul><li>Verlustfrei\/Verlustbehaftet<\/li><li>DOM-Parsing\/Normalisierung<ul><li>Kompression durch EXI?<\/li><\/ul><\/li><li>Strukturerhaltend?<\/li><li>Deduplikation?<\/li><\/ul><\/li><li>Linked-Data-Webindexe (B+M)<ul><li>Suchen in GraphenDB\/SPAQL<\/li><li>RDFS\/OWL\/SHACL f\u00fcr Webdokumente<\/li><\/ul><\/li><li>Maschinennutzbare Suchmaschinen mittels des Open-Search Standard (B)<\/li><li>Kryptografische Suchmaschinen (B+M)<\/li><li>P3P (https:\/\/de.wikipedia.org\/wiki\/Platform_for_Privacy_Preferences_Project) (B)<\/li><\/ul>\n\n\n\n<h2 class=\"wp-block-heading\">Sonstige (auch andere Fachbereiche)<\/h2>\n\n\n\n<ul class=\"wp-block-list\"><li>Betrachtung der volkswirtschaftlichen Gesamtkosten von Suchmaschinen (B)<ul><li>auch speziell Meta-Suchmaschinen oder OWI<\/li><\/ul><\/li><li>Vergleich von Metriken f\u00fcr die Qualit\u00e4t von Suchergebnissen (B)<\/li><li>Einfluss von Markendenken auf die wahrgenommene Qualit\u00e4t von Suchmaschinen (Dazu sind bereits Arbeiten vorhanden) (B)<\/li><li>Beeinflussung der Wahrnehmung eines Themenbereiches durch manipulierende Suchmaschinen (B+M)<\/li><li>Optimale Snippet-L\u00e4nge (B)<\/li><li>rechtliche Betrachtung von Suchmaschinen (B+M)<ul><li>UrhG<\/li><li>LSR<\/li><li>DSGVO<ul><li>Recht auf Vergessenwerden<\/li><\/ul><\/li><li>Jugenschutz<\/li><\/ul><\/li><\/ul>\n\n\n\n<h1 class=\"wp-block-heading\">Vorschl\u00e4ge f\u00fcr Arbeitsthemen<\/h1>\n\n\n\n<h2 class=\"wp-block-heading\">Verteiltes Crawling (B+M)<\/h2>\n\n\n\n<p>Durch die enormen Datenmengen im Web macht es Sinn, Aufgaben wie das Crawlen von Webseiten auf mehrere Akteure zu verteilen. Eine Bachelorarbeit zu diesem Thema k\u00f6nnte die bisherige Forschung b\u00fcndeln und zeitgem\u00e4\u00df einordnen. Eine Masterarbeit k\u00f6nnte die Verfahren genauer beleuchten und zielgerichtet weiterentwickeln.<\/p>\n\n\n\n<h2 class=\"wp-block-heading\">Trusted Crawling (B)<\/h2>\n\n\n\n<p>Bislang werden Crawler meist von derselben Entit\u00e4t betrieben, die auch die Weiternutzung der Daten vornimmt. F\u00fcr eine Weiternutzung durch Dritte kann es allerdings sinnvoll sein, die Herkunft der Daten im nachhinein nachpr\u00fcfen zu k\u00f6nnen und Manipulationsversuche entsprechend ahnden zu k\u00f6nnen. Eine Arbeit zum Thema \u201eTrusted Crawling\u201c k\u00f6nnte die \u2013 insbesondere kryptografischen \u2013 M\u00f6glichkeiten hierf\u00fcr untersuchen.<\/p>\n\n\n\n<h2 class=\"wp-block-heading\">Textalgorithmen (B)<\/h2>\n\n\n\n<p>Um eine m\u00f6glichst effiziente Volltextsuche durchzuf\u00fchren, gibt es einige Algorithmen mit eigenen Vor- und Nachteilen. Eine Arbeit zum Thema \u201eTextalgorithmen\u201c k\u00f6nnte diese \u2013 teils klassischen \u2013 Methoden vergleichen und zeitgem\u00e4\u00df einordnen. Alternativ k\u00f6nnte ein spezielles Szenario der Volltextsuche ausgesucht und im Kontext verschiedener Verfahrensweisen diskutiert werden.<\/p>\n\n\n\n<p>Hinweis: Besonders geeignet k\u00f6nnte das Thema im Kontext der unregelm\u00e4\u00dfig gehaltenen LUH-Vorlesung \u201eTextalgorithmen\u201c sein.<\/p>\n\n\n\n<h2 class=\"wp-block-heading\">Neuronale Netze bzw. Machine-Learning in Suche und Ranking (B+M)<\/h2>\n\n\n\n<p>Neuronale Netze bieten neue M\u00f6glichkeiten zur Analyse und Bewertung von Dokumenten in Suchmaschinen. Eine Bachelorarbeit k\u00f6nnte einen Einblick z.B. in die aktuellen Entwicklungen des Marktf\u00fchrers bieten. F\u00fcr eine Masterarbeit bietet das Thema wesentlich mehr Gestaltungsspielraum.<\/p>\n\n\n\n<h2 class=\"wp-block-heading\">Crawling zur Suchzeit (B)<\/h2>\n\n\n\n<p>Ein kaum erforschtes Gebiet ist das interaktive Crawling zu Laufzeit einer Suche. Eine Bachelorarbeit k\u00f6nnte die bisherigen Arbeiten sammeln und bewerten. Au\u00dferdem k\u00f6nnten auch Ideen wie das \u201eRe-Crawling\u201c einer Ergebnisliste, interaktive Suchagenten oder Langzeitsuchen bearbeitet werden.<\/p>\n\n\n\n<h2 class=\"wp-block-heading\">Lokale Suchindexe auf PCs (B)<\/h2>\n\n\n\n<p>Die meisten Web-Browser verf\u00fcgen \u00fcber einen Cache, in dem h\u00e4ufig oder zuletzt besuchte Webinhalte zwischengespeichert werden. Eine Bachelorarbeit k\u00f6nnte untersuchen, ob und wie eine Durchsuchbarkeit dieser Dokumente n\u00fctzlich ist. Die Cache-Ergebnisse k\u00f6nnten Internetsuchmaschinen komplementieren oder ein Fallback in Situationen ohne Internetverbindung bieten.<\/p>\n\n\n\n<h2 class=\"wp-block-heading\">Verteiltes Webarchiv mit IPFS (B)<\/h2>\n\n\n\n<p>IPFS ist ein verteiltes, deduplizierendes System zum Speichern und Bereitstellen von Inhalten. Ein Interesse an der Konservierung des Web besteht nicht nur seitens der Suchmaschinen, sondern auch von Bibliotheken, Kulturorganisationen und Forschung. Eine praxisorientierte Bachelorarbeit k\u00f6nnte sich mit der M\u00f6glichkeit eines verteilten Webarchives auseinandersetzen und mit einem Prototypen dessen Machbarkeit darlegen.<\/p>\n\n\n\n<h2 class=\"wp-block-heading\">Kompression von Webseiten (B)<\/h2>\n\n\n\n<p>Eine Bachelorarbeit k\u00f6nnte die M\u00f6glichkeit der Kompression von Webinhalten untersuchen. Dabei k\u00f6nnten sowohl Deduplikation als auch verlustfreie und verlustbehaftete Verfahren verglichen werden. Mittels DOM-Parsing und -Normalisierung k\u00f6nnte die Gr\u00f6\u00dfe von Webdokumenten strukturerhaltend verringert werden, ohne deren semantische Interpretation zu ver\u00e4ndern. Die Tauglichkeit des Formates EXI (Efficient XML Interchange) f\u00fcr (X)HTML k\u00f6nnte gepr\u00fcft werden.<\/p>\n\n\n\n<h2 class=\"wp-block-heading\">Linked-Data-Webindexe (B+M)<\/h2>\n\n\n\n<p>Wenn Informationen in Graphendatenbanken gespeichert werden, er\u00f6ffnen sich neue M\u00f6glichkeiten, diese Daten zu analysieren und mit externen Datens\u00e4tzen zu verbinden. Eine Bachelorabeit k\u00f6nnte ein Schema in RDFS, OWL oder SHACL erarbeiten, mit dem Webdokumente in Graphendatenbanken besser repr\u00e4sentiert werden k\u00f6nnen.<\/p>\n\n\n\n<h2 class=\"wp-block-heading\">Maschinennutzbare Suchmaschinen mittels des OpenSearch Standard (B)<\/h2>\n\n\n\n<p>Der Industriestandard OpenSearch bietet ein RSS- bzw ATOM-basiertes Format, um Suchergebnisse maschinenlesbar auszuliefern. Dies er\u00f6ffnet M\u00f6glichkeiten, wie z.B. automatisierte Metasuche, native Pr\u00e4sentation oder datensparsame \u00dcbertragung&nbsp;von Suchergebnissen. Eine Bachelorarbeit k\u00f6nnte solche Anwendungsf\u00e4lle finden und\/oder untersuchen.<\/p>\n\n\n\n<h2 class=\"wp-block-heading\">Kryptografische Suchmaschinen (B+M)<\/h2>\n\n\n\n<p>Eine Arbeit mit zum Thema \u201eKryptografische Suchmaschinen\u201c k\u00f6nnte neuartige Verfahren untersuchen, Datenschutz in Suchmaschinen durch Kryptografie zu gew\u00e4hrleisten. Ein Beispiel ist die homomorphe Kryptografie.<\/p>\n\n\n\n<h2 class=\"wp-block-heading\">Platform for Privacy Preferences (B)<\/h2>\n\n\n\n<p>Das \u201ePlatform for Privacy Preferences Project\u201c ist ein W3C-Standard zur maschinenlesbaren Auszeichnung von Datenschutzerkl\u00e4rungen. Eine praxisorientierte Bachelorarbeit k\u00f6nnte einen Prototypen einer Browsererweiterung konzipieren, das eingestellte Nutzerpr\u00e4ferenzen automatisch mit kompatiblen Webseiten vergleicht und gegebenfalls eine Warnmeldung generiert, falls die geforderten Datenschutzpr\u00e4ferenzen vom Webserver nicht erf\u00fcllt werden.<\/p>","protected":false},"excerpt":{"rendered":"<p>Hier finden Sie eine l\u00e4ngere Liste mit Themenbeispielen aus verschiedenen Fachbereichen und Disziplinen. In Klammern hinter den Themen sehen Sie eine Einordnung der Schwierigkeitsgrade&#8230;<\/p>","protected":false},"author":3,"featured_media":0,"parent":0,"menu_order":0,"comment_status":"closed","ping_status":"closed","template":"","meta":{"footnotes":""},"class_list":["post-3451","page","type-page","status-publish","hentry"],"_links":{"self":[{"href":"https:\/\/suma-ev.de\/en\/wp-json\/wp\/v2\/pages\/3451","targetHints":{"allow":["GET"]}}],"collection":[{"href":"https:\/\/suma-ev.de\/en\/wp-json\/wp\/v2\/pages"}],"about":[{"href":"https:\/\/suma-ev.de\/en\/wp-json\/wp\/v2\/types\/page"}],"author":[{"embeddable":true,"href":"https:\/\/suma-ev.de\/en\/wp-json\/wp\/v2\/users\/3"}],"replies":[{"embeddable":true,"href":"https:\/\/suma-ev.de\/en\/wp-json\/wp\/v2\/comments?post=3451"}],"version-history":[{"count":10,"href":"https:\/\/suma-ev.de\/en\/wp-json\/wp\/v2\/pages\/3451\/revisions"}],"predecessor-version":[{"id":3469,"href":"https:\/\/suma-ev.de\/en\/wp-json\/wp\/v2\/pages\/3451\/revisions\/3469"}],"wp:attachment":[{"href":"https:\/\/suma-ev.de\/en\/wp-json\/wp\/v2\/media?parent=3451"}],"curies":[{"name":"wp","href":"https:\/\/api.w.org\/{rel}","templated":true}]}}