Ihr Computer denkt jetzt mit

14.06.2017

Mehrere Start-ups vermarkten Programme mit künstlicher Intelligenz zur Unterstützung von Forschenden. Die Idee ist gut, die Realität jedoch ernüchternd. Von Sven Titz

(Aus "Horizonte" Nr. 113 Juni 2017)​​​

​Im Schach kann der Mensch den Computer schon seit 20 Jahren nicht mehr besiegen. Neuerdings sollen die Maschinen beim anspruchsvollsten Geschäft mitwirken, das die Menschheit betreibt, nämlich bei der Forschung. Software soll Studien sondieren und beurteilen helfen: Der Computer als smarter Labor-Butler filtert die Literaturflut und assistiert bei der Peer Review.

Falsche Zusammenhänge

Die Werbung manch einer Firma tönt sehr optimistisch. Das norwegische Start-up Iris verkündet zum Beispiel, die Suche nach relevanter Forschungsliteratur verbessern zu können. Iris lässt sich auf der Website mit einem Gratistool testen. Nach Auswahl einer Studie zum Start der Suche liefert das Tool Hunderte Resultate, die nach "Schlüsselkonzepten" sortiert sind. Angeblich hängen die ermittelten Studien inhaltlich mit der eingespeisten Studie zusammen. Ein Teil der Resultate taugt jedoch nichts, weil das Tool gelegentlich Begriffsverbindungen für sinnverwandt hält, die nichts miteinander zu tun haben.

Die Literaturrecherche mit Semantic Scholar hingegen wird immerhin schon seit zwei Jahren erprobt. Die Software stammt vom kalifornischen Allen Institute for Artificial Intelligence und nutzt Maschinenlernen, um in Texten wissenschaftliche Konzepte zu erkennen. Bis anhin durchkämmt Semantic Scholar computer- und neurowissenschaftliche Literatur. Weitere Fachgebiete sollen bald folgen. Paul Ginsparg von der Cornell University, einer der Arxiv-Gründer, hebt auf Nachfrage eine Eigenschaft der Suchmaschine als "potenziell ziemlich nützlich" hervor: Sie berücksichtigt nicht nur die Zahl von Zitierungen, sondern auch ihren Stellenwert – also wer eine Studie zitiert hat und in welchem Kontext.

Intelligente Suchmaschinen wie Semantic Scholar oder auch Sparrho orientieren sich meist an den Literaturdatenbanken Google Scholar und Pubmed und erleben derzeit einen Boom. Allein in den letzten Monaten kamen zwei ähnliche Produkte heraus: Microsoft Academic und Recommended von Springer Nature.

Manche Firmen hegen noch höhere Ambitionen: Das Start-up Meta in Toronto will ein neues Scanverfahren für Fachliteratur entwickelt haben. Auf dessen Basis entwickeln die Mitarbeitenden Apps, die zum Beispiel mit vielschichtigen neuronalen Netzen arbeiten. Laut Marketing von Meta soll deren App Horizon Scanning den Ursprung eines wissenschaftlichen Konzepts aufspüren können: Sie verfolgt es rückwärts in der Zeit und blättert so das Areal eines ganzen Forschungszweigs auf.

Horizon Scanning ist nach Angaben der Firma für die Pharmaindustrie, Verlage, Forschungskorporationen und Behörden gedacht. Ein Teil der Algorithmen stammt von einer Firma, die an der Entwicklung von Apples Sprachassistenz-Software Siri beteiligt war. Unter den Gründern befinden sich mehrere Forschende, und kürzlich wurde die Firma durch die Chan Zuckerberg Initiative aufgekauft. Expertinnen und Experten sehen sich mangels konkreter Informationen nicht in der Lage, eine belastbare Einschätzung abzugeben – zum Beispiel Jana Koehler von der Hochschule Luzern oder Peter Flach von der University of Bristol. Die Software wirkt auf sie wie eine Black Box.

Mehr als vergleichen ist schwierig

Neben der Literaturrecherche werden elementare Formen der künstlichen Intelligenz bereits im Zusammenhang mit der Begutachtung von Fachartikeln genutzt. Flach hat gemeinsam mit Kollegen ein Programm entwickelt, mit dem sich zum Beispiel passende Gutachter für eine Studie finden lassen: Die Open-Source-Software Subsift nutzt dazu fortgeschrittene Matching-Algorithmen für Wortlisten, die Studien und Gutachter beschreiben. Es sei eine sehr grosse Herausforderung, Assistenz-Software für Wissenschaftler zu entwickeln, die über allgemeine Anwendungen wie Suche oder Abgleich ("Matching") hinausgehen sollen, sagt Flach. Das Problem besteht darin, das Fachwissen der Menschen sinnvoll zu integrieren. In Zukunft werde man aber zunehmend damit rechnen können.

Sven Titz ist freier Wissenschaftsjournalist.