Künstliche Intelligenz (KI) ist ein Begriff, der gemeinhin zur Beschreibung von Maschinen und Software verwendet wird, die menschenähnliche kognitive Funktionen ausführen (z.B. Lernen, Verstehen, Schlussfolgern und Interagieren). Von KI werden weitreichende wirtschaftliche Auswirkungen erwartet, hat sie doch das Potenzial, die Bereiche Produktion und Dienstleistung zu revolutionieren, das Verhalten von Wirtschaftsakteuren zu beeinflussen und Volkswirtschaften und Gesellschaften zu transformieren.
Das enorme Leistungsvermögen dieser inzwischen als Allzwecktechnologie geltenden Verfahren hat die OECD-Länder und G20-Staaten dazu veranlasst, sich auf Schlüsselprinzipien zu verständigen, die die Entwicklung einer ethischen und vertrauenswürdigen KI fördern sollen. Die praktische Umsetzung derartiger Prinzipien erfordert jedoch ein einheitliches Verständnis dessen, was KI ist und woraus sie besteht, sowohl im Hinblick auf wissenschaftliche und technologische Entwicklungen als auch auf mögliche Anwendungen.
Um den Herausforderungen begegnen zu können, die mit der Eingrenzung einer so komplexen Thematik verbunden sind, schlägt die Studie eine operationelle Definition von KI vor, die auf der Identifizierung und Messung von Entwicklungen in Wissenschaft, Algorithmen und Technologien basiert, die mit KI einhergehen. Die Analyse stützt sich dazu auf Informationen, die in wissenschaftlichen Veröffentlichungen, Open-Source-Software und Patenten enthalten sind.
Wissenschaftlicher Ansatz der Studie
Der dreigleisige Ansatz der Studie setzt auf einer Auswahl etablierter bibliometrischer und patentbasierter Methoden auf und wird durch ein experimentelles Verfahren maschinellen Lernens (ML) ergänzt, das auf eigens dafür gesammelten Open-Source-Software-Daten basiert:
- Die Identifizierung von hinter KI-Entwicklungen stehender Wissenschaft baut auf einem zweistufigen bibliometrischen Ansatz auf, bei dem eine erste Gruppe von KI-relevanten Schlüsselwörtern aus wissenschaftlichen Publikationen extrahiert wird, die in der Scopus®-Datenbank des Wissenschaftsverlags Elsevier unter KI klassifiziert sind. Das Ergebnis wird dann durch Text-Mining-Verfahren und Expertenvalidierungen ergänzt und verfeinert.
- Da KI letztlich in Form von Algorithmen implementiert wird, verwenden die Autorinnen und Autoren Informationen über sogenannte Software-Commits (d.h. Beiträge), die auf GitHub (einer Hosting-Plattform) veröffentlicht werden, um KI-bezogene Software-Entwicklungen und ‑anwendungen zu verfolgen. Solche Daten werden mit Informationen aus wissenschaftlichen Publikationen kombiniert, die auf wichtigen KI-Konferenzen präsentiert werden, um zentrale KI-Repositorien zu identifizieren. Maschinelle Lernverfahren, die anhand von Informationen für den so identifizierten Kernsatz trainiert werden, lassen sich zur Untersuchung sämtlicher Software-Beiträge in GitHub eingesetzen, um alle KI-bezogenen Repositorien zu erkennen.
- In Patentdaten enthaltene Informationen dienen der Identifizierung und Abbildung KI-bezogener Erfindungen und neuer technologischer Entwicklungen, in die KI-bezogene Komponenten eingebettet sind.
Ausgewählte Ergebnisse der Studie
- Die Autorinnen und Autoren stellen eine beschleunigte Zunahme der Zahl von Veröffentlichungen im Bereich KI zu Beginn des Jahrtausends fest, gefolgt von einem stetigen Wachstum von durchschnittlich 10% pro Jahr bis 2015, vor einer erneuten Erhöhung der Zahl von Publikationen mit einem Anstieg von 23% pro Jahr. Der Anteil der KI-bezogenen Publikationen an den Gesamtpublikationen stieg bis 2018 auf über 2,2% aller Publikationen an.
- 28% der in den Jahren 2016 bis 2018 weltweit veröffentlichten KI-bezogenen wissenschaftlichen Publikationen stammen von Autorinnen und Autoren mit Affiliationen in China. Im Zeitverlauf ist der Anteil von KI-Publikationen, die aus den EU-28, den Vereinigten Staaten und Japan stammen, im Vergleich zum vor zehn Jahren beobachteten Niveau zurückgegangen.
- Seit 2014 ist die Zahl der Open-Source-Software-Repositorien mit KI-Bezug etwa dreimal so stark gewachsen wie die sonstiger Open-Source-Software.
- Nach 2015 ist ein deutlicher Anstieg des Anteils von KI-bezogenen Erfindungen an der Gesamtzahl von Erfindungen zu verzeichnen. Im Jahr 2017 betrug dieser Anteil mehr als 2,3%.
- “Neural networks/Neuronale Netzwerke” und “image processing/Bildverarbeitung” sind die am häufigsten gebrauchten Begriffe, die in Kurzbeschreibungen von Patenten mit KI-Bezug auftauchen.
- Bei KI-bezogenen Patenten hat sich der Beitrag von Erfindungen aus China seit Mitte der ersten Dekade dieses Jahrtausends mehr als versechsfacht und erreichte Mitte der zweiten Dekade fast 13%.
Mehr Ergebnisse und detaillierte Informationen in der Publikation:
Stefano Baruffaldi, Brigitte van Beuzekom, Hélène Dernis, Dietmar Harhoffi, Nandan Rao, David Rosenfeld, Mariagrazia Squicciarini (2020).
Identifying and Measuring Developments in Artificial Intelligence: Making the Impossible Possible.
OECD Science, Technology and Industry Working Papers No. 2020/05.
Stefano Baruffaldi ist Affiliated Research Fellow in der Abteilung Innovation and Entrepreneurship Research und Assistant Professor an der University of Bath.
Dietmar Harhoff ist Direktor am Max-Planck-Institut für Innovation und Wettbewerb.