Studie  |  28.07.2020

Künstliche Intelligenz identifizieren und messen – Das Unmögliche möglich machen

Forscher und Forscherinnen des Instituts und der OECD haben eine neue Studie dazu publiziert, wie sich mit KI einher­gehende Ent­wicklungen in Wissen­schaft, Algo­rithmen und Techno­logien identi­fizieren und messen lassen. Anhand von Infor­mationen aus wissen­schaft­lichen Publikationen, Archiven für Open-Source-Software (OSS) und Patenten stellen sie fest, dass KI-bezogene Ent­wick­lungen in den letzten Jahren deut­lich zu­genom­men haben. China spielt im Bereich KI eine zu­nehmend wichtige Rolle.  

Künstliche Intelligenz (KI) ist ein Begriff, der gemein­hin zur Be­schreibung von Maschinen und Software verwendet wird, die menschen­ähnliche kognitive Funktionen aus­führen (z.B. Lernen, Ver­stehen, Schluss­folgern und Inter­agieren). Von KI werden weit­reichende wirtschaft­liche Aus­wirkungen erwartet, hat sie doch das Potenzial, die Bereiche Produktion und Dienst­leistung zu re­volutio­nieren, das Ver­halten von Wirtschafts­akteuren zu be­ein­flussen und Volks­wirt­schaften und Gesell­schaften zu trans­formieren.


Das enorme Leistungs­vermögen dieser in­zwischen als All­zweck­tech­nologie geltenden Ver­fahren hat die OECD-Länder und G20-Staaten dazu ver­anlasst, sich auf Schlüssel­prinzipien zu ver­ständigen, die die Ent­wicklung einer ethischen und vertrauens­würdigen KI fördern sollen. Die praktische Um­setzung der­artiger Prinzipien erfordert jedoch ein ein­heit­liches Ver­ständnis dessen, was KI ist und woraus sie besteht, sowohl im Hin­blick auf wissen­schaftliche und techno­logische Ent­wicklungen als auch auf mögliche An­wen­dungen.


Um den Heraus­forderungen begegnen zu können, die mit der Ein­grenzung einer so kom­plexen Thematik ver­bunden sind, schlägt die Studie eine operationelle Definition von KI vor, die auf der Iden­tifizierung und Messung von Ent­wicklungen in Wissen­schaft, Algo­rithmen und Techno­logien basiert, die mit KI ein­hergehen. Die Analyse stützt sich dazu auf Infor­mationen, die in wissen­schaft­lichen Ver­öffentl­ichungen, Open-Source-Software und Patenten enthalten sind.


Wissenschaftlicher Ansatz der Studie


Der dreigleisige Ansatz der Studie setzt auf einer Aus­wahl etablierter biblio­metrischer und patent­basierter Methoden auf und wird durch ein ex­perimen­telles Ver­fahren maschinellen Lernens (ML) ergänzt, das auf eigens dafür ge­sammelten Open-Source-Software-Daten basiert:
 

  • Die Identifizierung von hinter KI-Ent­wicklungen stehender Wissen­schaft baut auf einem zwei­stufigen biblio­metrischen Ansatz auf, bei dem eine erste Gruppe von KI-relevanten Schlüssel­wörtern aus wissen­schaft­lichen Publikationen extrahiert wird, die in der Scopus®-Daten­bank des Wissen­schafts­verlags Elsevier unter KI klassifiziert sind. Das Er­gebnis wird dann durch Text-Mining-Ver­fahren und Experten­validierungen er­gänzt und ver­feinert.
  • Da KI letzt­lich in Form von Algo­rithmen imple­mentiert wird, ver­wenden die Autorinnen und Autoren Infor­mationen über so­genannte Software-Commits (d.h. Beiträge), die auf GitHub (einer Hosting-Plattform) ver­öffentlicht werden, um KI-bezogene Software-Ent­wicklungen und ‑anwendungen zu verfolgen. Solche Daten werden mit Infor­mationen aus wissen­schaft­lichen Publikationen kombiniert, die auf wichtigen KI-Konferenzen präsentiert werden, um zentrale KI-Repositorien zu identifizieren. Maschinelle Lern­ver­fahren, die anhand von Infor­mationen für den so identifizierten Kern­satz trainiert werden, lassen sich zur Unter­suchung sämt­licher Software-Beiträge in GitHub eingesetzen, um alle KI-bezogenen Repositorien zu erkennen.
  • In Patent­daten ent­haltene Infor­mationen dienen der Identifizierung und Ab­bildung KI-bezogener Erfindungen und neuer techno­logischer Ent­wicklungen, in die KI-bezogene Kom­ponenten ein­gebettet sind.

Ausgewählte Ergebnisse der Studie
 

  • Die Autorinnen und Autoren stellen eine beschleunigte Zu­nahme der Zahl von Ver­öffent­lichungen im Bereich KI zu Beginn des Jahr­tausends fest, gefolgt von einem stetigen Wachs­tum von durch­schnitt­lich 10% pro Jahr bis 2015, vor einer er­neuten Er­höhung der Zahl von Publikationen mit einem Anstieg von 23% pro Jahr. Der Anteil der KI-bezogenen Publikationen an den Gesamt­publikationen stieg bis 2018 auf über 2,2% aller Publikationen an.
  • 28% der in den Jahren 2016 bis 2018 weltweit ver­öffentl­ichten KI-bezogenen wissen­schaft­lichen Publikationen stammen von Autorinnen und Autoren mit Affi­liationen in China. Im Zeit­verlauf ist der Anteil von KI-Publikationen, die aus den EU-28, den Vereinigten Staaten und Japan stammen, im Ver­gleich zum vor zehn Jahren beo­bachteten Niveau zurück­gegangen.
  • Seit 2014 ist die Zahl der Open-Source-Software-Repositorien mit KI-Bezug etwa drei­mal so stark gewachsen wie die sonstiger Open-Source-Software.
  • Nach 2015 ist ein deut­licher Anstieg des Anteils von KI-bezogenen Er­fin­dungen an der Gesamt­zahl von Er­fin­dungen zu ver­zeich­nen. Im Jahr 2017 betrug dieser Anteil mehr als 2,3%.
  • “Neural networks/Neuronale Netzwerke” und “image processing/Bildverarbeitung” sind die am häufigsten ge­brauchten Begriffe, die in Kurz­beschrei­bungen von Patenten mit KI-Bezug auf­tauchen.
  • Bei KI-bezogenen Patenten hat sich der Bei­trag von Er­findungen aus China seit Mitte der ersten Dekade dieses Jahr­tausends mehr als ver­sechsfacht und erreichte Mitte der zweiten Dekade fast 13%.


Mehr Er­gebnisse und detaillierte Infor­mationen in der Publikation:


Stefano Baruffaldi, Brigitte van Beuzekom, Hélène Dernis, Dietmar Harhoffi, Nandan Rao, David Rosenfeld, Mariagrazia Squicciarini (2020).
Identifying and Measuring Developments in Artificial Intelligence: Making the Impossible Possible.
OECD Science, Technology and Industry Working Papers No. 2020/05.


Stefano Baruffaldi ist Affiliated Research Fellow in der Abteilung Innovation and Entrepreneurship Research und Assistant Professor an der University of Bath.

Dietmar Harhoff ist Direktor am Max-Planck-Institut für Innovation und Wettbewerb.