Lernen als Produktionsprozess – eine Neulektüre
Kenneth J. Arrows 1962 erschienener Aufsatz „The Economic Implications of Learning by Doing“ ist ein Gründungstext der modernen Wachstumstheorie – und wird als solcher erstaunlich selten gelesen. Die Rezeption folgt einem bekannten Muster: Der Text gilt als Vorläufer, als Steinbruch für spätere Formalisierungen, nicht als eigenständige theoretische Leistung. Romer und Lucas werden zitiert, Arrow bestenfalls als Fußnote erwähnt. Das ist nicht nur historiographisch ungenau, sondern verdeckt, was an Arrows Modell analytisch produktiv und bis heute nicht eingeholt ist. Dass ausgerechnet die Verbreitung generativer KI einige seiner Grundannahmen unter Druck setzt, seine Externalitätsanalyse in neuem Licht erscheinen lässt – und dass Alvin Tofflers Gegenkonzept des Unlearning die blinde Seite von Arrows Lernkurve sichtbar macht –, gibt einer Neulektüre gegenwärtig besonderes Gewicht.
I. Die Ausgangsfrage: Was erklärt Wachstum?
Arrows Einstieg ist präzise: Die neoklassische Wachstumstheorie – in ihrer Solow-Variante – behandelt technischen Fortschritt als exogene Variable, als Zeittrend, der in die Produktionsfunktion eingeführt wird, ohne dass erklärt würde, woher er kommt. Abramovitz und Solow hatten empirisch gezeigt, dass Kapitalakkumulation den weit überwiegenden Teil des beobachteten Produktivitätswachstums nicht erklären kann. Das Residuum – der „Solow-Rest“ – ist im Grunde eine Eingeständnisformel: Wir wissen nicht, was Wachstum antreibt.
Arrow löst dieses Problem nicht durch Rückgriff auf exogene Technologieschocks, sondern durch eine Endogenisierung des Lernens selbst. Seine Kernthese: Wissen entsteht durch Produzieren. Nicht durch Forschen, nicht durch Bildungsinvestitionen (die er ausdrücklich als Erweiterungsfeld benennt), sondern durch die wiederholte, akumulierende Praxis der Produktion selbst. Erfahrung ist keine Metapher, sondern eine ökonomisch präzise Größe – die kumulative Bruttoinvestition G.
II. Das Modell und seine strukturelle Eigenheit
Die entscheidende Modellentscheidung ist die Wahl von G – kumulativer Bruttoinvestition – als Erfahrungsmaß, nicht Output oder Zeit. Das ist keine technische Spitzfindigkeit. Arrow begründet die Wahl theoretisch: Lernen erfordert veränderte Stimuli. Wiederholung identischer Aufgaben führt zu abnehmenden Grenzerträgen beim Wissenszuwachs. Neue Maschinen verändern das Produktionsumfeld; sie erzwingen neue Anpassungsleistungen und setzen damit Lernprozesse in Gang. Lernen ist embodied – es materialisiert sich in neuen Kapitalgütern, nicht in einem frei zirkulierenden, kapitalgutunabhängigen Wissensstock.
Die resultierende Produktionsfunktion weist zunehmende Skalenerträge in G und L auf. Das ist im neoklassischen Rahmen problematisch: Zunehmende Skalenerträge kollidierten üblicherweise mit Gleichgewichtspreisbildung und Verteilungstheorie. Arrow löst das Paradox, indem er zwischen privater und sozialer Grenzproduktivität der Investition unterscheidet. Der einzelne Investor internalisiert die Lerneffekte seiner Investition auf zukünftige Produktivitätszuwächse nicht – sie sind extern, nicht-appropriierbar, nicht marktgängig. Der Wettbewerb produziert deshalb systematisch zu wenig Investition.
III. Arrow und die endogene Wachstumstheorie: Genealogie und Differenz
Paul Romer hat in seinen Arbeiten ab 1986 und 1990 das Programm einer endogenen Wachstumstheorie explizit formuliert. Sein Ausgangspunkt ist derselbe wie Arrows: das Solow-Residuum, die Unzulänglichkeit exogener Technologieparameter. Aber die theoretische Architektur ist eine andere.
Bei Romer ist Wissen ein nicht-rivales Gut, das durch Forschung und Entwicklung akkumuliert wird. Wachstum wird durch bewusste Innovationsinvestitionen getragen, die in unvollkommen kompetitiven Märkten appropriierbar sind – durch Monopolrenten auf neue Zwischenprodukte oder neue Ideen. Das Modell ist intentional: Unternehmen entscheiden sich, in Wissen zu investieren, weil sie Renten erwarten.
Arrow hingegen konzipiert Lernen als Nebenprodukt. Niemand investiert, um zu lernen; Lernen entsteht als unbeabsichtigtes Resultat von Produktionsentscheidungen, die anderen Zwecken folgen. Die epistemische Grundstruktur ist verschieden: Romer modelliert Wissen als Resultat intentionaler Ressourcenallokation, Arrow als emergentes Phänomen kumulierter Praxis.
Robert Lucas‘ Humankapitalmodell von 1988 nimmt eine Mittelposition ein. Lernen ist bei Lucas ebenfalls Nebenprodukt – „learning by doing“ im Produktionsprozess –, aber der Trägervehikel ist Humankapital, nicht embodied technical change in Kapitalgütern. Der Unterschied ist nicht trivial: Bei Arrow akkumuliert Wissen in der Maschinengeneration, bei Lucas im Individuum. Das hat Implikationen für Mobilität, Diffusion und die institutionellen Voraussetzungen, unter denen Lerneffekte gesellschaftlich verfügbar werden.
IV. Was Arrow über Romer und Lucas hinaus leistet
Drei Aspekte von Arrows Modell verdienen besondere Aufmerksamkeit, weil sie in der späteren endogenen Wachstumstheorie entweder verloren gegangen oder systematisch unterschätzt wurden.
Erstens: Die Unterscheidung von Brutto- und Nettoinvestition. In der Standardbetrachtung interessiert Ökonomen vor allem die Nettoinvestition – was nach Abzug des Verschleißes an neuem Kapital übrig bleibt. Arrow dreht diese Perspektive um. Was zählt, ist die Gesamtheit der neu produzierten Maschinen, also die Bruttoinvestition – unabhängig davon, ob sie altes Kapital ersetzt oder ergänzt. Der Grund: Lernen entsteht nicht dadurch, dass mehr Kapital vorhanden ist, sondern dadurch, dass neue Maschinen gebaut und eingesetzt werden. Abschreibung ist in diesem Bild kein bloßer Verlust, sondern der Mechanismus, der ältere Maschinen aus dem Verkehr zieht und neueren, lernintensiveren Platz macht. Wer Schumpeter kennt, hört hier ein Echo der schöpferischen Zerstörung – Arrow macht es nicht explizit, aber die Strukturähnlichkeit ist unübersehbar.
Zweitens: Der Steady-State mit rationalen Erwartungen. Arrow fragt, ob es einen stabilen Wachstumspfad geben kann, auf dem sich die Erwartungen der Unternehmen und die tatsächliche Entwicklung der Wirtschaft wechselseitig bestätigen. Die Antwort ist ja – und das Ergebnis hat eine verblüffende Ähnlichkeit mit Solow: Auch bei Arrow werden die langfristigen Wachstumsraten letztlich durch Bevölkerungswachstum und technologische Parameter bestimmt, nicht durch das Sparverhalten. Sparen und Investieren beeinflussen nur das Niveau – wie reich eine Gesellschaft zu einem gegebenen Zeitpunkt ist –, nicht die Geschwindigkeit, mit der sie langfristig wächst. Der entscheidende Unterschied zu Solow liegt im Mechanismus: Dort ist technischer Fortschritt eine externe Vorgabe; hier entsteht er aus dem Produktionsprozess selbst.
Drittens: Das Wohlfahrtsdefizit des Wettbewerbs. Wer in neue Maschinen investiert, lernt – aber er ist nicht der Einzige, der davon profitiert. Die Erfahrungen, die im Produktionsprozess entstehen, fließen in das allgemeine technische Wissen ein, auf das spätere Investoren zurückgreifen können, ohne dafür zu zahlen. Kein Unternehmen kann sich diesen Lerneffekt vollständig sichern; er entweicht, wie Arrow es nennt, als Externalität in die Wirtschaft. Die Konsequenz ist ökonomisch zwingend: Weil der einzelne Investor nur den Teil des Nutzens seiner Investition einstreicht, den er selbst behält, investiert er weniger, als gesellschaftlich sinnvoll wäre. Arrow zeigt das nicht als Meinungsäußerung, sondern als formales Ergebnis: Vergleicht man das Marktergebnis mit dem, was eine Gesellschaft bei optimaler Steuerung ihrer Ressourcen erreichen könnte, ist die Investitionsquote im Wettbewerb systematisch zu niedrig. Romer übernimmt diese Grundintuition, zieht aber eine andere politische Schlussfolgerung: Nicht die Investition allgemein sollte gefördert werden, sondern Unternehmen sollten besser in der Lage sein, ihr neu erzeugtes Wissen zu schützen – durch Patente und temporäre Monopolstellungen, die den Anreiz zur Wissensinvestition wiederherstellen. Arrow selbst geht diesen Weg noch nicht; sein Modell legt näher, dass der Staat Investitionen direkt subventionieren sollte, als dass er Eigentumsrechte an Wissen stärken müsste.
V. Grenzen und offene Flanken
Arrow selbst benennt die Grenzen seines Modells mit bemerkenswerter Klarheit. Das Lernen findet in seinem Modell ausschließlich in der Kapitalgüterindustrie statt – eine Einschränkung, die er selbst als unrealistisch markiert. Der „Horndal-Effekt“ – Produktivitätssteigerung in einem schwedischen Eisenwerk über 15 Jahre ohne jede Neuinvestition – zeigt, dass Lernen auch bei konstanter Kapitalausstattung stattfindet. Das deutet auf Lernprozesse in der Nutzung, nicht nur in der Produktion von Kapitalgütern – ein Befund, der die Grenzen des embodiment-Paradigmas aufzeigt.
Zudem bleibt die Diffusion von Wissen untheoretisiert. In Arrows Modell ist Wissen zwar nicht-appropriierbar, aber auch nicht weiter spezifiziert hinsichtlich seiner Übertragungsbedingungen. Wer lernt von wem, unter welchen sozialen und institutionellen Voraussetzungen – das bleibt offen. Hier liegt der Anschluss an North: Institutionen als Transmissionsriemen von Wissen und als Schutz gegen dessen Zerstreuung.
VI. Arrow und die generative KI: Ein Modell unter neuem Druck
Dass Arrows Aufsatz aus dem Jahr 1962 stammt, macht seine Konfrontation mit generativer KI umso aufschlussreicher – nicht weil das Modell die Gegenwart antizipiert hätte, sondern weil die Reibungspunkte zeigen, wo seine Grundannahmen tragen und wo sie brechen.
Das embodiment-Prinzip gerät als erstes unter Druck. Bei Arrow ist Lernen untrennbar an neue Kapitalgüter gebunden: Wissen materialisiert sich in Maschinen, zirkuliert nicht frei. Generative KI bricht genau diese Kopplung auf. Ein großes Sprachmodell lernt nicht durch den Einsatz einer bestimmten Maschine, sondern aus der aggregierten Textproduktion ganzer Gesellschaften – und gibt das so gewonnene Wissen dann als praktisch nicht-rivales Gut an beliebig viele Nutzer ab. Das ist strukturell näher an Romer als an Arrow: Wissen als allgemeines Gut, das sich vom Produktionsprozess einzelner Unternehmen ablöst.
Zugleich kehrt Arrows Externalitätsproblem wieder – aber in verschärfter und umgekehrter Form. Bei Arrow entweicht der Lerneffekt vom Investor in die Wirtschaft: Wer heute investiert, macht morgen andere produktiver, ohne dafür entlohnt zu werden. Bei generativer KI liegt der Mechanismus spiegelbildlich: Wer Texte, Code oder Bilder produziert und ins Netz stellt, liefert Trainingsdaten, aus denen Modellbetreiber Lerneffekte ziehen – ohne die Datenproduzenten zu kompensieren. Das Wohlfahrtsdefizit, das Arrow für Investoren beschreibt, trifft hier die Erzeuger von Wissen und Ausdrucksformen. Die Nicht-Appropriierbarkeit hat die Seiten gewechselt.
Was Arrows Modell hingegen strukturell nicht erfasst, ist der Horndal-Effekt in seiner modernen Potenz. Arrow selbst benennt als Grenze seines Modells, dass Lernen bei ihm nur durch neue Investitionen entsteht, nicht durch die Nutzung bestehender Anlagen. Generative KI macht genau das zum Regelfall: Modelle verbessern sich durch Rückmeldungen ihrer Nutzer, durch Finetuning, durch den laufenden Betrieb – ohne dass neue Kapitalgüter produziert werden müssten. Lernen löst sich vom Investitionszyklus, den Arrow als konstitutiv betrachtet. Das ist keine Widerlegung, aber eine Überschreitung: Arrows Modell beschreibt eine notwendige, aber keine hinreichende Bedingung für das Verständnis von Wissensentstehung in KI-gestützten Ökonomien.
VII. Unlearning by Doing: Die blinde Seite der Lernkurve
Arrow selbst legt den Ausgangspunkt: Lernen durch Wiederholung identischer Aufgaben unterliegt abnehmenden Grenzerträgen. Die Lernkurve flacht ab. Seine Schlussfolgerung daraus ist technisch – neue Maschinen setzen neue Stimuli, halten die Kurve in Bewegung. Was er nicht thematisiert, ist die komplementäre Bewegung: dass akkumulierte Erfahrung nicht nur abnehmende Erträge bringt, sondern aktiv zum Hindernis werden kann, sobald sich die Produktionsumgebung grundlegend verändert.
Alvin Toffler hat diesen Gedanken in „Future Shock“ und „The Third Wave“ zum zentralen Kompetenzproblem der Moderne erklärt. In einer Welt beschleunigten Wandels, so Toffler, ist nicht das Lernen die entscheidende Fähigkeit, sondern das Unlearning – die Bereitschaft und Fähigkeit, Erlerntes aufzugeben: Routinen, Kategorien, Geschäftsmodelle, institutionelle Selbstverständlichkeiten. Wer nur lernt, optimiert auf einem Pfad, der obsolet wird. Unlearning ist die Voraussetzung dafür, einen neuen Pfad überhaupt betreten zu können.
In Arrows Modell gibt es dafür keinen Platz. Kumulative Bruttoinvestition G kann nicht sinken – sie akkumuliert per Definition. Erfahrung kann in seinem Rahmen nicht entwertet werden, nur unterschiedlich schnell wachsen. Das ist keine Schwäche des Modells für die Welt, die Arrow beschreibt; es ist eine Grenze, die sichtbar wird, sobald struktureller Wandel nicht mehr als Sonderfall, sondern als Normalzustand gilt.
Generative KI verschärft genau diese Spannung. Sie entwertet etablierte Kompetenzprofile nicht am Ende langer Zyklen, sondern innerhalb von Produktgenerationen. Qualifikationshierarchien, die über Jahre durch learning by doing aufgebaut wurden – in der Sachbearbeitung, im mittleren Management, in wissensintensiven Dienstleistungen –, verlieren ihren Vorsprung schneller, als neue Lernkurven sie ersetzen können. Was zählt, ist nicht mehr die Tiefe akkumulierter Erfahrung, sondern die Geschwindigkeit, mit der überholte Muster aufgegeben und neu kalibriert werden können.
Das ist wachstumstheoretisch folgenreich. Arrows Modell legt nahe, dass gesellschaftlich zu wenig investiert wird – weil Lernexternalitäten nicht appropriierbar sind. Tofflers Ergänzung lautet: Gesellschaften, die nicht unlernen können, investieren in die falsche Richtung. Das Marktversagen ist dann nicht nur quantitativ – zu wenig Investition –, sondern qualitativ: zu viel Beharrung auf Pfaden, deren Lernkurven bereits ausgereizt sind.
VIII. Lektüreertrag
Arrows „Learning by Doing“ ist kein antiquiertes Modell, das durch Romer überholt oder durch generative KI obsolet geworden wäre. Es ist ein theoretisches Instrument, das eine spezifische Frage präzise beantwortet: Wie entsteht Produktivitätswachstum endogen aus dem Produktionsprozess selbst, ohne intentionale Wissensinvestition? Die Antwort – durch kumulierte Erfahrung, gebunden an neue Kapitalgüter, als Externalität nicht marktgängig – ist analytisch distinkt von den Antworten, die Romer und Lucas geben, und sie beschreibt Strukturen, die in veränderter Form auch in der gegenwärtigen KI-Ökonomie wiederkehren.
Die theoriegeschichtliche Pointe bleibt: Arrow liefert das Fundament, auf dem die endogene Wachstumstheorie errichtet wurde, aber er liefert es in einer Form, die bestimmte Weichenstellungen der späteren Theorie nicht teilt – und die heute, unter den Bedingungen generativer KI, neu zu lesen ist.
Ralf Keuper
Kenneth J. Arrow: „The Economic Implications of Learning by Doing“, Review of Economic Studies, Vol. 29, No. 3, Juni 1962, S. 155–173.
