Chinesisches Labor Deepseek Es provozierte den ersten Silicon Valley -Freakout von 2025, nachdem Open AI -Modelle gestartet wurden, die mit den besten OpenAI, Meta- und Google -Technologie konkurrieren, die angeboten werden.
Deepseek behauptet, seine Modelle auf hocheffiziente und schnelle Weise aufgebaut zu haben, und stellt diese Modelle für einen Bruchteil der US -amerikanischen KI -Preisaufladung zur Verfügung. Entwicklung hat Schüttelte nicht nur Technologiegiganten Aber die höchsten Ebenen der US -Regierung, die China befürchtet, tritt im KI -Wettrüsten vor.
„Ich würde mich nicht wundern, wenn jetzt viele IA-Laboratorien Kriegsräume hätten“, sagte Robert Nishihara, Mitbegründer des Infrastruktur-Startups von IA Anyscale in einem Interview mit TechCrunch.
Deepseeks Aufstieg markiert einen Beugungspunkt für die KI -Landschaft in Silicon Valley. CEOs, Gründer, Forscher und Investoren von AI teilt TechCrunch mit, dass Deepsek -Modelle große Auswirkungen auf die amerikanische IA -Politik haben. Darüber hinaus sagen diese Experten, dass Modelle als Indikator für die Beschleunigungsrate der AI -Fortschritt dienen.
„Natürlich war (Deepseek) übertrieben“, sagte Ravid Shwartz-Ziv, Assistenzprofessor am Data Science Center der NYU, gegenüber TechCrunch. „Aber es ist immer noch sehr interessant und es gibt viel, was wir daraus bekommen können.“
Neue Möglichkeiten, das IA -Denken zu tun
Eine der wichtigsten Innovationen von Deepseek bei der Schaffung seines R1 -Modells war „Pure verstärkungsfähig“, ein Bewertungs- und Fehleransatz, so der CEO von Workera und der Assistenzprofessor von Stanford Kian Katanforoosh.
Katanforoosh verglich Deepseeks Vormarsch mit einem Kind, das ein heißes Gericht nicht versehentlich brannte.
„(Ein Kind) kann einen heißen Teller berühren, brennen und schnell lernen, es nicht noch einmal zu tun“, sagte Katanforoosh per Text. „Dies ist reines Verstärkungslernen – Lernen mit Versuchen und Fehlern, die auf der Methode von Deepseek basieren (…), befasst sich damit, dass das Modell nur aus Erfahrung lernen.“
Deepseek scheint mehr auf das Verstärkungslernen vertraut zu sein als in anderen staatlichen Modellen. Openai verwendete auch Verstärkungslernentechniken O1 zu entwickelnDass das Unternehmen Wochen vor Deepseek bekannt gab, kündigte R1 an. Openai’s Nächstes Modell O3 Erreicht mit viel ähnlichen Methoden eine noch bessere Leistung, aber auch zusätzliche Computer, so das Unternehmen.
Das Verstärkungslernen ist laut Katanforoosh eine der vielversprechendsten Möglichkeiten zur Verbesserung der AI -Stiftungsmodelle. Der Begriff „Fundamentmodelle“ bezieht sich normalerweise auf KI -Modelle, die in großen Datenmengen geschult wurden, wie z. B. Bilder und Webtext. Erfolg von Deepseek.
Noch vor ein paar Monaten trafen sich KI -Unternehmen Schwierigkeiten, die Leistung seiner Grundmodelle zu erhöhen. Der Erfolg von Methoden wie Verstärkungslernen und anderen, wie z. B. beaufsichtigte Feinanpassung und das Maßstab der Testzeit, weist jedoch darauf hin, dass sich der KI -Fortschritt wiedererlangt.
„Der R1 gab mir viel mehr Vertrauen in den Rhythmus des Fortschritts, der hoch bleibt“, sagte Nathan Lambert, ein Forscher bei A2, in einem Interview mit TechCrunch.
Ein Wendepunkt Für KI -Politik
R1, das auf jedem Computer heruntergeladen und ausgeführt werden kann, der den Hardwareanforderungen entspricht, entspricht oder O1 auf mehreren KI -Benchmarks besiegt. Obwohl es nicht das erste Mal ist, dass wir den engen Leistungsunterschied zwischen „geschlossenen“ Modellen wie OpenAI -Modellen und offen verfügbaren Modellen gesehen haben, führte die Geschwindigkeit, mit der Deepseek dies tat, zur Branche.
Dies kann dazu führen, dass die USA ihre Investitionen in offene oder sogar vollständig offene IA erhöhen, um mit China zu konkurrieren. Martin heiratete, General Partner von Andreessen Horowitz (A16Z), sagt TechCrunch, dass Deepseek beweist, wie „geschrieben“ die Regulierungslogik der letzten zwei Jahre war.
„Für AI denke ich, dass dies nur zeigt, dass (die Vereinigten Staaten) nicht allein in unserer technischen Eigenschaft sind“, sagte verheiratet in einem Interview. „Sehr wettbewerbsfähige Lösungen können von überall, insbesondere China, von überall her kommen. Anstatt uns Innovation zu behindern, sollten wir stark in sie investieren. Die Open Source erlaubt China nicht. Das Verbot unserer Unternehmen aus Open Source bedeutet in der Tat, dass unsere Technologie nicht so sehr vermehrt. ”
Verheiratet schien sich auf den ehemaligen Präsidenten von Biden zu beziehen Executive Order of AI hat sich kürzlich wiederholt und die Veto mit Kalifornien Bill SB 1047beide haben sich aggressiv widersetzt. A16Z argumentierte, dass beide Maßnahmen die Verhinderung von „seltsamen“ Szenarien des endgültigen Urteils der amerikanischen Innovation priorisierten. Im weiteren Sinne war Silicon Valley normalerweise erfolgreich Abdeckung der „Doom -Bewegung dort“ im Jahr 2024. Die eigentliche Sorge für AI, A16Z und andere sagten wiederholt, dass Amerika seinen Wettbewerbsvorteil gegen China verliert.
Dieses Szenario scheint angesichts von Deepseeks Aufstieg viel greifbarer zu sein.
Es ist nicht für nichts, A16Z ist stark in viele der größten Spieler offener IA -Welt investiert, einschließlich Datenbanken, Mistral- und Schwarzwaldlabors. Sie können auch eine seltsame Rolle spielen und die Trump -Regierung bei AI beraten. Ex -Prover A16Z Sriram Krishnan ist jetzt ein hochrangiger politischer Berater von Trump bei AI.
Präsident Trump sagte am Montag, dass Deepseek ein „sein sollte“aufwachenFür US -KI -Unternehmen lobte das chinesische IA -Labor für seinen offenen Ansatz. Dies entspricht sehr eng mit der Position von A16Z in der KI.
„Deepseek R1 ist die Zeit von Ai Sputnik“, sagte A16Z-Mitbegründerin Marc Andreessen in a Post in xIn Bezug auf die Einführung des Raumfahrzeugs der Sowjetunion, das die USA dazu veranlasste, ernsthaft in ihr Weltraumprogramm zu investieren.
Der Aufstieg von Deepseek scheint auch den Geist von AIs offenen Skeptikern wie Googles Ex -CEO, Eric Schmidt, verändert zu haben. Im vergangenen Jahr äußerte Schmidt besorgt über die Verbreitung von weltweit weltweit weltweiten KI -Modellen. Aber in einem am Dienstag veröffentlichten Artikel, Schmidt sagte, Deepseeks Aufstieg markiert einen „Wendepunkt“ Im Global Race AI und forderte weitere Investitionen bei American Open AI.
Blick auf die Zukunft
Es ist wichtig, Deepseek -Erfolge nicht zu übertreiben.
Zum Beispiel sind einige Analysten skeptisch gegenüber Deepseeks Behauptung, dass er eines seiner Grenzmodelle, Deepseek V3, für nur 5,6 Millionen US -Dollar – ein Kleinigkeit in der KI -Branche – mit etwa 2.000 GPUs älteren Nvidia ausgebildet hat. Das chinesische IA -Labor sprießt doch nicht über Nacht und Deepseek nicht über Nacht zweite Es verfügt über einen Bestand von über 50.000 GPUs Nvidia Hopper.
Deekseek -Modelle sind ebenfalls fehlerhaft. Nach einem Test Nach der Informationszuverlässigkeitsorganisation, Newsguard, R1, bietet R1 in 83% der Fälle ungenaue oder nicht geschmückte Antworten, wenn sie nach Nachrichten bezogen werden. Ein separater Test stellte fest, dass sich der R1 weigert, auf 85% der Warnungen im Zusammenhang mit China zu reagieren, möglicherweise eine Folge von Zensur der Regierung, für die die im Land entwickelten KI -Modelle ausgesetzt sind.
Dann gibt es IP -Diebstahlsansprüche. Offen sagt, er habe Beweise Diese Deepseek benutzte seine KI -Modelle, um seine eigenen zu trainieren, was, wenn sie wahr ist, ein Verstoß gegen OpenAIs Begriffe darstellen würde. (Openai wird offensichtlich von mehreren Teilen verklagt, weil sie angeblich Urheberrechtsverletzungen bei der Ausbildung seiner Modelle begangen haben.)
Trotzdem bewegte Deepseek die Nadel mit effizienteren Modellen – und sie innovierte. Lambert bemerkte, dass R1 im Gegensatz zu O1 seinen „Denkprozess“ für Benutzer enthüllt. Lambert merkte, dass einige Benutzer der Ansicht sind, dass das KI -Argumentationsmodell mehr ist, wenn sie ihren internen Prozess sehen, in dem „ihre Arbeit erklärt“.
Jetzt müssen wir sehen, wie Amerikas politische Formulierer und KI -Labors reagieren.