Deepseek wurde viral.
Das chinesische Labor von AI Deepseek drang in dieser Woche später in das konventionelle Bewusstsein ein Ihre Chatbot -App erreichte die Spitze der Apple App Store -Diagramme (und Google Play auch). Deepseek AI -Modelle, die mit Techniken mit Computereffizienz trainiert wurden, Wall Street Analysten führten – – und Technologen – Frage, ob die USA ihre Führung in der KI -Rasse beibehalten können und ob die Nachfrage nach KI -Chips aufrechterhalten wird.
Aber woher kam Deepsek und wie ist es so schnell zum internationalen Ruhm geworden?
Deepseeks kommerzielle Herkunft
Deepseek wird von High-Flyer Capital Management unterstützt, einem chinesischen quantitativen Hedgefonds, der KI verwendet, um seine kommerziellen Entscheidungen zu informieren.
KI -Enthusiast Liang Wenfeng Mit finanzierten High-Flyer im Jahr 2015. Wenfeng, der an der University of Zhejiang an Verhandlungen als Student interessiert wäre, startete 2019 einen Hedge-Hintergrund, der sich auf die Entwicklung und Umsetzung von Algorithmen konzentrierte von ia.
Im Jahr 2023 begann High-Flyer Deepseek als Labor, das sich der Erforschung von IA-Tools widmete, die von seinem Finanzgeschäft getrennt waren. Mit High-Flyer als einer seiner Investoren wandte sich das Labor in seinem eigenen Unternehmen, auch Deepseek, ein.
Ab dem ersten Tag hat Deepseek seine eigenen Rechenzentrumscluster für das Modelltraining aufgebaut. Aber wie andere KI -Unternehmen in China, Deepseek wurde von den US -Exportverbots auf Hardware betroffen. Um eines seiner neuesten Modelle auszubilden, war das Unternehmen gezwungen, die NVIDIA H800 -Chips, eine weniger leistungsstarke Version eines Chips, den H100, für amerikanische Unternehmen zur Verfügung zu stellen.
Es wird gesagt, dass Deepseeks technisches Team jung verzerrt. Die Firma angeblich aggressiv Rekruten Doktorandenforscher der KI der besten chinesischen Universitäten. Deepseek stellt auch Menschen ohne Informationsgeschichte ein Laut der New York Times helfen Sie Ihrer Technologie besser zu verstehen.
Starke Modelle von Deepseek
Deepseek präsentierte seinen ersten Satz von Models-Deepseek-Coder, Deepseek LLM und Deepseek Chat-In November 2023. Aber es war nicht einmal der vergangene Frühjahr, als das Startup seine Familie der Deepseek-V2-Modelle der nächsten Generation auf den Markt brachte, die die Branche, die die Branche, die Branche hat KI begann aufmerksam.
Deepseek-V2, ein Textanalyse-System und ein allgemeines Gebrauchsbild, war bei mehreren AI-E-Benchmarks gut zu tun als vergleichbare Modelle zu dieser Zeit. Er zwang den Deepseek -Inlandswettbewerb, einschließlich Bytedance und Alibaba, um die Nutzungspreise einiger ihrer Modelle zu senken und andere völlig frei zu machen.
Deepsek-V3Im Dezember 2024 eingeführt, fügte es nur Deepseeks Bekanntheit hinzu.
Laut internen Deepseek -Benchmark -Tests übertrifft Deepseek V3 Downloads für Downloads und offen als Ziel erhältlich Lama und „geschlossene“ Modelle, auf die nur durch eine API zugegriffen werden kann, wie z. Gpt-4o.
Ebenso beeindruckend ist Deepseeks „Argumenting“ -Modell. Im Januar ins Leben gerufen, sagt Deepseek R1 läuft sowie das O1 -Modell von Openai in Benchmarks -chave -Chave.
Als Argumentationsmodell quietscht der R1 effektiv, um einige der Fallen zu vermeiden, die normalerweise Modelle schießen. Die Argumentationsmodelle dauern im Vergleich zu einem typischen nicht farmenden Modell etwas mehr Sekunden bis zu Lösungen. Der Vorteil ist, dass sie in Bereichen wie Physik, Naturwissenschaften und Mathematik tendenziell zuverlässiger sind.
Es gibt jedoch einen Nachteil für R1, Deepsek V3 und andere Deepsek -Modelle. Als KI, das auf Chinesisch entwickelt wurde Benchmarking nach Chinas Internetregulierungsbehörde, um sicherzustellen, dass ihre Antworten „die wichtigsten sozialistischen Werte umfassen“. In der Deepseek Chatbot -App wird beispielsweise R1 keine Fragen zum Tiananmen Square oder Taiwans Autonomie beantworten.
Ein disruptiver Ansatz
Wenn Deepseek ein Geschäftsmodell hat, ist unklar, was dieses Modell genau ist. Das Unternehmen hält seine Produkte und Dienstleistungen weit unter dem Marktwert – und verteilt andere kostenlos.
Die Art und Weise, wie Deepseek sagt, haben Fortschritte in der Effizienz ermöglicht, extreme Kostenwettbewerbsfähigkeit aufrechtzuerhalten. Einige Experten Disput Die Zahlen, die das Unternehmen jedoch bereitgestellt hat.
Was auch immer der Fall sein mag, Entwickler haben Deepseek -Modelle übernommen, die nicht Open Source sind, wie der Satz allgemein verstanden wird, sondern im Rahmen von zulässigen Lizenzen verfügbar sind, die die kommerzielle Nutzung ermöglichen. Laut Clem Delangha, dem CEO von Hugging the Gesicht, einer der Plattformen, die Modelle von Deepseek veranstalten, veranstaltet Entwickler im Umarmungsgesicht haben über 500 „Derivative“ -Modelle von R1 geschaffen die 2,5 Millionen kombinierten Downloads angesammelt haben.
Deepseeks Erfolg mit größeren und etablierteren Konkurrenten war beschrieben als „dort steigt“ Und „Überdatiert.“ Der Erfolg des Unternehmens war zumindest teilweise verantwortlich für Der Aktienkurs von Nvidia fiel am Montag um 18% um 18%und für eine öffentliche Antwort provozieren Vom OpenAI -CEO Sam Altman.
Microsoft kündigte an, dass Deepseek für seinen Azure AI Casting Service erhältlich istMicrosofts Plattform, die KI für Unternehmen unter einem einzigen Banner zusammenbringt. Als CEO Mark Zuckerberg nach Deepseeks Auswirkungen auf die KI der KI -Ausgaben während seines ersten Trimesters gefragt wurde, sagte CEO Mark Zuckerberg KI -Infrastrukturausgaben bleiben ein „strategischer Vorteil“. zum Ziel.
Was Deepseeks Zukunft haben mag, ist es nicht klar. Verbesserte Modelle sind Daten. Aber die US -Regierung scheint zu sein vorsichtig zu werden, was es für einen fremden Einfluss schädlich hält.
TechCrunch hat einen Newsletter, der sich auf KI konzentriert! Abonnieren Sie hier Um es jeden Mittwoch in Ihren Eingangsbox zu bringen.
Diese Geschichte wurde ursprünglich am 28. Januar veröffentlicht und wird kontinuierlich mit weiteren Informationen aktualisiert.