Start IT/Tech Deepseek: Alles, was Sie über die AI -Chatbot -App wissen müssen

Deepseek: Alles, was Sie über die AI -Chatbot -App wissen müssen

10
0
Deepseek löste eine wilde und unbegründete Manifestation für einige chinesische Aktien aus

Deepseek wurde viral.

Das chinesische Labor von AI Deepseek drang in dieser Woche später in das konventionelle Bewusstsein ein Ihre Chatbot -App erreichte die Spitze der Apple App Store -Diagramme. Deepseek AI -Modelle, die mit Techniken mit Computereffizienz trainiert wurden, Wall Street Analysten führten – – und Technologen – Frage, ob die USA ihre Führung in der KI -Rasse beibehalten können und ob die Nachfrage nach KI -Chips aufrechterhalten wird.

Aber woher kam Deepsek und wie ist es so schnell zum internationalen Ruhm geworden?

Deepseeks kommerzielle Herkunft

Deepseek wird von High-Flyer Capital Management unterstützt, einem chinesischen quantitativen Hedgefonds, der KI verwendet, um seine kommerziellen Entscheidungen zu informieren.

AI-Enthusiastin Liang Wenfeng hat 2015 den High-Flyer mit finanziert. Wenfeng, der begonnen hätte, sich an Verhandlungen zu beteiligen Implementierung von AI -Algorithmen.

Im Jahr 2023 begann High-Flyer Deepseek als Labor, das sich der Erforschung von IA-Tools widmete, die von seinem Finanzgeschäft getrennt waren. Mit High-Flyer als einer seiner Investoren wandte sich das Labor in seinem eigenen Unternehmen, auch Deepseek, ein.

Ab dem ersten Tag hat Deepseek seine eigenen Rechenzentrumcluster für das Modelltraining aufgebaut. Aber wie andere KI -Unternehmen in China, Deepseek wurde von den US -Exportverbots auf Hardware betroffen. Um eines seiner neuesten Modelle auszubilden, war das Unternehmen gezwungen, die NVIDIA H800 -Chips, eine weniger leistungsstarke Version eines Chips, den H100, für amerikanische Unternehmen zur Verfügung zu stellen.

Es wird gesagt, dass Deepseeks technisches Team jung verzerrt. Die Firma angeblich aggressiv Rekruten Doktorandenforscher der KI der besten chinesischen Universitäten. Deepseek stellt auch Menschen ohne Informationsgeschichte ein Laut der New York Times helfen Sie Ihrer Technologie besser zu verstehen.

Starke Modelle von Deepseek

Deepseek präsentierte seinen ersten Satz von Models-Deepseek-Coder, Deepseek LLM und Deepseek Chat-In November 2023. Aber es war nicht einmal der vergangene Frühjahr, als das Startup seine Familie der Deepseek-V2-Modelle der nächsten Generation auf den Markt brachte, die die Branche, die die Branche, die Branche hat KI begann aufmerksam.

Deepseek-V2, ein Textanalyse-System und ein allgemeines Gebrauchsbild, war bei mehreren AI-E-Benchmarks gut zu tun als vergleichbare Modelle zu dieser Zeit. Er zwang den Deepseek -Inlandswettbewerb, einschließlich Bytedance und Alibaba, um die Nutzungspreise einiger ihrer Modelle zu senken und andere völlig frei zu machen.

Deepsek-V3Im Dezember 2024 eingeführt, fügte es nur Deepseeks Bekanntheit hinzu.

Laut internen Deepseek -Benchmark -Tests übertrifft Deepseek V3 Downloads für Downloads und offen als Ziel erhältlich Lama und „geschlossene“ Modelle, auf die nur durch eine API zugegriffen werden kann, wie z. Gpt-4o.

Ebenso beeindruckend ist Deepseeks „Argumenting“ -Modell. Im Januar ins Leben gerufen, sagt Deepseek R1 läuft sowie das O1 -Modell von Openai in Benchmarks -chave -Chave.

Als Argumentationsmodell quietscht der R1 effektiv, um einige der Fallen zu vermeiden, die normalerweise Modelle schießen. Die Argumentationsmodelle dauern im Vergleich zu einem typischen nicht farmenden Modell etwas mehr Sekunden bis zu Lösungen. Der Vorteil ist, dass sie in Bereichen wie Physik, Naturwissenschaften und Mathematik tendenziell zuverlässiger sind.

Es gibt jedoch einen Nachteil für R1, Deepsek V3 und andere Deepsek -Modelle. Als KI, das auf Chinesisch entwickelt wurde Benchmarking nach Chinas Internetregulierungsbehörde, um sicherzustellen, dass ihre Antworten „die wichtigsten sozialistischen Werte umfassen“. In der Deepseek Chatbot -App wird beispielsweise R1 keine Fragen zum Tiananmen Square oder Taiwans Autonomie beantworten.

Ein disruptiver Ansatz

Wenn Deepseek ein Geschäftsmodell hat, ist unklar, was dieses Modell genau ist. Das Unternehmen hält seine Produkte und Dienstleistungen weit unter dem Marktwert – und verteilt andere kostenlos.

Die Art und Weise, wie Deepseek sagt, haben Fortschritte in der Effizienz ermöglicht, extreme Kostenwettbewerbsfähigkeit aufrechtzuerhalten. Einige Experten Disput Die Zahlen, die das Unternehmen jedoch bereitgestellt hat.

Was auch immer der Fall sein mag, Entwickler haben Deepseek -Modelle übernommen, die nicht Open Source sind, wie der Satz allgemein verstanden wird, sondern im Rahmen von zulässigen Lizenzen verfügbar sind, die die kommerzielle Nutzung ermöglichen. Laut Clem Delangha, dem CEO von Hugging the Gesicht, einer der Plattformen, die Modelle von Deepseek veranstalten, veranstaltet Entwickler im Umarmungsgesicht haben über 500 „Derivative“ -Modelle von R1 geschaffen die 2,5 Millionen kombinierten Downloads angesammelt haben.

Deepseeks Erfolg mit größeren und etablierteren Konkurrenten war beschrieben als „dort steigt“ Und Eröffnung „eine neue Ära des Hinterns von dort“. Der Erfolg des Unternehmens war zumindest teilweise verantwortlich für Der Aktienkurs von Nvidia fiel am Montag um 18% um 18%und für eine öffentliche Antwort provozieren Vom OpenAI -CEO Sam Altman.

Was Deepseeks Zukunft haben mag, ist es nicht klar. Verbesserte Modelle sind Daten. Aber die US -Regierung scheint zu sein vorsichtig zu werden, was es für einen fremden Einfluss schädlich hält.

Quelle link