Hem
Utvecklingen av AIFörklaring

Deepseek skapade panik i techsektorn – men sedan då?

(Andy Wong / AP)

Under en vecka i januari skakades den amerikanska techsektorn i sina grundvalar av den kinesiska AI-uppstickaren Deepseek.

Sedan blev det tyst – men ”Open AI-dödaren” är fortfarande vid liv.

Vart har Deepseek tagit vägen?

Det må inte vara samma uppståndelse kring Deepseek nu som det var där i början av januari. Men bolaget är i allra högsta grad fortfarande aktivt. De senaste månaderna har flera nya versioner av språkmodellen kommit ut på marknaden, men ingen av dem har bedömts vara lika banbrytande som januarireleasen.

Man satsar mer på ett akademiskt fokus än på att skapa rubriker. Bolagets ingenjörer skriver hellre rapportluntor – så kallade white papers – om sin AI-utveckling än går i offentlig klinch med sina amerikanska konkurrenter, skriver flera techsajter.

Deepseek gav de amerikanska techjättarna en ordentlig smäll vid lanseringen av R1-modellen i januari. (Ahn Young-joon / AP)

Deepseek har fortfarande användare – kanske framför allt i Kina, men även i vissa kretsar i Silicon Valley, enligt BBC:s techreporter Lily Jamali.

– Massor av startups använder Deepseek fortfarande, eftersom det är så mycket billigare än jämförbara amerikanska verktyg som Chat GPT, säger hon till BBC-podden Tech Life.

Varför var techjättarna så rädda?

När Deepseek lanserade sin modell R1 i januari i år, hävdade bolaget att man lagt knappt 6 miljoner dollar på att ta fram modellen. Det är kaffepengar i AI-sammanhang: de amerikanska jättarna har öst in pengar i sin AI-utveckling och notan har inte sällan ett ansenligt antal nollor på slutet.

På grund av USA:s exportbegränsningar för Nvidias AI-chip till Kina, uppgav Deepseek att man lyckats bygga sin R1-modell på betydligt mindre avancerade och billigare chip. Modellen är dessutom open source, vilket innebär att källkoden ligger öppen och gratis för alla att ladda ner och använda.

60 miljarder dollar

Metas planerade kapitalinvesteringar under 2025, nästan direkt kopplade till bolagets AI-satsningar, enligt vd Mark Zuckerberg.

Marknaden tolkade Deepseeks framgångar som att de amerikanska bjässarna är fel ute när de erbjuder miljonlöner för att locka AI-ingenjörer, smäller upp datacenter stora som städer och köper halvledare, chip och datakraft för ofattbara belopp.

Investerare och analytiker undrade oroligt huruvida USA kommer att tappa sitt försprång inom AI-utveckling – till antagonisten Kina, dessutom.

Panik utbröt på Wall Street. Nvidias aktie rasade 17 procent och omkring 600 miljarder dollar i marknadsvärde gick upp i rök. Enligt Bloomberg var det vid tidpunkten det största raset någonsin för ett enskilt bolag.

Investerare befarade att Deepseeks resurseffektiva framställning skulle innebära tappad försäljning för Nvidia. Så har inte ännu inte skett. Snarare tvärtom. (Ng Han Guan / AP)

Men dammet la sig ganska snabbt. Sedan dess har techjättarna levererat ett par delårsrapporter, där det med all önskvärd tydlighet framgått att AI fortfarande är högsta prioritet, med investeringsbudget därefter.

Under året har Nvidia dessutom som första bolag någonsin brutit igenom både 4 000- och 5 000-miljardersvallen i värdering. Så den värsta stormen verkar med andra ord ha bedarrat.

Varför dog hajpen ut så snabbt?

Deepseek är kinesiskt, och datan lagras på servrar placerade i Kina. Det anses sannolikt problematiskt för många användare, enligt bedömare.

Det kinesiska näringslivet har ofta nära kopplingar till Kommunistpartiet, och företagen är enligt lag tvungna att dela med sig av data om staten så önskar. Det som användarna skriver in i Deep Seek löper enligt experter alltså stor risk att användas av tredje part.

För amerikanskt vidkommande är Deepseeks chipanvändning samtidigt extra intressant. I somras uppgav Financial Times att Deepseek lyckades hamstra mängder av Nvidia-chip före det amerikanska exportförbudet trädde i kraft. Dessutom cirkulerar uppgifter om att Deepseek fått tag i de mer avancerade Nvidia-chipen genom mellanhänder på andra ställen i Asien.

Den kinesiska staten – med president Xi Jinping i spetsen – har tidigare tagit i med hårdhandskarna mot techbolag som bedömts sväva för långt bort från kommunistpartiets grundvalar. (AP)

Kopplingarna till Beijing är inte heller okontroversiella för Washington. Tidigare i år avslöjade Reuters att Deepseek har ett tätt samarbete med den kinesiska militärens underrättelseoperationer. En källa uppgav då för nyhetsbyrån att Deepseek misstänks för att dela användarinformation och statistik med den kinesiska underrättelsetjänsten.

Och sedan har vi det rent tekniska: Användare på nätforumet Reddit rapporterar om att plattformen ofta hakar upp sig och tar god tid på sig att generera ett svar, en klar försämring jämfört med den tidigare versionen.

”Kanske Deepseek inte tystnade, utan snarare tystades”

Mehul Gupta, dataanalytiker

Det, i sin tur, beror på att Kommunistpartiet tvingat Deepseek att gå över till inhemska Huawei-chip i stället för Nvidias diton, uppger en källa för Financial Times. Det försenade tidtabellen för lanseringen av nästa generations språkmodell, R2, sedan Huaweis chip visat sig inte fungera lika tillförlitligt som Nvidias.

Dataanalytikern Mehul Gupta spekulerar att det till och med kan ha varit kinesiska staten som drog åt tyglarna för Deepseek efter succén med R1-modellen.

”Det kan ha skrämt Beijing lika mycket som det imponerade. Så kanske Deepseek inte tystnade, utan snarare tystades”, skriver han i en artikel på publiceringsplattformen Medium.

Vad gör Deepseek nu?

Deepseek verkar trumma på i sin egen takt, i alla fall om man får tro de bedömare som säger sig kunna se igenom de kinesiska murarna som omgärdar techbolagen.

Nyligen halverade Deepseek priset för att utnyttja språkmodellen – alltså för användare att exempelvis bygga funktioner med AI-datan. Det förvånade en del inbitna AI-entusiaster, som utgått från att driftsintäkterna är det som möjligen skulle kunna få siffrorna att gå ihop i resultaträkningen.

Deepseeks vd och grundare Liang Wenfeng. (Shutterstock)

I oktober släppte bolaget en ny modell, OCR – inklusive ett bland anhängare så viktiga white paper. Modellens spetskompetens är att den omvandlar skriven text till bilder, vilket är betydligt lättare för modellen att hantera.

Enligt Fortune innebär det en tiofaldig ökning av effektiviteten – och potentiellt ett nytt, billigare sätt för företagskunder att dra nytta av AI. OCR ”ställer en del konventionell AI-kunskap på ända”, skriver tidningen.

”Jag gillar faktiskt nya OCR:s white paper. Det är en bra OCR-modell”

Andrej Karpathy, medgrundare Open AI

OCR har till och med fått uppmärksamhet av den i AI-kretsar högt aktade ingenjören Andrej Karpathy, medgrundare till Open AI. I ett långt inlägg på X vädrar han idén att textinmatning i AI-botar kanske helt bör övergå till bildinmatning.

Även investeraren Jeffrey Emanuel ser nyttan med modellen.

– Att potentiellt få en språkmodell som kan hantera [stora mängder data samtidigt] är ganska spännande, säger han till Fortune.

Och nu i dagarna släpptes ännu en modell, inriktad på att lösa matematiska frågor på avancerad nivå, medelst rimligt resonemang. Modellen har visat sig hålla samma nivå som motsvarande modeller från amerikanska bjässar som Open AI och Google, skriver AI-sajten TLDR.

Läs mer:

Omni är politiskt obundna och oberoende. Vi strävar efter att ge fler perspektiv på nyheterna. Har du frågor eller synpunkter kring vår rapportering? Kontakta redaktionen