Jensen håller tal i samband med utnämningen till hedersdoktor. (Chan Long Hei / AP)

Nvidias vd: AI kommer att hallucinera i flera år till

Av Anders Fjellström
Publicerad: 25 nov. 2024

Det kommer att dröja flera år innan användarna kan vara helt säkra på att AI-tjänsternas svar är korrekta och inte rena påhitt. Den bedömningen gjorde Jensen Huang, vd för it-giganten Nvidia, i en intervju i Hongkong i lördags.

– Jag tror att vi är flera år ifrån att kunna göra det, och tills dess måste vi fortsätta att öka vår beräkningskraft, sa Huang enligt TT.

Huang sa att man inte ska behöva fundera över om AI-svaren är ”hallucinerade eller inte” eller ”rimliga eller inte”.

Han sa också att träningen av stora språkmodeller på data från den verkliga världen är jämförbar med att ta en universitetsexamen, men att det i båda fallen behövs mer för att få fram ny kunskap.

Nvidiachefen: I dag är svaren de bästa vi kan få fram

Huang intervjuades i samband med att han utsågs till hedersdoktor vid Hong Kong University of Science & Technology

Business Insider

bakgrund

Så fungerar stora språkmodeller (LLM)

Wikipedia (sv)

En språkmodell är en statistisk modell, det vill säga en sannolikhetsfördelning, för sekvenser av ord. Språkmodeller används i samband med artificiell intelligens (AI) för att datorers kommunikation ska efterlikna hur mänskligt språk, exempelvis mänskliga samtal, är uppbyggda. Tillämpningar kan vara att datorer ska ge svar på frågor (natural language questions), sammanfatta dokument eller generera texter av olika slag, genre och språk. En språkmodell tränas på ett textkorpus bestående av mängder med text för att "lära sig" sannolikheter för olika ord i olika språkkontext, exempelvis olika typer av dokument, eller vad som är trovärdiga svar på av användaren ställda, skriftliga frågor. En stor språkmodell (large language model, LLM) har tränats på exempelvis en stor mängd böcker och stor andel av innehållet på webben. Stora språkmodeller ligger bakom flera uppmärksammade AI-textrobotar och digitala assistenter. Några av de största och mest välkända stora språkmodellerna är: Open AI:s språkmodell GPT, som är grunden för flera applikationer: Version GPT-3 har öppen källkod och används i det programkodsgenrerande verktyget Microsoft Github Copilot, som släpptes i juni 2021. Version GPT-3.5 användes i gratisversionen av chatbotten ChatGPT, som släpptes i november 2022. Version GPT-SW3 var en modell för nordiska språk som blev tillgänglig i november 2023. Version GPT-4 är proprietär, och används i betalversionen av ChatGPT sedan mars 2023. Version GPT-4 används även i AI-assistenten Microsoft Copilot, som släpptes i februari 2023, ursprungligen under namnet Bing Copilot, och som även ingår i Microsoft Edge och i Windows 11. En version anpassad för kontorsautomation kallas Microsoft 365 Copilot. Alphabet har utvecklat flera stora språkmodeller. Gemini är en språkmodell och chatapplikation som lanserades i februari 2023 under namnet Bard. Metas LLaMA (Large Language Model Meta AI) Det franska företaget Mistral AI:s Mixtral 8x7B Stora språkmodeller som har tränats på en stor mängd källkod för datorprogram, har även visat sig lovande i att skapa nya datorprogram genom automatiskt slutförande av påbörjad kod, eller från funktionsbeskrivningar skrivna på naturligt språk. Språkmodeller har sedan länge förekommit som komponent även inom annan språkteknologi (också kallat datalingvistik) såsom optisk teckenigenkänning (OCR), handskriftsigenkänning och taligenkänning (för att säkerställa att endast rimliga ordsekvenser, som har hög sannolikhet, förutsägs), vid maskinöversättning (för att välja mellan alternativa kandidatöversättningar och för parsning) samt i samband med text mining vid informationsinhämtning.

Omni är politiskt obundna och oberoende. Vi strävar efter att ge fler perspektiv på nyheterna. Har du frågor eller synpunkter kring vår rapportering? Kontakta redaktionen

Utvecklingen av AI Nvidia Jensen Huang Data, it & högteknologi Artificiell intelligens