OpenAI:s SearchGPT, Mistral Large 2 och de senaste AI-genombrotten

Utforska de senaste genombrottet inom AI, inklusive OpenAI:s SearchGPT, Mistral Large 2 och Google DeepMinds matematiska problemlösningsförmåga. Dyk in i den utvecklande landskapet av stora språkmodeller och deras inverkan på AI:s framtid.

5 februari 2025

Upptäck de senaste framstegen inom AI-världen, från OpenAIs banbrytande SearchGPT-prototyp till Mistral Large 2:s imponerande funktioner och AlphaProofs dominans inom lösning av komplexa matematiska problem. Håll dig uppdaterad och utforska de banbrytande innovationer som formar framtiden för artificiell intelligens.

OpenAI:s SearchGPT - En ny prototyp för söknings-AI
Mistral Large 2 - En kraftfull AI-modell
EU-tillsynsmyndigheter begränsar åtkomsten till Meta:s multimodala Llama-AI
Stable Audio Open - En text-till-ljud-modell
GPT-4 Voice kommer snart
Open AI står inför finansiella utmaningar
AlphaProof - Ett AI-system för att lösa matematiska problem

OpenAI:s SearchGPT - En ny prototyp för söknings-AI

OpenAI har meddelat lanseringen av en ny prototyp som kallas SearchGPT, som syftar till att kombinera styrkan i deras AI-modeller med information från webben för att ge snabba och aktuella svar med tydliga och relevanta källor.

Den här nya sökfunktionen är utformad för att vara en direkt konkurrent till tjänster som Perplexity, som för närvarande använder ChatGPT som sin språkmodell. OpenAIs beslut att lansera en sökfokuserad produkt är ett betydande steg, eftersom det utgör en direkt utmaning mot traditionella sökmotorer som Google.

De viktigaste höjdpunkterna i SearchGPT inkluderar:

Snabba och aktuella svar: Prototypen är utformad för att snabbt och direkt svara på användarfrågor och tillhandahålla uppdaterad information från webben.
Relevanta källor: SearchGPT kommer att ge användarna tydliga länkar till de relevanta källor som den har använt för att formulera sina svar, vilket möjliggör ytterligare utforskning.
Konversationell interaktion: Användarna kommer att kunna ställa följdfrågor och bygga vidare på den delade kontexten med varje fråga, likt en konversation med en person.
Ren gränssnitt: Prototypen har ett enkelt och intuitivt gränssnitt, vilket gör det lätt för användarna att interagera med sökfunktionaliteten.

Mistral Large 2 - En kraftfull AI-modell

Mistral, AI-forskningsföretaget, har nyligen meddelat lanseringen av Mistral Large 2, den nya generationen av deras flaggskeppsmodell. Jämfört med sin föregångare är den nya versionen betydligt mer kapabel inom områden som språkgenerering, matematik och resonemang. Den ger också mycket starkare flerspråkigt stöd och avancerade funktionsanropsfunktioner.

Benchmarktestresultat visar att Mistral Large 2 presterar exceptionellt bra, med en genomsnittlig kodgenereringsnoggrannhet på 76,9%, vilket endast är något lägre än den imponerande 77,9% som uppnås av den kraftfulla GPT-4-modellen. Intressant nog har denna högpresterande modell mycket färre parametrar än den större Llama 3.1 405B-modellen, vilket demonstrerar effektiviteten och kapabiliteten i Mistrals teamarbete.

Mistral Large 2 är utformad för enfådig inferens med fokus på applikationer som kräver långa kontextfönster. Den stöder dussintals språk och har ett kontextfönster på 128k tokens. Även om modellen släpps under Mistrals forskningslicens, som begränsar dess användning till forsknings- och icke-kommersiella ändamål, är det fortfarande en spännande utveckling inom avancerade språkmodeller.

EU-tillsynsmyndigheter begränsar åtkomsten till Meta:s multimodala Llama-AI

Meta har meddelat att de inte kommer att släppa sin multimodala version av Llama AI-modellen i Europeiska unionen på grund av regulatoriska bekymmer. Detta beslut kommer att förhindra europeiska företag från att få tillgång till och utnyttja de avancerade multimodala funktionerna i Llama 3.1-modellen.

Den främsta anledningen som anges till detta drag är den "oförutsägbara naturen i den europeiska regulatoriska miljön" kring AI-teknologier. EU har nyligen fastställt efterlevnadsfrister för sin strikta nya AI-lag, som kommer att kräva att teknikföretag som verkar i EU följer regler kring upphovsrätt, transparens och användning av AI för tillämpningar som förutsägande polisverksamhet.

Denna regulatoriska miljö har lett till att Meta stoppar lanseringen av den multimodala Llama-modellen i EU, trots att modellen görs tillgänglig under en öppen licens. Beslutet följer ett liknande drag av Apple, som sade att de sannolikt skulle utesluta EU från lanseringen av sin Apple Intelligence-funktion på grund av oro kring Digital Markets Act.

Omöjligheten att få tillgång till den multimodala Llama-modellen är ett betydande bakslag för europeiska företag och forskare som var ivriga att utnyttja den avancerade kapaciteten hos denna teknik. Den multimodala naturen hos Llama 3.1-modellen skulle ha möjliggjort integrering av text, bilder och andra modaliteter, vilket öppnar upp ett brett spektrum av potentiella tillämpningar.

Stable Audio Open - En text-till-ljud-modell

Stability AI har meddelat lanseringen av forskningsrapporten för Stable Audio Open, en öppen källkods-text-till-ljud-modell. Denna modell genererar högkvalitativ stereoljud på 44,1 kHz från textuppmaningar, vilket gör den perfekt för att syntetisera realistiska ljud och fältinspelningar.

Modellen körs på konsumentklassade GPU:er, vilket gör den tillgänglig för akademiskt och konstnärligt bruk. Den kan generera upp till 47 sekunder ljud, och modellen tränades med nästan 500 000 licensierade inspelningar från källor som Freesound och Free Music Archive.

Användare kan finjustera modellen lokalt med en 6000 GPU, och modellen stöder ett brett utbud av ljudgenereringsanvändningsfall, från ljudet av regn som träffar ett tak till upplivande hiphop-trumslyngor och ljudlogotyper.

Denna lansering från Stability AI är en spännande utveckling inom området för text-till-ljud-generering, vilket ger ett kraftfullt och tillgängligt verktyg för skapare och forskare.

GPT-4 Voice kommer snart

Enligt artikeln planerar OpenAI att göra de avancerade röstfunktionerna i GPT-4 tillgängliga för utvalda grupper av användare i slutet av denna månad. Författaren ser fram emot denna utveckling och planerar att testa det nya röstläget så snart han får tillgång till det.

Artikelns källa är ett tweet från Sam Altman, VD för OpenAI, som svarade på en användares fråga om när röstläget skulle bli tillgängligt. Altman sade att alfaversionen kommer att starta senare denna månad, medan den allmänna tillgängligheten (GA) kommer lite senare.

Författaren ser med spänning fram emot lanseringen av GPT-4:s röstfunktioner, eftersom det kommer att låta honom testa och utforska de nya funktionerna. Möjligheten att generera högkvalitativa, realistiskt klingande ljud från textuppmaningar ses som en betydande framsteg inom AI-driven ljudgenerering.

Open AI står inför finansiella utmaningar

Enligt rapporter står Open AI inför betydande ekonomiska utmaningar, med prognoser som indikerar en potentiell förlust på 5 miljarder dollar i år. Företagets utgifter, inklusive en betydande 4 miljarder dollar på Azure-räkningar, har överträffat dess intäkter, som uppskattas till omkring 30 miljarder dollar.

Denna finansiella situation har väckt oro kring Open AIs hållbarhet och dess förmåga att konkurrera med andra företag som erbjuder liknande teknologier, särskilt eftersom Meta tillhandahåller liknande teknik gratis. Även om Open AI fortfarande är den huvudsakliga aktören på marknaden innebär det faktum att intelligens och AI blir en handelsvara att företaget behöver erbjuda något unikt för att särskilja sig.

Detta skulle kunna innefatta att erbjuda flera modeller, en unik inferensprodukt eller specialanpassade finjusterade modeller, snarare än att bara förlita sig på en generaliserad modell. Konkurrensen på AI-marknaden förväntas intensifieras, och Open AI kommer att behöva hitta sätt att upprätthålla sin konkurrenskraft och säkerställa sin långsiktiga livskraft.

AlphaProof - Ett AI-system för att lösa matematiska problem

Google DeepMind har publicerat en ny rapport denna vecka som visar upp deras AI-system, AlphaProof, som kan lösa problem från International Mathematical Olympiad (IMO) på en silvernivå. Detta är en betydande prestation, eftersom dessa matematikproblem anses vara bland de mest utmanande i världen.

De viktigaste höjdpunkterna i AlphaProof-systemet är:

Förstärkningsinlärningsbaserad metod: AlphaProof använder ett förstärkningsinlärningsbaserat system för formell matematisk resonering, vilket gör det möjligt för den att upptäcka nya algoritmer och insikter för att lösa öppna matematiska problem.
Förbättrad geometrilösning: Systemet innehåller också en förbättrad version av deras tidigare geometrilösningssystem, AlphaGeometry 2, som tillsammans med AlphaProof kunde lösa 4 av 6 problem från den senaste IMO-tävlingen.
Silvernivåstandard: Genom att uppnå samma prestationsnivå som en silvermedaljör i IMO-tävlingen visar AlphaProof betydande framsteg i att bygga AI-system som kan assistera matematiker i deras arbete.
Begränsningar i resonemang och träningsdata: Författarna erkänner att nuvarande AI-system fortfarande kämpar med att lösa allmänna matematiska problem på grund av begränsningar i resoneringsförmåga och träningsdata.

Den här forskningen belyser de fortsatta framstegen i AI:s förmåga att hantera komplexa matematiska problem, vilket närmar oss den dag då AI-system kan upptäcka nya matematiska insikter och tekniker på egen hand. Som författarna noterar är detta ett viktigt steg mot den potentiella "intelligensexplosionen" när AI blir kapabelt till självförbättring.

FAQ

Vad heter den uppdaterade versionen av Mistrals stora språkmodell?

Hur jämför prestandan hos Mistral Large 2 med GPT-4 och LLaMA 3.1 405B?

Varför kommer inte Meta att släppa den multimodala versionen av LLaMA i EU?

Vad är den nya text-till-ljud-modellen som Stability AI har släppt?

När kommer OpenAI att göra de avancerade röstfunktionerna i GPT-4 tillgängliga?

Vilka bekymmer har amerikanska lagstiftare lyft om OpenAIs metoder?

Vad har DeepMinds AlphaProof-system uppnått?