Reed NewsReed News

Xiaomi avslöjar AI-modellen Hunter Alpha efter anonym debut

Vetenskap & teknikVetenskap
Xiaomi avslöjar AI-modellen Hunter Alpha efter anonym debut
Nyckelpunkter
  • Hunter Alpha dök upp anonymt på OpenRouter den 11 mars, senare avslöjad som Xiaomis MiMo-V2-Pro-testversion.
  • MiMo-V2-Pro är utformad som en AI-agenthjärna och samarbetar med fem stora ramverk.
  • Xiaomis aktier steg 5,8 procent efter tillkännagivandet.

Hunter Alpha, som initialt väckte spekulationer om att det kunde vara DeepSeek-V4, bekräftades av Xiaomis AI-modellteam MiMo vara en intern testversion av MiMo-V2-Pro. Modellen, som leds av den tidigare DeepSeek-forskaren Luo Fuli, är utformad för att fungera som hjärnan hos AI-agenter och kommer att samarbeta med fem stora agentramverk, inklusive OpenClaw, och erbjuda en veckas gratis åtkomst. Luo Fuli beskrev skiftet från chatt- till agentparadigm som ett 'tyst bakhåll' som skedde snabbare än väntat.

Hunter Alpha identifierade sig som en kinesisk AI-modell som främst tränats på kinesiska, med en kunskapsgräns i maj 2025, men vägrade att identifiera sin utvecklare. Enligt The Independent - Main uppgav chatbotten att den bara kände till sitt namn, parameterskala och kontextfönsterlängd. Modellen rapporteras vara en modell med 1 biljon parametrar och ett kontextfönster på upp till en miljon tokens. Ingenjören Nabil Haouam sade till The Independent - Main att kombinationen av en miljon tokens kontext med resonemangsförmåga och gratis åtkomst stack ut, och noterade att de flesta frontlinjemodeller med det kontextfönstret medför verkliga kostnader i stor skala. AI-ingenjören Daniel Dewhurst tillade att tankekedjemönstret var en stark signal om modellens träning, även om en namnlös utvecklare föreslog att Hunter Alpha sannolikt inte är DeepSeek-V4.

Jag kallar detta ett tyst bakhåll – inte för att vi planerade det, utan för att skiftet från chatt- till agentparadigm skedde så snabbt att vi knappt trodde på det själva.

Luo Fuli, Chef för MiMo

Separat har DeepSeek släppt sin nya AI-modell DeepSeek-V4 i två versioner: DeepSeek-V4-Pro och DeepSeek-V4-Flash. DeepSeek uppgav att DeepSeek-V4-Pro leder andra öppen källkodsmodeller i världskunskapsriktmärken och endast är något sämre än Gemini-Pro-3.1. Företaget lyfte också fram sitt ultralånga kontext på en miljon ord, vilket uppnår ledarskap inom agentkapacitet, världskunskap och resonemangsprestanda.

Folk frågar varför vi rör oss så snabbt. Jag såg det på nära håll när jag byggde DeepSeek R1.

Luo Fuli, Chef för MiMo

Kombinationen som stack ut var Hunter Alphas 1 miljon tokens kontext ihop med resonemangsförmåga och gratis åtkomst.

Nabil Haouam, Ingenjör specialiserad på AI-agentsystem

De flesta frontlinjemodeller med det kontextfönstret medför verkliga kostnader i stor skala.

Nabil Haouam, Ingenjör specialiserad på AI-agentsystem

Tankekedjemönstret är förmodligen den starkaste signalen.

Daniel Dewhurst, AI-ingenjör

Resonemangsstil är svår att dölja och tenderar att spegla hur en modell tränades.

Daniel Dewhurst, AI-ingenjör

Min analys tyder på att Hunter Alpha sannolikt inte är DeepSeek V4

Namnlös utvecklare, Utvecklare

har ett ultralångt kontext på en miljon ord, vilket uppnår ledarskap inom både inhemska och öppen källkodsområden inom agentkapacitet, världskunskap och resonemangsprestanda

DeepSeek, Företag

I världskunskapsriktmärken leder DeepSeek-V4-Pro betydligt andra öppen källkodsmodeller och är endast något sämre än den toppklassiga stängda källkodsmodellen (Googles) Gemini-Pro-3.1.

DeepSeek, Företag
Taggar
Styrkt
The Independent - MainComputer Sweden
2 publikationer · 5 källor
Visa fullständig rapportRapportera felaktighet
Xiaomi avslöjar AI-modellen Hunter Alpha efter anonym debut | Reed News