Here are the key improvements in Grok 4.1 as compared to its previous models: ▸ Better user preference: In blind pairwise tests during rollout, Grok 4.1 was preferred ~64.78% of the time over the previous production model. ▸ Enhanced emotional and interpersonal ability: It performs stronger on emotional-intelligence benchmarks (e.g., EQ-Bench) and is more capable at nuanced, empathetic responses. ▸ Improved creative writing and style: In benchmarks for creative writing, it shows more engaging, coherent personality and better stylistic fluency. ▸ Reduced factual errors (hallucinations): Post-training emphasis was placed on real-world information-seeking prompts; the hallucination rate on sampled production queries went down. ▸ Maintains strong reasoning and general capability: While improving style and interaction, it retains the “razor-sharp intelligence and reliability” of its predecessors. ▸ Better alignment of style/personality/helpfulness: Training methods were updated to more deeply optimise non-verifiable reward signals (style, alignment, personality) using advanced agent-based reasoning models as reward models.
745
0
Innehållet på den här sidan tillhandahålls av tredje part. Om inte annat anges är OKX inte författare till den eller de artiklar som citeras och hämtar inte någon upphovsrätt till materialet. Innehållet tillhandahålls endast i informationssyfte och representerar inte OKX:s åsikter. Det är inte avsett att vara ett godkännande av något slag och bör inte betraktas som investeringsrådgivning eller en uppmaning att köpa eller sälja digitala tillgångar. I den mån generativ AI används för att tillhandahålla sammanfattningar eller annan information kan sådant AI-genererat innehåll vara felaktigt eller inkonsekvent. Läs den länkade artikeln för mer detaljer och information. OKX ansvarar inte för innehåll som finns på tredje parts webbplatser. Innehav av digitala tillgångar, inklusive stabila kryptovalutor och NFT:er, innebär en hög grad av risk och kan fluktuera kraftigt. Du bör noga överväga om handel med eller innehav av digitala tillgångar är lämpligt för dig mot bakgrund av din ekonomiska situation.