Here are the key improvements in Grok 4.1 as compared to its previous models:
▸ Better user preference: In blind pairwise tests during rollout, Grok 4.1 was preferred ~64.78% of the time over the previous production model.
▸ Enhanced emotional and interpersonal ability: It performs stronger on emotional-intelligence benchmarks (e.g., EQ-Bench) and is more capable at nuanced, empathetic responses.
▸ Improved creative writing and style: In benchmarks for creative writing, it shows more engaging, coherent personality and better stylistic fluency.
▸ Reduced factual errors (hallucinations): Post-training emphasis was placed on real-world information-seeking prompts; the hallucination rate on sampled production queries went down.
▸ Maintains strong reasoning and general capability: While improving style and interaction, it retains the “razor-sharp intelligence and reliability” of its predecessors.
▸ Better alignment of style/personality/helpfulness: Training methods were updated to more deeply optimise non-verifiable reward signals (style, alignment, personality) using advanced agent-based reasoning models as reward models.

742
0
Innholdet på denne siden er levert av tredjeparter. Med mindre annet er oppgitt, er ikke OKX forfatteren av de siterte artikkelen(e) og krever ingen opphavsrett til materialet. Innholdet er kun gitt for informasjonsformål og representerer ikke synspunktene til OKX. Det er ikke ment å være en anbefaling av noe slag og bør ikke betraktes som investeringsråd eller en oppfordring om å kjøpe eller selge digitale aktiva. I den grad generativ AI brukes til å gi sammendrag eller annen informasjon, kan slikt AI-generert innhold være unøyaktig eller inkonsekvent. Vennligst les den koblede artikkelen for mer detaljer og informasjon. OKX er ikke ansvarlig for innhold som er vert på tredjeparts nettsteder. Beholdning av digitale aktiva, inkludert stablecoins og NFT-er, innebærer en høy grad av risiko og kan svinge mye. Du bør nøye vurdere om handel eller innehav av digitale aktiva passer for deg i lys av din økonomiske tilstand.

