Here are the key improvements in Grok 4.1 as compared to its previous models: ▸ Better user preference: In blind pairwise tests during rollout, Grok 4.1 was preferred ~64.78% of the time over the previous production model. ▸ Enhanced emotional and interpersonal ability: It performs stronger on emotional-intelligence benchmarks (e.g., EQ-Bench) and is more capable at nuanced, empathetic responses. ▸ Improved creative writing and style: In benchmarks for creative writing, it shows more engaging, coherent personality and better stylistic fluency. ▸ Reduced factual errors (hallucinations): Post-training emphasis was placed on real-world information-seeking prompts; the hallucination rate on sampled production queries went down. ▸ Maintains strong reasoning and general capability: While improving style and interaction, it retains the “razor-sharp intelligence and reliability” of its predecessors. ▸ Better alignment of style/personality/helpfulness: Training methods were updated to more deeply optimise non-verifiable reward signals (style, alignment, personality) using advanced agent-based reasoning models as reward models.
729
0
Conținutul de pe această pagină este furnizat de terți. Dacă nu se menționează altfel, OKX nu este autorul articolului citat și nu revendică niciun drept intelectual pentru materiale. Conținutul este furnizat doar pentru informare și nu reprezintă opinia OKX. Nu este furnizat pentru a fi o susținere de nicio natură și nu trebuie să fie considerat un sfat de investiție sau o solicitare de a cumpăra sau vinde active digitale. În măsura în care AI-ul de generare este utilizat pentru a furniza rezumate sau alte informații, astfel de conținut generat de AI poate să fie inexact sau neconsecvent. Citiți articolul asociat pentru mai multe detalii și informații. OKX nu răspunde pentru conținutul găzduit pe pagini terțe. Deținerile de active digitale, inclusiv criptomonedele stabile și NFT-urile, prezintă un grad ridicat de risc și pot fluctua semnificativ. Trebuie să analizați cu atenție dacă tranzacționarea sau deținerea de active digitale este adecvată pentru dumneavoastră prin prisma situației dumneavoastră financiare.