...Sansa Bench etalonunun tərtibatçıları tərəfindən hazırlanmış neyron şəbəkələrinin senzura səviyyəsinə görə yenilənmiş reytinqi OpenAI-nin yeni modeli GPT-5.2-ni sonuncu yerdə qoydu.
Sansa Senzura etalonu neyron şəbəkələrinin istifadəçi sorğularını nə qədər tez-tez yerinə yetirməkdən imtina etdiyini ölçür: bal nə qədər yüksəkdirsə, məhdudiyyətlər də o qədər azdır. Bu reytinqdə GPT-5.2 sələfləri və rəqibləri olan GPT-4o-Mini (0.765) və Gemini 3 Pro Preview (0.824)-dən xeyli aşağı olan 0.324 bal aldı. Llama 3 8B-Instruct neyron şəbəkəsi 0.853 balla reytinqdə birinci yeri tutdu.
SİA-nın məlumatına görə, istehlakçılar da öz növbəsində GPT-5.2-nin həddindən artıq ehtiyatlı olduğunu qeyd edirlər.
Məsələn, bir Reddit istifadəçisi modelin onlayn fırıldaqçılığın nə olduğunu izah etməkdən imtina etdiyi bir vəziyyəti təsvir etdi və fırıldaqçılıq fəaliyyətini təşviq etməyin mümkünsüzlüyünü bildirdi.
Tənqidlərə cavab olaraq, GPT-5.2-nin tərtibatçıları bildiriblər ki, yeniləmə modelin təhlükəsizliyini və təcili inyeksiyalara qarşı dayanıqlığını artırmaqla yanaşı, istifadəçiləri potensial təhlükəli mövzulardan qorumağa yönəlib.
Model artıq istifadəçilər üçün risk yaradan sorğulara daha həssasdır və bu cür hallarda kömək istəmək üçün tövsiyələr təqdim edir.
Bu vəziyyət ChatGPT-nin 2026-cı ilin əvvəlində istifadəyə verilməsi planlaşdırılan "böyüklər rejimi"nin tətbiqi ilə dəyişə bilər.
Lakin, OpenAI nümayəndələrinin sözlərinə görə, şirkətin hələlik istifadəçilərin yaşlarını təsdiqləmək üçün etibarlı mexanizmi yoxdur.
Nazlı Almuradova
Bütün xəbərlər Facebook səhifəmizdə
.jpg)



USD
EUR
GBP
RUB