Bakı,
AzerVoice
Süni intellekt texnologiyalarının zəif performans göstərməsi barədə
son araşdırma maraqlı nəticələr ortaya qoyub.
Belə ki, süni intellekt modellərinin performansı ilə bağlı aparılan
bir araşdırma, onların insanlarda idrak pozğunluqlarını
qiymətləndirmək üçün istifadə edilən Monreal Koqnitiv
Qiymətləndirmə Testində (MoCA) aşağı ballarla zəif nəticələr
göstərdiyini müəyyən edib.
The BMJ jurnalında yayımlanan araşdırmada ChatGPT 4, Claude 3.5 və Gemini kimi populyar süni intellekt modelləri test edilib. MoCA testi diqqət, yaddaş, dil, vizual-məkan bacarıqları və icra funksiyaları kimi idrak qabiliyyətləri ölçür. Adətən, erkən demans əlamətlərini aşkar etmək üçün istifadə olunur.
Testdə süni intellekt modellərinə insanlar üçün tətbiq edilən eyni tapşırıqlar verilib. Nəticələr aşağıdakı kimi olub:
ChatGPT 4o: 26/30
ChatGPT 4 və Claude 3.5: 25/30
Gemini 1.0: 16/30
Testin maksimal balı 30-dur və 26 və daha yüksək ballar normal hesab edilir.
Bütün modellər vizual-məkan bacarıqlarında və icra funksiyalarında aşağı nəticə göstərib.
Gemini modelləri, eyni zamanda, yaddaşla bağlı tapşırıqlarda (məsələn, gecikmiş xatırlama) uğursuz olub.
Süni intellekt adlandırma, diqqət, dil və abstraksiya kimi idraki sahələrdə daha yaxşı performans göstərib.
Tədqiqatçılar qeyd edirlər ki, bu nəticələr süni intellektin tibbi diaqnostik proseslərdə istifadə olunması fikrini sual altına alır. Xüsusilə vizual-məkan bacarıqları və icra funksiyalarındakı məhdudiyyətlər süni intellektin insan həkimləri əvəz etməsi üçün qarşısında ciddi maneələrin olduğunu göstərir.
Son illərdə süni intellektin diaqnostik proseslərdə uğurları müşahidə olunsa da, bu araşdırma onun da insanlara bənzər zəifliklər göstərə biləcəyini də sübut edir.