Demonstrasiyadan kənarda agentik sistemlərin qiymətləndirilməsi
Demonstrasiyalar hər şeyi gözəl göstərir. Burada istifadəyə verməzdən əvvəl həqiqətən apardığımız qiymətləndirmələri təqdim edirik.
Hər kəs prompt yaradır. Əsl məhsul isə promptun səhv işlədiyi anda nə baş verdiyidir.
Prompt AI məhsulunun ən çox müzakirə olunan hissəsidir. Eyni zamanda bu, ən az əhəmiyyət kəsb edən hissədir. Əsl məhsul isə promptun nəticəsi səhv, qüsurlu, təhlükəli və ya sadəcə maraqsız olduğu zaman sistemin necə davrandığıdır.
İstifadəyə verdiyimiz hər AI funksiyasında uğurlu ssenariyə deyil, uğursuzluq ssenarisinə daha çox mühəndislik səyi sərf olunur. Bu şikayət deyil, sadəcə işin təbii forması belədir.
Əsl məhsul promptun nəticəsi səhv olduğu zaman sistemin necə davrandığıdır.
Yanlış faktlar. Qüsurlu JSON. Faydasız olduğu halda imtina. İstifadəçinin verməyib heç bir suala əminliklə verilən cavablar. Hər birinin xüsusi qarşılığı var: başqa model ilə yenidən cəhd, qaydalara əsaslanan yedək yola keçid, qeyri-müəyyənliyi açıq göstərmək, aydınlaşdırıcı sual vermək, insanın qatılmasını tələb etmək.
İstehsal səviyyəli agentik sistem mərkəzi model çağırışı ətrafında qurulmuş məhdudlaşdırıcılar, yoxlayıcılar, yedəklər və müşahidə nöqtələri toplusudur. Prompt qəlbdir; qalanı isə qan dövranı sistemidir. Yalnız qəlb ilə məhsulu istifadəyə vermək mümkün deyil.
Demonstrasiyalar hər şeyi gözəl göstərir. Burada istifadəyə verməzdən əvvəl həqiqətən apardığımız qiymətləndirmələri təqdim edirik.
Əsl sual AI-dan istifadə edib-etməmək deyil. Əsl sual budur: əgər intellekt ucuz, hər yerdə və uyğunlaşan olsaydı, məhsulunuz necə görünərdi.
Bu söz öz işini görməyi dayandırdı. Onu nə ilə əvəz etdiyimizi və müştərilərin niyə bunu hiss etdiyini izah edirik.
Qurma sprintlərimiz qəsdən qısadır. Bu qısalığın hansı qərarları məcburi etdiyini izah edirik.