Niyə lokal AI botlar Azərbaycan dilində uğursuz olur, və yaxşısı necə görünür

Lokal AI botlar niyə məhz dil qatında uğursuz olur, və yaxşı Azərbaycan dilli conversational AI necə görünür.

Son bir-iki ildə az qala hər lokal şirkət bir AI bot çıxartdı. Bank, sığorta, pərakəndə, telekom, hamısı. Botların çoxu texniki cəhətdən işləyir, amma istifadəçini məhz bir yerdə itirir: dildə. Bu yazı niyə belə olduğu və yaxşısının necə göründüyü haqqındadır.

Tanış bir səhnə

Bir adam bankının tətbiqini açır və bota adi danışıq dili ilə yazır: “kartım bloklanıb, neyniyim”. Bot rəsmi, kitab dilində, sanki başqa dildən tərcümə olunmuş bir cavab qaytarır. Ya sualı tam başa düşmür, ya mövzunu dəyişir, ya da birdən rus dilinə keçir. Adam bir-iki cəhddən sonra əl çəkir və çağrı mərkəzinə zəng edir.

Bu səhnə tanışdır, çünki hər gün minlərlə dəfə təkrarlanır. Və hər dəfə bir az etibar itir. Diqqət edin, problem botun “ağıllı” olmaması deyil. Problem odur ki, o, Azərbaycanca insan kimi danışmır.

Əsl problem: dil “son beş faiz” kimi görülür

Bir AI bot layihəsində enerjinin çoxu modelə, inteqrasiyaya və launch-a gedir. Azərbaycan dili isə adətən sona qalır, bir tərcümə addımı kimi baxılır. Halbuki söhbətə əsaslanan məhsulda dil “son beş faiz” deyil, elə məhsulun özüdür.

Bu səhv niyə bu qədər tez-tez təkrarlanır? Çünki dil keyfiyyəti qısa bir demoda görünmür. Demo zamanı kimsə bota səliqəli, düzgün yazılmış bir sual verir, bot da səliqəli cavab qaytarır, hamı razı qalır. Problem yalnız real istifadədə, minlərlə insan öz təbii, qarışıq, tələsik dili ilə yazanda üzə çıxır. O vaxt isə bot artıq işə salınıb.

Bunu belə düşünmək lazımdır: bot sizin brendinizin səsidir. İstifadəçi onunla danışanda, sizinlə danışdığını hiss edir. Əgər o səs süni, soyuq, ya da yad səslənirsə, brendiniz də istifadəçinin gözündə o cür səslənir.

Niyə hazır modellər Azərbaycanca büdrəyir

Çoxları düşünür ki, böyük dil modelləri artıq hər dili bilir. Praktikada Azərbaycan dili ilə bir neçə real çətinlik var.

Birincisi, məlumat azlığı. Bu modellər əsasən ingilis və bir neçə böyük dil üzərində öyrədilib. Azərbaycan dilində onlayn mətn həm azdır, həm də qarışıqdır, Latın, Kiril və rus dili bir-birinə qatılıb. Model nə qədər az təmiz nümunə görübsə, bir o qədər çox büdrəyir.

İkincisi, dilin quruluşu. Azərbaycan dili sözlərə şəkilçi üstünə şəkilçi əlavə edir, bir söz uzun bir məna daşıyır. Model mətni kiçik parçalara böləndə bu sözləri tez-tez səhv parçalayır, və nəticədə mənanı da bir az itirir.

Üçüncüsü, danışıq dili ilə yazı dili arasındakı fərq. Model əsasən rəsmi, yazılı mətndən öyrənib, amma insanlar bota rəsmi yazmır, danışdıqları kimi yazır. Bu iki dünya arasındakı boşluq düz idarə olunmayanda bot büdrəyir.

Nəticə budur: model “başa düşür” kimi görünür, amma incə yerlərdə, tonda, nəzakətdə, məna çalarlarında səhv edir. Və müştəri ilə söhbətdə incə yerlər elə hər şeydir.

Harada qırılır

Praktikada uğursuzluq bir neçə təkrarlanan nöqtədə baş verir.

Birincisi, register və ton. Bot elə rəsmi, bürokratik bir dildə danışır ki, real heç bir insan o cür danışmır. İstifadəçi “kartı necə bağlayım?” yazır, bot isə “Hörmətli müştəri, müraciətinizlə əlaqədar bildiririk ki...” deyə başlayır. Halbuki təbii cavab sadədir: “Kartı tətbiqdə Kartlar bölməsindən bağlaya bilərsiniz, addımları göstərimmi?”

İkincisi, real danışıq. İnsanlar necə danışırsa, elə də yazır: qısaltmalarla, yarımçıq cümlələrlə, hərf səhvləri ilə. “salam blokdan cixa bilmirem” kimi bir cümlə real istifadəçi üçün normaldır, amma yalnız “kitab” Azərbaycancasını gözləyən bot burada çaşır.

Üçüncüsü, dil və əlifba qarışığı. Azərbaycanlılar tez-tez Azərbaycan, rus və ingilis sözlərini bir cümlədə qarışdırır, bəzən kiril əlifbası ilə yazır. İstifadəçi “kartın limitini artırmaq olar?” yazandan sonra “spasibo” yazırsa, bot bunu təbii qəbul etməlidir, qırılmamalıdır.

Dördüncüsü, ingiliscədən tərcümə edilmiş axın. Bütün söhbət əvvəl ingilis dilində qurulub, sonra tərcümə edilib. Nəticədə söz sırası, nəzakət formaları, ifadələr, hamısı bir az yad qalır. İstifadəçi bunu izah edə bilmir, amma hiss edir ki, nəsə “bizim kimi” deyil.

Beşincisi, etibar və sahə bilgisi. Bank və ya səhiyyədə bot qeyri-müəyyən danışır, həssas sualları yöndəmsiz idarə edir, ya da imkanı olmayan şeylər vəd edir. Belə olanda istifadəçi ona pulunu və ya sağlamlığını etibar etmir, və düzgün edir.

Bu, yalnız bizim müşahidəmiz deyil. Verint-in 2024-cü ildə 1,500 istehlakçı arasında apardığı sorğuya görə, müştərilərin üçdə ikisindən çoxu pis çatbot təcrübəsi yaşayıb, və ən çox rast gəlinən şikayət botun sualı cavablandıra bilməməsi və istifadəçini başa düşməməsidir. Bu iki şeyin hər ikisi birbaşa dil qatında baş verir.

Boşluğun qiyməti

Bu, sadəcə estetik bir problem deyil, ölçülə bilən bir xərcdir.

Hər uğursuz söhbət bir çağrı mərkəzi zənginə çevrilir, yəni xərc. Küsmüş istifadəçi geri qayıtmaya bilər, yəni itən müştəri. Və hər pis təcrübə brendi bir az aşındırır, çünki bot brendin səsidir.

Ən pisi isə səssiz itkidir. İstifadəçilərin çoxu şikayət etmir, sadəcə əl çəkir və bir daha botu açmır. Sən heç vaxt bilmirsən ki, neçə nəfəri itirmisən, çünki onlar heç nə demədən gediblər.

Rəqəmlər bunu təsdiqləyir. Five9-un 2024-cü il sorğusuna görə, istehlakçıların 48%-i AI botların verdiyi məlumata etibar etmir, 56%-i bu botlardan tez-tez əsəbiləşir, və 75%-i müştəri xidməti üçün canlı insanla danışmağa üstünlük verir.

Dil tərəfi isə daha da kəskindir. CSA Research-in 29 ölkədə 8,709 istehlakçı arasında apardığı araşdırmaya görə, insanların 76%-i məlumatı öz ana dilində olan məhsulu seçir, 40%-i başqa dildəki saytdan ümumiyyətlə almır, və 75%-i müştəri qayğısı öz dilində olarsa eyni brendi yenidən almağa daha meyllidir.

Bir məqamı açıq deyim: bu rəqəmlər qlobaldır, Azərbaycana aid deyil. Amma məntiq aydındır. Əgər insanlar böyük dillərdə belə öz dillərini bu qədər çox istəyirsə, Azərbaycan kimi daha kiçik bir dildə effekt ən azı bir o qədər güclüdür. Üstəlik hazır, qlobal modellər məhz Azərbaycan dilində ən zəif işləyir. Yəni boşluq da burada ən böyükdür, imkan da.

Yaxşısı necə görünür

Yaxşı xəbər budur ki, bunların hamısı düzələndir. Yaxşı Azərbaycan dilli conversational AI bir neçə prinsipə söykənir.

Dil birinci dərəcəli dizayn materialı kimi qəbul edilir. Söhbət mətnini təbii Azərbaycanca yazan adamlar yazır, ingiliscədən tərcümə edən yox. Hər cavab, hər xəta mesajı, hər təsdiq real insanın dilində səslənir.

Sistem real danışıq üçün qurulur. Danışıq formaları, qısaltmalar, hərf səhvləri, dil qarışığı və ikili əlifba ilk gündən nəzərə alınır, sonradan yamaq kimi yox.

Register brendə və insana uyğun olur. İsti, aydın, işlək Azərbaycanca, nə həddən artıq rəsmi, nə də ucuz. Bot ciddi bankın səsi ola bilər, amma yenə də insan kimi.

Etibar dizaynla qurulur. Bot nə edə bildiyini və nə edə bilmədiyini açıq deyir, bilmədiyini uydurmur, lazım olanda söhbəti yumşaq şəkildə insana ötürür, və tənzimlənən sahələrdə qayda və təhlükəsizlik tələblərinə diqqətli olur.

Və sistem ölçülüb təkmilləşdirilir. Keyfiyyət real Azərbaycan söhbətləri üzərində qiymətləndirilir, ingilis dilindəki hazır testlərlə yox. Botun harada büdrədiyi mütəmadi yoxlanılır və düzəldilir.

Haradan başlamaq

Əgər artıq botunuz varsa, yaxşı xəbər budur ki, çox vaxt sıfırdan qurmağa ehtiyac yoxdur.

Real söhbət loglarına baxın. Botun harada büdrədiyini fərziyyə ilə yox, real data ilə görün. Ən çox təkrarlanan uğursuzluqları tapın və dəyərə görə sıralayın, hansı bir neçə problem söhbətlərin böyük hissəsini korlayır.

Sonra ən çox təsir edən hissələri real Azərbaycanca yenidən yazın, və dəyişikliyi yenə real söhbətlərlə yoxlayın. Bu, adətən aylarla yox, həftələrlə ölçülən bir işdir, çünki məhsulu dəyişmirsiniz, onun dilini və axınını düzəldirsiniz.

Əsas fikir

Yaxşı Azərbaycan dilli AI “olsa yaxşıdır” kateqoriyasından deyil. O, bir sənətdir, və bu gün bir rəqabət üstünlüyüdür. Botların çoxunun orta səviyyədə olduğu bir bazarda, dili düzgün quran şirkət istifadəçinin etibarını qazanır. Bu, asanlıqla kopyalana bilməyən bir üstünlükdür.

Bir qeyd

Emotix-də illərdir məhz bu qatla işləyirik, Azərbaycan dilinin AI məhsullarında necə düzgün səsləndiyi ilə. Texniki cəhətdən işləyən, amma Azərbaycan istifadəçisini qazanmayan bir botunuz varsa, o boşluq düzələndir, çox vaxt gözləniləndən tez. Danışmaq istəsəniz, qapımız açıqdır.

Mənbələr: CSA Research, “Can’t Read, Won’t Buy (B2C)”, 2020 (Kantar ilə birgə, 29 ölkədə 8,709 istehlakçı). Verint istehlakçı sorğusu, 2024 (1,500 istehlakçı). Five9 istehlakçı sorğusu, oktyabr 2024.