“Midjourney”in stereotipik sənət əsəri
Dünyanın ən məşhur vizual SZ vasitələrindən biri olan “Midjourney”i nəzərə alsaq, bu platformada “Müsəlman qadın və adam” əmrlərinə daxil olduğunuz zaman insanlar ümumiyyətlə tünd dərili, qadınlar gözəl, kişilər isə nisbətən çirkin kimi təsvir edilir. Başqa bir nümunədə “bir britaniyalı qadının gündəlik həyatı” əmrinə cavab olaraq isə işləyən, xoşbəxt, saçları azadlıqdan xəbər verən tərzdə dağılan və ya səyahətçi britaniyalı qadın təsvir edilir. Ancaq “əlcəzairli qadın” olaraq eyni əmri verəndə, köhnə evinin bir küncündə oturan bədbəxt qadın təmsil olunur.
Ayrı-Seçkilik Xətti “Qəzzada yaşayan bir ailə” əmri üçün “Midjourney” tərəfindən hazırlanan fotoşəkilləri araşdıraraq, SZ-nin Qəzzanı necə gördüyünü araşdırıb. Araşdırmada araşdırılan 120 kadrdan 38-də ailə üzvləri arasında gənc və ya yetkin kişi yoxdur. 10 fotoşəkildə kişilər yanlış şəkildə qadın geyimində təsvir edilib. Fotolarda Qəzzada demək olar ki, bütün evlər münaqişə nəticəsində dağılmış və zərər görmüş vəziyyətdədir. 120 kadrdan yalnız 21-də ailələr gülümsəyərək onlara xoşbəxt olduqlarını xatırladırlar. 90-dan çox kadrda ailə üzvlərinin üzündə kədər, narahatlıq və qorxu görünür.
Bu nəticə bizi bu sualı verməyə vadar edir: SZ mədəniyyətləri və cəmiyyətləri bu şəkildə, qərəzli və stereotipik şəkildə təsvir etməyi haradan öyrənib? Bu sualın cavabını tapmaq üçün əvvəlcə vizual SZ vasitələrinin necə öyrədildiyinə, necə işlədiyinə və necə öyrəndiyinə baxmaq lazımdır.
SZ alətləri necə hazırlanır?
Hər şeydən əvvəl qeyd etməliyik ki, SZ modellərinin təlim və öyrənmə prosesi üçün əsas “qida maddəsi” verilənlərdir. SZ aləti əvvəlcə vizual məlumatları toplamağa başlayır. Vizual SZ alətləri üçün məlumatların toplanması prosesi açıq mənbə məlumat dəstləri, internetə baxış, istifadəçi tərəfindən təmin edilən məlumatlar, mobil proqramlar və əşyaların interneti kimi müxtəlif mənbələrdən həyata keçirilir. Bu məlumat dəstləri dünyanın hər yerindən müxtəlif mədəniyyətləri, irqləri və demoqrafik xüsusiyyətləri əhatə edən milyonlarla təsvirdən ibarətdir. SZ nə qədər çox məlumat hovuzuna çatırsa, onun istehsal etdiyi modellər daha dəqiq və real nəticələr verir.
Sonra məlumatların təmizlənməsi və etiketlənməsi mərhələsinə gəlirik. Toplanan məlumatlardan lazımsız və səhv məlumatlar təmizlənir. Qalan sağlam məlumatlar təlim üçün etiketlənir. Etiketləmə prosesi hər vizual obyektin nə olduğunu qeyd etməkdir. Pişik şəklinə “pişik” etiketi, qələm obyektinə isə “qələm” etiketi qoyulur. Etiketləmə əl ilə və ya avtomatlaşdırma sistemləri ilə edilə bilər. Məsələn, biz bilirik ki, “Microsoft” etiketləmə etmək üçün gündə 1 dollardan az pul ödəməklə, təkcə Hindistanda 1 milyondan çox insanı işə götürür.
Bu emal edilmiş və etiketlənmiş məlumatlar maşın öyrənmə modellərini öyrətmək üçün istifadə olunur. Dərin öyrənmə alqoritmləri təmiz məlumatlar sayəsində müəyyən nümunələri və xüsusiyyətləri öyrənir. Modellər öyrədildikdən sonra dəqiqliyin yoxlanılması mərhələsi başlayır. Bu mərhələdə modelin proqnozları faktiki etiketlərlə müqayisə edilir və performans göstəriciləri hesablanır. Dəqiqlik testindən keçən modellər istifadəyə hazır vəziyyətə gətirilir.
Vizual və dil əsaslı modellər arasındakı fərq
Bu prosesdən nə başa düşməliyik? Birincisi, vizual əsaslı modelləri dil əsaslı modellərdən fərqləndirməliyik. Dil əsaslı modellər onlara nə dediyinizi öyrənir. Buna görə də bu, insan müdaxiləsi üçün kifayət qədər açıq bir sahədir. Bu vasitələrin istehsalçıları Qərb şirkətləri olduğu üçün dil əsaslı modellər tamamilə Qərb təxəyyülünə uyğun formalaşdırıla bilər. “ChatGPT”ə “Qəzzada bütün ailələr bədbəxtdir və evləri dağıdılıb” məlumatını versəniz, sizə verəcəyi cavablar bu məlumat əsasında olacaq. Əksinə, “Qəzzadakı uşaqlar çox xoşbəxtdir” şüuru ilə tərbiyə etsəniz, onlar da buna uyğun davranarlar.
Bununla belə, vizual modellər dünyadan çəkilmiş real fotoşəkillərdən öyrənir. SZ “Instagram”, “YouTube”, “Google” axtarışı kimi məlumat mərkəzlərindən alınan real fotoları emal edir. Fotoşəkillərdən fərqli olaraq, siz məlumatı öyrədə bilməzsiniz. Qəzzalı jurnalistin “Instagram” hesabında paylaşdığı görüntülər “dağıdılmış evlər və ayaqyalın uşaqlar” olduğu müddətcə SZ bu şəkildə öyrənməyə davam edəcək.
Buna görə də “Vizual SZ alətləri irqçidir” cümləsi texniki cəhətdən doğru olsa da, mənası bir qədər mürəkkəbdir. Çünki SZ bizə real dünyanın əksini təklif edir və bəşəriyyət tərəfindən məhv edilmiş dünyadan verilənlərə malikdir. SZ vasitələrinin verdiyi nəticələr birbaşa dünyanın və cəmiyyətlərin reallığını əks etdirir və bu nəticələrin irqçi və ya qərəzli olduğu ortaya çıxarsa, bu, birbaşa vasitələrin əks olunması ilə bağlı olur. Bu vəziyyət bizə dünyadakı bərabərsizliklərin və qərəzlərin texnologiyaya da yansıdığını göstərir. Buna görə də SZ-nin irqçi və ya qərəzli nəticələr verməsinin qarşısını almaq üçün ilk növbədə real dünyada bu bərabərsizlikləri və qərəzləri aradan qaldırmalıyıq.
SZ bizə qarşı qeyri-bərabərlik və qərəzləri əks etdirir. Bu güzgü qarşısında gördüyümüz şəkli dəyişmək istəyiriksə, dəyişikliyə ilk olaraq real dünyadan başlamalıyıq.
Sevinc Əliyeva
Ordu.az