Неліктен AI тексеру құралдары 100% нәтиже бермейді?

Жасанды интеллект әртүрлі салаларда мықтап орнықты, және ғылым да бұдан тыс қалған жоқ. Көптеген ғалымдар ғылыми мақалалар жазу барысында оны белсенді түрде пайдаланады. Сондықтан ғылыми журналдар мақалаларды жариялау алдында жасанды интеллект іздерін мұқият тексереді. Алайда мұндай детекторлар шынымен тиімді ме? Олар нәтижелердің сенімділігіне 100% кепілдік бере ала ма? Бүгін біз осы туралы егжей-тегжейлі әңгімелесеміз.

ЖИ детекторлері: олар тиімді ме?

Академиялық адалдық қағидаларын сақтау – ғылыми қызметтің негізі. Сондықтан мақаланы шолуға жібермес бұрын ғылыми журналдар оны жасанды интеллектіні пайдаланудың ықтимал белгілері үшін тексереді. Осы мақсатта мәтінді талдап, оның бірегейлігі туралы есеп беретін арнайы құралдар бар. Алайда, іс жүзінде мұндай ЖИ детекторлары мінсіз емес. Керісінше, олардың нәтижелердің объективтілігіне айтарлықтай әсер етуі мүмкін көптеген кемшіліктері бар. Олар нақты қалай көрінеді?

Кемшілік 1: академиялық стильге байланысты жалған оң нәтижелер

Ғылыми мәтіндер табиғаты бойынша стилі жағынан ұқсас, себебі олар бекітілген терминдерді, типтік сөйлем құрылымдарын және бейтарап тонды қолданады. Талдау процесінде детекторлар осы сипаттамаларды, атап айтқанда қайталанатын тілдік үлгілерді, ресми ұсынысты және айқын құрылымды іздейді. Бұл – мәтіннің авторы адам емес, жасанды интеллект негізіндегі құрал екенін көрсететін «маркерлер».

Бұл парадокс тудырады: ғылыми стильді меңгерген, дұрыс терминология қолданатын және стандарттарға сәйкес келетін автор автоматты түрде күдікке ілінеді. Мақала неғұрлым сапалы жазылса, детектор оны жасанды интеллект жасаған мәтін деп қате анықтау ықтималдығы соғұрлым жоғары болады. Нәтижесінде жалған оң нәтижелер пайда болып, жасанды интеллект қолдану көрсеткіші жоғары көрсетіледі.

Кемшілік 2: авторлардың ШИ технологиясын қалай қолданатынын түсінбеушілік

Ғылыми қауымдастықта зерттеушілер жасанды интеллект технологиясын тек мақаланың толық мәтінін жасау үшін ғана пайдаланады деген түсінік бар. Алайда, бұл шын мәнінде қате түсінік, себебі қазіргі ғалымдар жасанды интеллектіні жұмысының әртүрлі кезеңдерінде көмекші ретінде пайдаланады, мысалы, идеялар туындату кезінде, үлкен көлемдегі деректерді құрылымдауда, күрделі формулировкаларды қайта жазуда, шетел тіліндегі мәтіндердегі грамматиканы түзетуде немесе жеке абзацтардың оқылымдылығын жақсартуда. Бұл құралды мақсатты, саналы түрде пайдалану, онда негізгі идеялар, әдістеме мен қорытындылар автордың өзінде қалады.

Бірақ анықтағыштар бұл айырмашылықты байқамайды. Алгоритм үшін мақаланы бір сұраумен толық жасаған ба, әлде тілдік модельді тек екі сөйлемді жақсарту үшін пайдаланған ба – маңызды емес. Көмекші технологияларды кез келген қолдану мақаланы «жасанды интеллект жазған» деп автоматты түрде белгілейді, бұл шындыққа жанаспайды.

Кемшілік 3: автордың нақты үлесін бағалау мүмкін еместігі

Жоғарыда атап өткеніміздей, жасанды интеллект адам ойлауын алмастыратын нәрсе емес, ғылым қызметкерлеріне өз ойларын жақсырақ жеткізуге көмектесетін техникалық ассистент ретінде барған сайын көбірек қызмет етеді. Мысалы, математик есептеулер үшін калькулятор қолданса, ол зерттеудің авторы емес дегенді білдірмейді.

Ұқсас түрде, мәтінді өңдеу немесе форматтау үшін тілдік модельдерді пайдалану автордың еңбегіне ештеңе қоспайды. Алайда детекторлар мұны бағалай алмайды. Олар автор әдістемені өзі әзірлеген бе, тәжірибе жүргізген бе, деректерді талдап, қорытынды шығарған ба (тек мәтінді техникалық тұрғыдан жетілдіру үшін жасанды интеллектіні пайдаланып), әлде мақаланы толықтай автоматты түрде жасаған ба – соны ажырата алмайды. Бұл шектеу ғылыми жұмыстың сапасы мен түпнұсқалығы туралы қате қорытындыларға әкеледі.

Кемшілік 4: Академиялық ортада ауыр этикалық мәселелер туғызады

Талдаушылар ғылыми еңбектерді жасанды интеллект жасаған деп қате анықтағанда, бұл этикалық қақтығыстар тізбегін тудырады. Авторлар өз зерттеулерінде адал еңбек еткеніне қарамастан, академиялық тұтастықты бұзды деп әділетсіз айыпталуы мүмкін. Бұл ғалымдар мен журнал редакторлары арасындағы сенімді әлсіретіп, зерттеушілердің ғылыми беделін түсіруі мүмкін.

Жас ғалымдар немесе шетел тілінде жариялайтындар әсіресе осал, себебі олардың мәтіндері табиғи тілдік ерекшеліктердің жетіспеушілігі немесе стильді технологиялық тұрғыдан жетілдіруге тырысуы салдарынан күдікке ұшырайды. Сонымен қатар, жалған айыптаулар жоғары сапалы зерттеулердің қабылданбауына, жариялануының кешігуіне және мансаптық мүмкіндіктердің жоғалуына әкелуі мүмкін. Нақты авторлықты анықтау автоматты бағдарламалық тексеруден әлдеқайда терең талдауды талап етеді.

ЖИ детекторлерінің жұмысындағы қателіктердің мысалдары

ЖИ детекторлерінің тұрақсыздығының практикада қалай көрінетінін түсіну үшін үш нақты жағдайға назар аударайық.

Практикалық жағдай 1: түзетулерден кейін нәтижелердің нашарлауы

Бұл жағдайда ғылыми мақаланың авторлары ЖИ детекторлерінің сенімсіздігін айқын көрсететін жағдайға тап болды. Журналдың бастапқы шолуы мақалада AI қолдану ықтималдығын 28% деп көрсетті. Редакторлар бұл көрсеткішті 20%-ға дейін төмендетуді сұрап, нақты мәтін үзінділері «AI-ға ұқсас» деп белгіленген егжей-тегжейлі есеп ұсынды.

Авторлар тек детектордің проблемалы деп анықтаған үзінділерді қайта жазып, қалған мәтінді өзгертпеді. Алайда қайта тексергеннен кейін сол журнал 89% нәтиже көрсетті. Шындығында, күтілген төмендеудің орнына көрсеткіш үш еседен астам өсті.

Бұл жағдай жасанды интеллект детекторларының негізгі мәселелерінің бірін көрсетеді: оларда тұрақты бағалау критерийлері жоқ және түзетулер енгізгеннен кейін де болжап болмайтын нәтижелер береді.
Практикалық мысал 2: бірдей мәтінге әртүрлі нәтижелер
Тағы да айқын мысал – бір жүйемен тексерілген бірдей мақаланың әртүрлі журналдарда айтарлықтай әртүрлі нәтижелер алуы. Бірінші ғылыми басылымда жүйе жасанды интеллекттің 49% қолданылғанын көрсетті.

Ал екінші журнал мақаланы тексергеннен кейін авторға жасанды интеллектті 62% қолданғанын көрсететін есеп берді. Нәтижелердегі мұндай сәйкессіздік детекторлардың тұрақты әрі дәл бағалау бере алмайтынын және жазу процесінде жасанды интеллект технологиялары қолданылған-қолданылмағанын анықтау қабілеті күмәнді екенін көрсетеді.

Практикалық мысал 3: әртүрлі бағдарламалардың нәтижелеріндегі айырмашылықтар

Барлық ғылыми журналдар бірдей қолданатын әмбебап бағдарлама жоқ екенін атап өткен жөн. Әрбір ғылыми басылым жасанды интеллект іздерін тексеру құралдарын өз бетінше таңдайды. Осы аспект нәтижелердің объективтілігіне едәуір әсер етеді.
Мысалы, осы жағдайда бір мақаланы талдау үшін екі түрлі детектор қолданылды: Turnitin және Pangram. Бірінші платформа ұсынған есеп бойынша мәтіннің 45%-ы жасанды интеллект арқылы жасалған.

Ал Pangram бағдарламасы мақаланың 75%-ы жасанды интеллект нәтижесі екенін анықтады. Көріп отырғанымыздай, алынған нәтижелер арасындағы айырмашылық өте үлкен.

Бұл жағдай әр мәтінді тексеру құралының жасалған мазмұнды анықтауда өз алгоритмдері, критерийлері мен тәсілдері бар екенін айқын көрсетеді. Біркелкі анықтау стандарттарының болмауы ғылыми мақаланың тағдыры оның нақты сапасы мен түпнұсқалығына емес, белгілі бір журнал таңдаған бағдарламаға байланысты болуы мүмкін екенін білдіреді.

ЖИ анықтау құралдарына сенуге бола ма?

Жоғарыда келтірілген мысалдар мен аталған кемшіліктер көрсеткендей, заманауи жасанды интеллект анықтағыштарының елеулі шектеулері мен дәлсіздіктері бар, бұл олардың бағалаудың жалғыз критерийі ретіндегі сенімділігіне күмән тудырады. Олар болжамсыз нәтижелер бере алады, технология қолданылатын контексті әрдайым ескермейді және кейде жақсы жазылған академиялық мәтіндерді жасанды интеллект жасаған деп қате анықтайды. Бірдей мәтін әртүрлі тексерулерде әртүрлі бағаланса және белгіленген үзінділерді түзету күтпеген нәтижелерге әкелсе, бұл құралдар әлі қажетті дәлдік деңгейіне жетпегені анық.

Сондықтан оларды жариялау туралы шешім қабылдау кезінде негізгі немесе жалғыз критерий ретінде пайдалану қауіпті. Тіпті осы жүйелердің әзірлеушілері өз бағдарламалары мінсіз еместігін және қателіктер жіберуі мүмкін екенін, ал тексеру нәтижесі мәтіннің шығу тегі туралы тек ықтималдық болжам ғана екенін, нақты дәлел емес екенін атап өтеді.

Ең алдымен, академиялық қауымдастық жасанды интеллектіні этикалық қолдануға қатысты айқын саясатты әзірлеуі тиіс, оның басты мақсаты – автордың мазмұнының, әдістемесінің және ғылыми үлесінің бірегейлігін бағалау. Тек осылайша ғана қазіргі заманғы технологиялардың қарқынды дамуына бейімделе отырып, академиялық тұтастықты сақтауға болады.

Неліктен AI тексеру құралдары 100% нәтиже бермейді?