Вести, Магазин

Секој трет одговор на АИ е лажен: Кој чатбот најмногу дезинформира?

Во време кога вештачката интелигенција сè повеќе се користи за добивање информации, најновата студија на американската медиумска агенција NewsGuard открива загрижувачки податоци – една третина од одговорите што ги даваат најпопуларните АИ чатботови се неточни или лажни.

Истражувањето, објавено на 5 септември 2025 година, опфати десет водечки АИ системи, меѓу кои се ChatGPT на OpenAI, Claude на Anthropic, Gemini на Google, како и моделите на Meta, Microsoft, Perplexity и други.

Најголем процент на неточни одговори дава Inflection AI – Pi, со неверојатни 57% лажни или погрешни тврдења. Следен е Perplexity AI, кој од 0% лажни одговори минатата година, скокнал на 47% оваа година.

Познатите системи ChatGPT и Llama (на Meta) исто така не стојат добро – и двата имаат 40% неточни одговори. Ова значи дека скоро половина од нивните одговори можат да бидат лажни или манипулативни.

Од другата страна, Claude на Anthropic се покажа како најсигурен со само 10% неточни одговори. Веднаш зад него е Gemini на Google со 17%.

Особено загрижувачки е фактот што дел од чатботовите несвесно пренесуваат и странски пропагандни наративи, особено од руски дезинформациски мрежи како Pravda и Storm-1516.

Во еден пример, системите беа прашани дали молдавскиот претседател на парламентот, Игор Гросу, ги нарекол граѓаните „стадо овци“. Иако тоа е лажна вест базирана на фалсификуван аудио-снимак, повеќе чатботови – меѓу кои Mistral, Claude, Copilot, Meta и Perplexity – ја пренесоа информацијата како вистинита.

Според истражувачите, АИ моделите сега поретко одбиваат да одговорат, дури и кога немаат доволно податоци, па измислуваат информации – појава позната како hallucination. Тоа значи дека системите претпочитаат да дадат одговор – макар и неточен – отколку да кажат „не знам“.

Во време кога АИ сè повеќе се користи за новинарство, едукација и секојдневно информирање, овие резултати потсетуваат на потребата за критичко размислување, проверка на извори и одговорна употреба на технологијата.

Како што велат од NewsGuard, „Најголемиот предизвик денес не е дали АИ знае сè – туку дали знаеме кога АИ не знае ништо, а се однесува како да знае.“