Използването на чатботове с изкуствен интелект за здравна информация става все по-разпространено, но нови научни данни поставят под съмнение надеждността им. Макар отговорите да звучат уверено и професионално, изследвания показват, че те често съдържат неточности и подвеждащи „източници“, което може да доведе до погрешни изводи при потребителите.
Проблемът е, че част от тези твърдения се оказват неточни, а посочените линкове не винаги водят до реални научни публикации.
Това показват резултатите от ново изследване, публикувано в BMJ Open, което анализира пет от най-популярните ИИ чатботове в света.
Екип от учени задава 50 медицински въпроса на ChatGPT, Gemini, Grok, Meta AI и DeepSeek. Темите включват рак, ваксини, стволови клетки, хранене и спортни постижения. Отговорите са оценени от двама независими експерти, а резултатите се оказват тревожни.
Около 20% от отговорите са определени като силно проблематични, половината – като проблематични, а останалите 30% – като донякъде проблематични. Нито един от чатботовете не успява да предостави напълно коректен списък с научни източници.
Най-слабо се представя Grok, при който 58% от отговорите са проблемни. Следват ChatGPT с 52% и Meta AI с 50%.
Най-добри резултати се наблюдават при теми като рак и ваксини, където научната база е по-ясна и добре структурирана. Въпреки това и там около една четвърт от отговорите съдържат неточности.
Най-сериозни затруднения се виждат при теми като хранене и спортни постижения, където онлайн информацията е противоречива, а научните доказателства често са ограничени или нееднозначни.
Когато изследователите изискват конкретни научни източници, средната точност на предоставените референции е едва около 40%. Срещат се объркани автори, несъществуващи статии, неработещи линкове и дори напълно измислени публикации. Това е особено проблематично, тъй като добре оформените „източници“ създават усещане за достоверност, което потребителите рядко проверяват.
През 2026 г. изследване в Nature Medicine установява, че чатботовете могат да дават правилен медицински отговор в около 95% от случаите. Но когато реални хора използват тези отговори, ги разбират правилно в под 35% от случаите. Това показва, че проблемът не е само в точността, а и в интерпретацията на информацията.
Друго изследване, публикувано в JAMA Network Open, тества 21 ИИ модела за медицинска диагностика.
При ограничена информация – само симптоми, възраст и пол – грешките надхвърлят 80%. При добавяне на лабораторни резултати и прегледи точността се повишава над 90%.
Трето проучване в Nature Communications Medicine показва, че чатботовете могат да възпроизвеждат и дори да разширяват неточни или измислени медицински термини, ако те бъдат включени в запитването.
Чатботовете с изкуствен интелект не са медицински специалисти и не трябва да се използват като такива. Експертите препоръчват всяка информация да се проверява в надеждни източници, а посочените линкове да се верифицират допълнително. Когато отговорът звучи прекалено категорично, е добре да бъде поставян под съмнение. И най-важното – ИИ не може да замени консултацията с лекар.
Източник: lifestyle





