U eri u kojoj su podaci nova nafta, istraživači su razvili visokotehnološku “otrovnu pilulu” kako bi zaštitili intelektualno vlasništvo kompanija od krađe i neovlaštenog korištenja za obuku konkurentskih AI sistema.
Uspon GraphRAG tehnologije
Veliki jezički modeli (LLM) poput GPT-4o ili Gemini često imaju poteškoća sa specifičnim, privatnim podacima. Kako bi to riješile, kompanije koriste RAG (Retrieval-Augmented Generation). Naprednija verzija, Microsoftov GraphRAG, organizuje informacije u “grafove znanja” – složene mreže povezanih činjenica.
Iako su veoma efikasni, ovi grafovi su skupi za izradu. Primjera radi, neke specijalizovane baze podataka koštaju više od 5 dolara po jednoj činjeničnoj tvrdnji. Upravo ih ta visoka vrijednost čini glavnom metom digitalne krađe.
AURA: Odbrana putem “kvarenja” podataka
Tim istraživača sa Kineske akademije nauka, Nacionalnog univerziteta u Singapuru i drugih institucija predstavio je okvir pod nazivom AURA (Active Utility Reduction via Adulteration).
Umjesto tradicionalne enkripcije, koja je spora i zahtijeva veliku računarsku snagu, AURA funkcioniše tako što suptilno “truje” ili kvari podatke.
- Mehanizam: Podaci ostaju čitljivi, ali su namjerno modifikovani tako da je potreban tajni ključ kako bi ih AI ispravno interpretirala.
- Posljedica: Ako napadač ukrade podatke i ubaci ih u svoj AI sistem bez ključa, model će konstantno proizvoditi greške i “halucinacije”.
- Stopa uspješnosti: Tokom testiranja, AI modeli koji su koristili ukradene, “otrovane” podatke, preuzimali su netačne informacije u 100% slučajeva, dok su korisnicima davali pogrešne odgovore u 94% situacija.
Zašto ne koristiti običnu enkripciju?
Tradicionalna enkripcija nije praktična za GraphRAG sisteme. Dekriptovanje ogromnih dijelova grafa svaki put kada korisnik postavi pitanje uzrokuje veliko kašnjenje (lag). AURA pruža “živu” odbranu koja ovlaštenim korisnicima (sa ključem) omogućava savršene rezultate, dok ukradenu imovinu čini komercijalno beskorisnom za konkurenciju.
Komentari