S04E08
Bytes
The magic of vectors with Redis and LLMs

Tjaž Eržen je ob robu Make IT 2025 gostil Brian Sam-Bodden (Principal Applied AI Engineer) in Raphael De Lio (Developer Advocate) iz Redis.

V pogovoru smo se poglobili v vektorje, vektorske baze, in uporabo slednjih z Redisom pri gradnji sodobnih LLM / RAG - Retrieval-augmented generation sistemov.

Raziskovali smo kako lahko uporaba embedingov in vektorjev pohitri, kot tudi poceni sodobne "AI sisteme".

Strojni povzetek epizode ✨*

V tej epizodi podcasta je gostitelj Tjaž Eržen v pogovoru z gostoma Brianom Sam-Boddenom in Raphaelom De Lio iz podjetja Redis. Skupaj so raziskovali svet vektorjev, vektorskih baz ter njihovo povezavo z velikimi jezikovnimi modeli (LLM), ki so danes eden ključnih gradnikov sodobnih AI rešitev.

Gostje najprej razložijo, kaj so vektorske vdelave (embeddings) in zakaj so uporabne pri različnih nalogah, kot so iskanje po besedilih, klasifikacija in priporočilni sistemi. Namesto da bi za vsako nalogo neposredno klicali LLM – kar je pogosto počasno in drago – lahko z uporabo vektorjev dosegamo hitrejše in stroškovno učinkovitejše rezultate. S tem se močno zmanjša obremenitev modelov in izboljša odzivnost aplikacij.

Osrednja tema pogovora je bila uporaba Redisa kot vektorske baze, saj Redis poleg klasičnih podatkovnih tipov omogoča tudi iskanje po podobnosti in kombiniranje vektorskih podatkov z obstoječimi strukturami. Gostje predstavijo praktične primere, kot so razvrščanje dokumentov glede na vsebino, iskanje relevantnih informacij v velikih zbirkah podatkov ter gradnja sodobnih RAG (retrieval-augmented generation) sistemov, kjer LLM-i sodelujejo z zunanjimi viri znanja.

Pogovor se dotakne tudi izzivov, ki jih prinaša tak pristop – denimo kakovost vektorjev, izbira ustrezne metrike podobnosti, kombinacija različnih tehnik in usklajevanje z obstoječimi arhitekturami. Gostje poudarijo, da je pri vpeljavi takšnih sistemov ključno razmišljati o optimizaciji stroškov, hitrosti in natančnosti.

Zaključek epizode je jasen: vektorji in Redis skupaj odpirajo pot do gradnje hitrejših, cenejših in zanesljivejših AI rešitev, ki bistveno izboljšajo uporabniško izkušnjo ter dopolnjujejo zmogljivosti velikih jezikovnih modelov.

⚠️ Strojni povzetek je napisan s pomočjo umetne inteligence in lahko vsebuje nepravilnosti. ⚠️

Izid:
2025-08-18