Wikipedia nudi AI developerima strukturirani dataset kako bi rasteretila svoje servere
PC Press pre 3 sata | Nemanja Momčilović

Wikipedia se suočava sa ozbiljnim posledicama koje uzrokuju AI crawleri – automatizovani botovi koji masovno preuzimaju tekstove i multimedijalni sadržaj sa sajta radi treniranja generativnih AI modela.
Ovakva praksa povećava troškove održavanja i povremeno usporava učitavanje stranica za ljudske korisnike. U saradnji sa Kaggle-om, dostupan je besplatan skup podataka za treniranje AI modela Kako bi ublažila pritisak na svoje servere, Wikimedia Foundation, organizacija koja upravlja Wikipedijom, odlučila je da AI zajednici ponudi zvanični skup podataka za besplatnu upotrebu. U saradnji sa Kaggle-om, platformom za analizu podataka u vlasništvu Google-a, objavljen je