Apie projektą
Projekto pavadinimas: Socialinių tinklų tekstų ir struktūrų generavimo įrankio prototipo sukūrimas
Kvietimo Nr.: 02, Priemonė: 01.2.1-MITA-T-852 Inostartas
2018 m. gegužės 25 d. įsigaliojęs Bendrasis duomenų apsaugos reglamentas (BDAR), kuriuo nustatyti griežti reikalavimai dėl asmens duomenų rinkimo, naudojimo ir apsaugos, turėjo įtakos ne tik įmonėms ir organizacijoms, kurios vienokia ar kitokia forma valdo asmens duomenis, bet ir mokslinių tyrimų bei eksperimentinės plėtros galimybėms, nes, net tuo atveju, kai tokie duomenys yra prieinami viešuose šaltiniuose (paieškos sistemose, socialinių tinklų platformose ir pan.), mokslinių ar kitų tyrimų tikslams jų naudoti negalima, jeigu tie duomenys nėra tinkamai anonimizuoti. Šios užduoties automatizavimas yra sudėtingas darbas, kurį, be kita ko, dažnai tenka pradėti nuo nulio, kadangi anotuotų tekstynų, tinkančių tikslinių tyrimų scenarijams, randama retai. Dar sunkiau minėtą automatinio anonimizavimo uždavinį įgyvendinti socialinių tinklų duomenims, nes ribotos galimybės apskritai susirinkti tokius duomenis: jie sunkiai prieinami, yra saugomi privatumo ribojimais (tai ypač galioja Facebook socialiniame tinkle esamam turiniui), neleidžiančiais rinkti, dalytis ir platinti socialinių tinklų duomenų.
Dėl reikiamų duomenų nepasiekiamumo ribotos tampa galimybės dirbtinio intelekto technologijų, nes joms realizuoti reikalingi dideli duomenų kiekiai. Šiai kliūčiai spręsti kaip alternatyvą realiems duomenims siūloma naudoti sintetiniu būdu sugeneruotus duomenis, kurie atspindėtų realių (t. y. socialiniuose tinkluose žmonių sukurtų) duomenų savybes, tačiau šiuos duomenis būtų galima naudoti tyrimams, nenusižengiant socialinių tinklų naudotojų privatumo reikalavimams. Sugeneruotus didelius sintetinius duomenų rinkinius toliau galima naudoti treniruojant dirbtinio intelekto modelius įvairiems tikslams. Viena galimų jų panaudojimo sričių – kibernetinių ir teroristinių atakų prevencija, treniruojant modelius atpažinti šių išpuolių požymius socialinėse medijose.
Projekto tikslas yra sukurti metodiką ir prototipą sintetinių socialinių tinklų duomenų (žinučių ir tinklo struktūrų) generavimui. Sukurtas prototipas leidžia kurti duomenis, kuriuos būtų galima naudoti dirbtinio intelekto modelių kūrimui, įvairių įvykių imitaciniam modeliavimui. Sukurtas įrankis sudaro sąlygas generuoti įvairaus stiliaus žinutes, dinamiškai keisti tinklo struktūrą, imituoti dialogus, diskusijas, realius kalbėtojus ir robotus, melagingas naujienas. Duomenys, sugeneruoti naudojant tokį įrankį, gali būti naudojami, siekiant įvertinti įvairių dirbtinio intelekto metodų efektyvumą su duomenimis, kurie neegzistuoja arba yra nepasiekiami, įvertinti informacijos sklaidą reklaminių kampanijų arba propagandos atveju, melagingų naujienų sklidimą.
Apie projektą
Projekto pavadinimas: Socialinių tinklų tekstų ir struktūrų generavimo įrankio prototipo sukūrimas
Kvietimo Nr.: 02, Priemonė: 01.2.1-MITA-T-852 Inostartas
2018 m. gegužės 25 d. įsigaliojęs Bendrasis duomenų apsaugos reglamentas (BDAR), kuriuo nustatyti griežti reikalavimai dėl asmens duomenų rinkimo, naudojimo ir apsaugos, turėjo įtakos ne tik įmonėms ir organizacijoms, kurios vienokia ar kitokia forma valdo asmens duomenis, bet ir mokslinių tyrimų bei eksperimentinės plėtros galimybėms, nes, net tuo atveju, kai tokie duomenys yra prieinami viešuose šaltiniuose (paieškos sistemose, socialinių tinklų platformose ir pan.), mokslinių ar kitų tyrimų tikslams jų naudoti negalima, jeigu tie duomenys nėra tinkamai anonimizuoti. Šios užduoties automatizavimas yra sudėtingas darbas, kurį, be kita ko, dažnai tenka pradėti nuo nulio, kadangi anotuotų tekstynų, tinkančių tikslinių tyrimų scenarijams, randama retai. Dar sunkiau minėtą automatinio anonimizavimo uždavinį įgyvendinti socialinių tinklų duomenims, nes ribotos galimybės apskritai susirinkti tokius duomenis: jie sunkiai prieinami, yra saugomi privatumo ribojimais (tai ypač galioja Facebook socialiniame tinkle esamam turiniui), neleidžiančiais rinkti, dalytis ir platinti socialinių tinklų duomenų.
Dėl reikiamų duomenų nepasiekiamumo ribotos tampa galimybės dirbtinio intelekto technologijų, nes joms realizuoti reikalingi dideli duomenų kiekiai. Šiai kliūčiai spręsti kaip alternatyvą realiems duomenims siūloma naudoti sintetiniu būdu sugeneruotus duomenis, kurie atspindėtų realių (t. y. socialiniuose tinkluose žmonių sukurtų) duomenų savybes, tačiau šiuos duomenis būtų galima naudoti tyrimams, nenusižengiant socialinių tinklų naudotojų privatumo reikalavimams. Sugeneruotus didelius sintetinius duomenų rinkinius toliau galima naudoti treniruojant dirbtinio intelekto modelius įvairiems tikslams. Viena galimų jų panaudojimo sričių – kibernetinių ir teroristinių atakų prevencija, treniruojant modelius atpažinti šių išpuolių požymius socialinėse medijose.
Projekto tikslas yra sukurti metodiką ir prototipą sintetinių socialinių tinklų duomenų (žinučių ir tinklo struktūrų) generavimui. Sukurtas prototipas leidžia kurti duomenis, kuriuos būtų galima naudoti dirbtinio intelekto modelių kūrimui, įvairių įvykių imitaciniam modeliavimui. Sukurtas įrankis sudaro sąlygas generuoti įvairaus stiliaus žinutes, dinamiškai keisti tinklo struktūrą, imituoti dialogus, diskusijas, realius kalbėtojus ir robotus, melagingas naujienas. Duomenys, sugeneruoti naudojant tokį įrankį, gali būti naudojami, siekiant įvertinti įvairių dirbtinio intelekto metodų efektyvumą su duomenimis, kurie neegzistuoja arba yra nepasiekiami, įvertinti informacijos sklaidą reklaminių kampanijų arba propagandos atveju, melagingų naujienų sklidimą.