Ta spletna stran hrani piškotke, da bi vam zagotovili boljšo uporabniško izkušnjo in popolno funkcionalnost te strani.

Analitične piškotke uporabljamo s storitvijo Google Analytics, samo z vašo privolitvijo. Sprejemam Zavrnitev Več informacij

ponedeljek, 16. september 2024

Kako pripraviti podatke na GenAI? | SoftwareOne

Razmišljate o uvedbi generativne umetne inteligence (GenAI) v svoji organizaciji? Preden začnete, preučite nabore podatkov, ki jih boste uporabljali za usposabljanje modelov, in se prepričajte, da imajo kakovost, funkcije, varnostne ukrepe in skalabilnost, ki jih potrebujete za optimizacijo rezultatov umetne inteligence.

Odkar je bilo konec leta 2022 predstavljeno OpenAI orodje za generativno umetno inteligenco (GenAI) ChatGPT, so organizacije vseh vrst začele preučevati načine za vključitev njenih zmožnosti v svoje izdelke, storitve in vsakodnevno poslovanje. Danes hitro rastoča paleta GenAI orodij podjetjem omogoča samodejno pisanje kopij za spletne strani in tržno-komunikacijska besedila, ustvarjanje slik in videoposnetkov, generiranje programske kode, analiziranje podatkov, izvajanje raziskav in še veliko več.

Za razliko od tradicionalnih aplikacij umetne inteligence orodja GenAI niso usposobljena z uporabo specifičnih podatkov za specifične naloge, temveč so zgrajena na podlagi temeljnih modelov, ki uporabljajo veliko količino raznolikih podatkov - ne le besed, temveč tudi slik, videoposnetkov, zvoka in drugih vrst informacij. Te velike količine podatkov za usposabljanje omogočajo GenAI orodjem, ki jih poganjajo, da ustvarijo natančne odgovore na skoraj vsako zahtevo ali pa občasno podajo napačne odgovore.

Da bi povečali možnosti za prvi rezultat in zmanjšali možnosti za drugega, je pomembno, da svoj temeljni model gradite na visokokakovostnih podatkih in najboljših praksah. 

Kakovost in predobdelava podatkov

Čeprav se temeljni modeli usposabljajo na širšem naboru podatkov, kot se uporabljajo za posamezne naloge aplikacij umetne inteligence, morajo biti vaši podatki za usposabljanje pomembni za težave, ki jih želite rešiti z GenAI. Zato morate črpati iz istih virov podatkov, ki bi jih vaši zaposleni uporabili za iskanje odgovorov, ki jih potrebujejo.

Ko boste te vire določili, boste morali te podatke preveriti in predhodno obdelati, da se prepričate, da so točni, zanesljivi in preverljivi. Zagotoviti morate tudi, da so dobro shranjeni (najbolje v oblaku), varni in ustrezno vključeni v sisteme, ki jih uporabljate. Glede na vrsto podatkov boste morda morali tudi očistiti ali posodobiti datoteke, preoblikovati formate elementov, spremeniti velikost slik ali opraviti druge popravke. Poleg tega je treba preveriti manjkajoče vrednosti in podatkovne vrzeli ter jih po potrebi zapolniti z dodajanjem novih informacij iz drugih virov podatkov.

Sinteza podatkov

Inženiring značilnosti vključuje manipulacijo ali pridobivanje informacij iz obstoječih neobdelanih podatkov, da bi ustvarili nove vrste spremenljivk ali podatkovnih nizov, ki bodo prebavljivi za temeljni model, ki ga uporabljate. Kako boste upravljali ta postopek, je odvisno od tega, kaj želite doseči z uporabo GenAI.

Dobro načrtovanje funkcij pomeni, da je treba razmisliti o tem, kakšne informacije bodo iskali vaši uporabniki GenAI in katere podatkovne zbirke bodo potrebne za ustvarjanje uporabnih in natančnih odgovorov. Pri tem boste morda morali pridobiti mnenja strokovnjakov s tega področja, da bi zagotovili rezultate, ki temeljijo na dejstvih in so ustrezni.

Zasebnost in varnost podatkov

Ne glede na vrsto GenAI orodja, ki ga uporabljate, morate razumeti morebitne posledice za zasebnost in varnost podatkov. Nekatera orodja GenAI, namenjena potrošnikom, na primer opozarjajo, da se lahko podatki, ki jih vnesejo uporabniki, uporabijo za usposabljanje modelov v prihodnosti. Zato se morajo uporabniki izogibati posredovanju zahtev, ki vsebujejo občutljive, lastniške ali zaupne informacije. Tudi orodja, ki so že na voljo, lahko glede na regije, v katerih delujejo, upoštevajo različne zahteve glede prebivališča in zasebnosti podatkov.

Družba Gartner je v nedavni raziskavi ugotovila, da 70 % vodij, pristojnih za pravne zadeve, skladnost in zasebnost, meni, da bo GenAI v naslednjih dveh letih predstavljal največjo skrb. Skupina analitikov pa pravi, da napredne tehnologije, kot sta GenAI in oblak, spodbujajo povečano porabo na področju varnosti in upravljanja tveganj, ki naj bi se po napovedih leta 2024 povečala za 14 % na 215 milijard dolarjev.

Napoveduje tudi, da bo do leta 2026 zaradi tako dobrih ponaredkov umetne inteligence 30 % organizacij menilo, da zgolj obrazna biometrija ne bo zanesljiva pri preverjanju in potrjevanju identitete.

Ne glede na to, ali uporabljate orodje GenAI, ki ga je razvil tretji ponudnik, ali razvijate lastno orodje, upoštevajte najboljše prakse za varno in odgovorno umetno inteligenco. Med ključnimi previdnostnimi ukrepi, ki jih morate sprejeti: skrbno preglejte in preverite svoje podatke, razumite, kaj vaša tehnologija zmore in česa ne zmore, za kaj jo smete in zaradi česa ne smete uporabljati, redno preizkušajte svoje vhodne podatke, modele, sisteme in rezultate ter jih po potrebi prilagodite, da izboljšate rezultate.

Skaliranje za GenAI

Na koncu se prepričajte, da lahko izbrane tehnologije obdelujejo velike podatkovne nize, ki so potrebni za učinkovite GenAI aplikacije, in da jih je mogoče po potrebi razširiti, ko se vaše potrebe razvijajo in rastejo. Zlasti pri obdelavi podatkov so rešitve v oblaku primernejše od lokalnih sistemov. 

Copilot za Microsoft 365: prihranite 15 % na 10+ licenc

Copilot za Microsoft 365 je Microsoftova tehnologija generativne umetne inteligence, ki je vključena v paket vsakodnevno najbolj uporabljenih aplikacij – Word, PowerPoint, Outlook, Excel in Teams. Copilot je več kot le vaš osebni pomočnik, rešitev poenostavlja, izboljšuje in obogati vaše vsakodnevno delo s pametnimi predlogi, prilagojenimi nasveti in priročno avtomatizacijo za vsakodnevne operativne naloge. Kot napoveduje Microsoft, bo orodje v slovenskem jeziku na voljo že v septembru. SoftwareOne pa ima za vas odlično priložnost!

Vse do 31. decembra 2024 izkoristite 15% popust pri nakupu nove naročnine za 10 do 300 Copilot za Microsoft 365 licenc.

Za več informacij kontaktirajte SoftwareOne strokovnjake.

 

*Ponudba velja za stranke s standardnimi licenčnimi zahtevami za Copilot za Microsoft 365 po vsem svetu. Velja tako za nove kot obstoječe stranke, ki želijo kupiti novo naročnino za Copilot za Microsoft 365 licence. Stranke, ki kupijo 50 ali več licenc, so lahko upravičene do Microsoftovega financiranega programa Evaluation Accelerator, ki vam lahko pomaga pri uvajanju in preizkušanju programa Copilot za Microsoft 365.


Avtor: Wiktor Zdzienicki | Global Practice Manager, Data and AI, SoftwareOne

Za več informacij nam pišite na e-naslov info@ntk.si ter se nam pridružite na naših družbenih medijih Facebook, Instagram, Twitter, YouTube in LinkedIn.