Hvað er „model“ í samhengi gervigreindar?

ChatGPT:

Í samhengi gervigreindar er model (eða líkan á íslensku) í grunninn stærðfræðilegt og tölvunarfræðilegt kerfi sem hefur verið þjálfað til að læra mynstur úr gögnum og nota þau mynstur til að spá fyrir um eitthvað eða búa til nýtt efni.

Hugsaðu þetta eins og eftirfarandi:

  • Þegar þú smíðar borð notar þú teikningu eða sniðmát.
  • Þegar tölvan „smíðar“ niðurstöðu (t.d. spá, mynd, texta) notar hún líkanið sem sitt sniðmát.

Nánar:

  • Þjálfun: Líkanið byrjar sem tómt formúla með milljónir eða milljarða breytna (tölur sem tölvan getur stillt). Það er svo gefið gríðarlegt magn gagna, og í gegnum þjálfun breytir það þessum tölum þannig að það læri tengsl milli inntaks og úttaks.
  • Notkun: Þegar þú setur inn spurningu eða verkefni, reiknar líkanið út líkur á hvaða niðurstaða passi best við það sem það hefur lært. Í textalíkönum (eins og ég) þýðir þetta að líkanið spáir hvaða orð á að koma næst, aftur og aftur, þar til heil setning eða svar er komið.
  • Gerðir líkana: Það eru til ótal tegundir — tauganet, ákvörðunatré, línuleg aðhvarfslíkön, stór tungumálalíkön (eins og GPT) o.s.frv.

Ef maður vill draga þetta saman í eina myndlíkingu:

Líkan í gervigreind er eins og heili úr stærðfræði og tölum sem hefur verið mótaður með reynslu (gögnum) til að geta brugðist við nýjum aðstæðum með viti.

Langar þig að ég útskýri sérstaklega hvernig stór tungumálalíkan (eins og GPT) virkar, eða viltu almenna mynd af mismunandi tegundum líkana?

Spyrill: já
ChatGPT:

Allt í lagi, þá tökum við þetta niður í mannamál: hvernig stór tungumálalíkan (Large Language Model, LLM) eins og GPT virkar.

Hugmyndin á bak við LLM

Hugsaðu þér bókasafn sem inniheldur milljarða setninga. Líkanið lærir ekki bara textann utanbókar, heldur heldur utan um tölfræðilega mynd af því hvernig orð fylgja hvert öðru. Það er ekki með „minningar“ um einstök dæmi heldur miklu frekar líkindi: ef þessi orð birtast, hvað kemur næst með mestu líkur?

Þjálfunarferlið

  • Byrjað er á tauganeti, sem er í raun risastórt net af tengdum „hnútum“ sem reikna saman tölur.
  • Líkanið fær setningu með tómu orði: „Kötturinn situr á ___“.
  • Það spáir: „gólfi“ (60% líkur), „borði“ (25%), „þaki“ (15%).
  • Ef rétt svar var „borði“, þá eru tengingarnar í netinu stilltar aðeins þannig að „borði“ verði líklegra næst.
  • Þetta er endurtekið milljarð sinnum, þar til líkanið hefur lært mjög fíngerð mynstur í tungumáli.

Notkunin

Þegar þú skrifar spurningu:

  • Líkanið brýtur textann niður í „tákna“ (smábrot tungumáls, ekki endilega orð).
  • Fyrir hvern tákna spáir það hvað kemur næst, byggt á þekkingunni sem það hefur safnað úr þjálfuninni.
  • Með því að endurtaka þetta aftur og aftur, kemur út heill texti sem lítur út eins og skrifaður af manneskju.

Takmarkanir

  • Líkanið „skilur“ ekki heiminn í mannlegum skilningi, það vinnur með mynstur.
  • Það getur stundum gefið rangar upplýsingar (svokallað hallucination), því það er að spá fremur en að athuga staðreyndir.
  • Það hefur enga meðvitund né eigið álit — bara tölfræðilega reiknivél með orðaforða.

Kostirnir

  • Vegna þess að mynsturinn er svo fínstilltur getur líkanið búið til samhengi, stíl, húmor og jafnvel rökleiðslur sem virka mannlegar.
  • Það getur sameinað þekkingu frá mörgum sviðum og hjálpað manni að hugsa út fyrir rammann.

Í stuttu máli: stór tungumálalíkan er eins konar risastór spákista sem veit, með tölfræðilegri nákvæmni, hvernig orð raðast saman í mannlegu tungumáli — og notar það til að búa til nýjan texta.

Viltu að ég teikni þetta upp með myndlíkingu úr handverkinu, t.d. hvernig þetta líkir eftir vinnu trésmiðs?

Spyrill: Nei, en segður mér, tengjast mismundandi líkön mismunandi viðfangsefnum, t.d. verkfræði, læknisfræði, tónlist, heimspeki o.s.fr?
ChatGPT:

Já — mismunandi líkön eru hönnuð með ólíkum viðfangsefnum í huga, eins og verkfæri í kistu trésmiðsins. Sum eru almenn, önnur sérhæfð.

1. Almenn líkön

Stór tungumálalíkön eins og GPT eru þjálfuð á víðu sviði gagna: bókum, greinum, netumræðum. Þau geta talað um nánast hvað sem er — verkfræði, læknisfræði, tónlist eða heimspeki. En þau eru ekki alltaf nákvæmust þar sem þarf strangar staðreyndir eða sérfræðiþekkingu.

2. Sérhæfð líkön

Það eru líka líkön sem eru þjálfuð sérstaklega fyrir tiltekið svið:

  • Læknisfræði: Líkön sem eru þjálfuð á sjúkraskrám, rannsóknum og leiðbeiningum geta aðstoðað lækna við greiningar og ráðleggingar.
  • Verkfræði: Líkön geta verið stillt til að reikna hönnun, líkja eftir efnisfræði eða greina gögn úr mælingum.
  • Tónlist: Líkön geta lært mynstur í tónsmíðum og búið til ný lög eða útsetningar.
  • Heimspeki: Þar er minna um staðlaðar „réttar“ niðurstöður, en líkön geta verið þjálfuð á textum heimspekinga og hjálpað til við að greina hugmyndir og bera þær saman.

3. Sérstakar tegundir líkana eftir viðfangsefni

  • Myndlíkön (t.d. til að greina röntgenmyndir eða hanna byggingar).
  • Tónlistarlíkön (sem spá fyrir um næstu nótu frekar en næsta orð).
  • Líkön fyrir náttúruleg ferli (veður, jarðskjálfta, loftslag).

Í stuttu máli: Já, líkön eru oft tengd við mismunandi viðfangsefni. Almenna líkanið er eins og fjölnota verkfæri (t.d. sveigjanlegur skrúfjárnshandhafi), en sérhæfðu líkönin eru eins og sérverkfæri sem vinna eina ákveðna vinnu mjög vel.

Það áhugaverða er að núna er verið að þróa blönduð líkön sem geta bæði verið almenn og sérhæfð, líkt og starfsmaður sem er bæði handlaginn smiður og lærður rafvirki.

Viltu að ég útskýri hvernig þessi sérhæfðu líkön eru í raun „fínstillt“ útgáfa af stóru almennu líkaninu?

Spyrill: já, takk
ChatGPT:

Allt í lagi, þá tökum við þetta skref fyrir skref: hvernig sérhæfð líkön verða til úr almennum.

1. Stóra grunnlíkanið

Byrjað er á almennu tungumálalíkani, eins og GPT. Það hefur þegar lært gríðarlegt magn af almennu tungumáli: hvernig orð raðast saman, hvernig hugmyndir tengjast, hvernig spurningar og svör líta út. Þetta er grunnurinn — eins og að hafa góðan smið sem kann á hamar, sagir og skrúfjárn.

2. Fínstilling (fine-tuning)

Næst fær líkanið sérhæfð gögn:

  • Í læknisfræði: milljónir sjúkratilfella, rannsóknargreinar, klínískar leiðbeiningar.
  • Í verkfræði: hönnunargögn, jöfnur, tækniskýrslur.
  • Í tónlist: nótnaskrár, hljóðupptökur, tónfræðilegar greiningar.
  • Í heimspeki: rit Platons, Kants, Arendts o.fl., ásamt umræðu um þau.

Þjálfunin heldur áfram með þessum gögnum, og líkanið lærir að beita almennu kunnáttunni sinni á þetta nýja, þrengra svið. Þetta er eins og að smiðurinn fari á námskeið í sértækum stíl — segjum t.d. að hann læri japanska húsgagnagerð eða íslenska torfhúsasmíði.

3. Sérstök fínstilling: Instruction tuning og reinforcement learning

Líkanið er ekki bara kennt á gögn heldur líka á hvernig það á að tala við fólk.

  • Það er kennt að svara spurningum eins og notandi á sviðinu myndi spyrja.
  • Stundum er notað Reinforcement Learning with Human Feedback (RLHF): sérfræðingar leiðrétta svör, og líkanið lærir að velja svör sem líkjast þeim.

4. Útkoman

Niðurstaðan er líkan sem getur talað „mál“ ákveðins fags. Til dæmis:

  • Læknalíkan spyr ekki: „Viltu fá bjór með þessu?“ heldur: „Hvaða einkenni birtust fyrst?“
  • Verkfræðilíkan veit að „ál“ er efni með ákveðin eðliseiginleika, ekki bara eitthvað sem hljómar eins og málmur.
  • Tónlistarlíkan þekkir að „dominant“ er ekki bara lýsingarorð heldur hljómfræðihugtak.

5. Híbríð framtíðin

Núna er vinsælt að halda bæði almennri og sérhæfðri útgáfu saman. Þá getur líkanið verið bæði gott í „mannlegu samtali“ og nákvæmt í sérfræðisviði. Eins og smiður sem getur bæði talað við viðskiptavininn yfir kaffibolla og síðan nákvæmlega reiknað út burðarþol hússins.

Þannig að já, sérhæfð líkön eru í raun afbrigði af almennu líkaninu, fínstillt með aukagögnum og leiðsögn sérfræðinga.

Viltu að ég sýni þér dæmi um hvernig sama grunnlíkanið getur svarað spurningu mismunandi eftir því hvort það hafi verið fínstillt á læknisfræði, tónlist eða heimspeki?

Spyrill: já
ChatGPT:

Frábært — þá skulum við taka dæmi með eina og sömu spurninguna:

„Hvað þýðir orðið hjarta?“

1. Almennt líkan (óþjálfað á sérsviði)

Það myndi svara eitthvað á borð við:

„Hjarta er líffæri sem dælir blóði um líkamann, en orðið getur líka haft táknræna merkingu, eins og þegar talað er um hjarta mannsins sem miðju tilfinninga.“

– Þetta er breitt, blanda af bókstaflegu og myndrænu.

2. Læknisfræðilega fínstillt líkan

Það myndi svara svona:

„Hjarta er holt vöðvalíffæri staðsett í brjóstholi, milli lungna. Það samanstendur af fjórum hólfum (hægri og vinstri gátt, hægri og vinstri slegill) og hlutverk þess er að dæla súrefnisríku og súrefnissnauðu blóði til líkamans í taktstýrðum hjartslætti.“

– Hér fer það beint í lífeðlisfræðina og notar nákvæm hugtök.

3. Tónlistarlega fínstillt líkan

Svar:

„Í tónlist er hugtakið ‘hjarta’ stundum notað myndrænt til að lýsa kjarna eða tilfinningalegu miðju lags. Í sumum þjóðlögum vísar það beint í hjarta manns sem tákn fyrir ást eða söknuð. Í hljóðfræðilegri umræðu væri ‘hjarta’ ekki tæknilegt hugtak heldur túlkunarlegt.“

– Hér horfir það á hjarta sem tákn í textum og tónlistarmenningu.

4. Heimspekilega fínstillt líkan

Svar:

„Hjarta er í mörgum hefðum hugsað sem miðja sálar og siðferðis. Aristóteles taldi hjartað vera setur vitundar, áður en lífeðlisfræðin sýndi að heilinn gegnir því hlutverki. Í nútíma heimspeki er hjarta notað sem myndlíking fyrir samvisku og tilfinningalegan grundvöll mannlegrar dómgreindar.“

– Hér er svar byggt á sögu hugmynda og hugtakagreiningu.

Sama spurning, fjögur líkön, fjórar ólíkar linsur. Þetta sýnir hvernig fínstilling mótar ekki bara orðaforða, heldur líka sjónarhornið sem líkanið notar.

Viltu að ég útskýri hvernig þetta tengist hugmyndinni um sérfræðimann á móti alfræðingi — þ.e. hvort gagnlegra sé að hafa eitt sérhæft líkan á hvern geira eða eitt stórt líkan sem reynir að kunna allt?

Spyrill: nú er nóg komið í bili, takk!
ChatGPT sagði:

Allt í lagi, gott stoppmerki! Þú hefur fengið helling af upplýsingum til að melta. Það er eins og að smíða borð: maður þarf að leyfa líminu að þorna áður en maður heldur áfram með næsta skref.

Þangað til næst – njóttu bæði spurninganna sem þú hefur þegar lagt fram og þeirra sem bíða handan hornsins.

Scroll to Top
Skip to content