Hva er vennlig AI?

vennlig AI er et begrep som brukes av kunstig intelligens (AI) forskere for å referere til AI -systemer som generelt utfører handlinger som er nyttige for menneskeheten i stedet for nøytrale eller skadelige. Dette betyr ikke blind lydighet - tvert imot, brukes begrepet for å beskrive AI -systemer som er vennlige fordi de vil være, ikke på grunn av noen eksternt pålagt kraft. I tillegg til å referere til fullførte systemer, er vennlig AI også navnet på den teoretiske og ingeniørdisiplinen som vil bli brukt til å lage slike system Hans boklengdearbeid om emnet, å skape vennlig AI , publisert online i 2001, er sannsynligvis den første strenge behandlingen av emnet hvor som helst. Yudkowsky påkaller argumenterFra evolusjonspsykologi og andre kognitive vitenskaper for å støtte hans tilnærming til problemet med vennlig AI.

Vennlig AI anses som viktig som en akademisk disiplin fordi tidligere forsøk på å "svare" på problemet med useriøse AI generelt påkalte strenge programmatiske begrensninger, som er bundet til å kollapse under alternative tolkninger, når AI blir smartere enn mennesker, eller bare når den får evnen til å fremme seg selv. Antropomorfisme er også et problem i AI. Fordi evolusjon bygger organismer som har en tendens til å være egoistiske, antar mange tenkere at enhver AI vi bygger ville ha samme tendens, enten umiddelbart eller etter å ha blitt smart nok.

Evolusjon bygger organismer med selvsentrerte målsystemer fordi det ikke er noen annen måte. Altruistiske målsystemer tok mange millioner år å utvikle seg, og gjorde det bare under forhold der medlemmer av samme stamme harD mye å vinne ved å hjelpe hverandre og mye å tape ved å unnlate å gjøre det. Men hvis vi skulle designe et sinn fra bunnen av, kunne vi bygge det uten et selvsentrert målsystem. Dette ville ikke være "å begrense AI" - det vil ganske enkelt skape en AI som er uselvisk av natur.

Ovennevnte observasjon er en av mange som bidrar til feltet Friendly AI, som er ekstremt ny og fremdeles trenger mye arbeid. Noen AI -forskere hevder at vi ikke kan bestemme designfunksjonene som er nødvendige for å implementere vennlig AI til vi har smartere AI -systemer å eksperimentere på. Andre hevder at en rent teoretisk tilnærming ikke bare er mulig, men etisk nødvendig før de begynner et alvorlig forsøk på general AI.

Hva er vennlig AI?

ANDRE SPRÅK