OpenAI har kunngjort planer om å øke forskningen på "superintelligens" - en form for kunstig intelligens med evner som overgår det menneskelige intellekt.
Mens AI-superintelligens kan virke fjernt, mener OpenAI at utviklingen kan skje i løpet av få år.
OpenAI sier: "For øyeblikket har vi ingen løsning for å styre eller kontrollere en potensielt superintelligent AI og forhindre at den går amok." Det er en ganske illevarslende uttalelse fra verdens ledende AI-selskap.
For å redusere risikoen ved superintelligent AI planlegger OpenAI å innføre nye styringsstrukturer og sette av ressurser til superintelligenstilpasning, som har som mål å tilpasse høyintelligent AI til menneskelige prinsipper og verdier. Tidsrammen for å oppnå dette er fire år.
I et blogginnlegghar OpenAI identifisert tre hovedmål - å utvikle skalerbare treningsmetoder, validere den resulterende modellen og teste justeringsprosessen grundig. Dette innebærer blant annet å automatisere prosessen med å oppdage problematisk atferd i store modeller. For å oppnå dette foreslår OpenAI å utvikle en spesialisert "automatisert alignment-forsker" - en AI som har til oppgave å justere AI.
OpenAI samler også et team av førsteklasses (menneskelige) maskinlæringsforskere og ingeniører for å ta fatt på denne herkulesoppgaven. For å hjelpe til med dette bruker selskapet 20% av de oppkjøpte databehandlingsressursene sine i løpet av de neste fire årene til å håndtere superintelligenstilpasning.
Det nyopprettede "superalignment-teamet" skal ta seg av oppgaven, under ledelse av OpenAIs medgrunnlegger og Chief Scientist Ilya Sutskever og Head of Alignment Jan Leike.
I tillegg planlegger OpenAI å dele resultatene av dette arbeidet med andre. De påpekte også at det eksisterende arbeidet med å forbedre sikkerheten til nåværende modeller, som ChatGPT, og redusere andre AI-risikoer, som misbruk, økonomisk forstyrrelse og desinformasjon, vil fortsette.
I blogginnlegget etterspørres også interesse for stillingene deres for forskningsingeniør, forsker, og forskningsleder stillinger. Den laveste oppgitte lønnen er $245 000 årlig, med en lønnsspredning opp til $450 000.
OpenAIs teknikker for AI-tilpasning
I et tidligere blogginnlegg om superintelligens, beskriver OpenAI to brede tilpasningsteknikker:
1: Opplæring av AI med tilbakemeldinger fra mennesker: Denne tilnærmingen handler om å raffinere AI ved hjelp av menneskelige responser og instruksjoner. For eksempel trenes en AI opp til å gi responser som er i tråd med både direkte kommandoer og mer subtile intensjoner. Den kunstige intelligensen lærer av eksplisitte instruksjoner og mer implisitte signaler, som for eksempel å sikre sannferdige og trygge svar. En menneskesentrert tilnærming kan imidlertid ha problemer med komplekse funksjoner, og det er arbeidskrevende og tidkrevende.
2: Opplæring av modeller for å bistå menneskelig evaluering: Den andre tilnærmingen erkjenner at etter hvert som AI blir mer sofistikert, er det oppgaver den kan utføre som det er vanskelig for mennesker å evaluere. I denne tilnærmingen brukes kunstig intelligens til å utføre oppgaver og til å evaluere kvaliteten på disse oppgavene. En kunstig intelligens kan for eksempel brukes til å kontrollere nøyaktigheten av informasjon, oppsummere lange dokumenter slik at det blir enklere for mennesker å vurdere dem, eller til og med kritisere sitt eget arbeid.
Det endelige målet er å utvikle AI-systemer som effektivt kan hjelpe mennesker med å evaluere komplekse oppgaver etter hvert som AI-intelligensen overskrider grensene for menneskelig erkjennelse.
OpenAI sier at de mener at superintelligens er "gjennomførbart". Selv om utsiktene til superintelligent AI virker lysår unna, ville det være uklokt å anta at OpenAI bare er optimistiske.