Cognition AI har introdusert Devin, som beskrives som verdens første fullstendig autonome AI-programvareingeniør.
Cognition AI ble opprettet av kodeekspertene Scott Wu, Steven Hao og Walden Yan, og ble støttet av en serie A-finansiering på $21 millioner ledet av Peter Thiels Founders Fund.
En av grunnleggerne, Scott Wu, beskrev Devin som en "utrettelig, dyktig lagkamerat", som er i stand til å jobbe sammen med mennesker eller fullføre hele prosjekter på egen hånd.
Devin er langt mer sofistikert enn OpenAI og Microsofts CoPilot. I stedet kan den sammenlignes med en AI-agent som utvikler programvare fra naturlige språkmeldinger til et ferdig prosjekt i stedet for å spytte ut individuelle kodesegmenter.
Kognisjon AI utgitt en rekke videodemoer Devin kan utføre et bredt spekter av oppgaver innen programvareutvikling og ingeniørarbeid.
Noen av Devins fremviste applikasjoner fra Cognition AI-demonstrasjonen:
- Tilpasningsevne til ny teknologi: Etter å ha lest et blogginnlegg, brukte Devin ControlNet on Modal til å generere bilder innebygd i skjulte meldinger, noe som demonstrerte ControlNets evne til å lære og tilpasse seg kreative inndata.
- Helhetlig apputvikling: Devin utviklet på egen hånd et interaktivt nettsted som simulerte Game of Life. Devin administrerte hele prosjektets livssyklus, fra å innlemme funksjoner basert på brukerforespørsler til å distribuere applikasjonen på Netlify.
- Autonom feilsøking: En annen av Devins nøkkelfunksjoner er evnen til å identifisere og rette opp feil i kodebaser uten menneskelig inngripen. Cognition demonstrerte dette ved å vise Devin vedlikeholde og feilsøke en konkurransebasert programmeringsbok med åpen kildekode.
- Opplæring av AI-modeller: Devin flyttet grensene for AIs rolle i programvareteknikk ved å sette opp og finjustere en stor språkmodell (LLM) på egen hånd, kun gitt en lenke til et forskningsdepot på GitHub. Ja, dette er en AI-modell som er i stand til å skape AI-modeller på egen hånd.
Devins evner ble grundig evaluert i SWE-bench-kodingstesten. Denne utfordrende testen ber agenter om å løse virkelige GitHub-problemer i arkiver med åpen kildekode.
Devins ytelse var bemerkelsesverdig: Han løste 13,86% av problemene fra ende til ende, et enormt sprang fra det forrige toppnivået, som bare klarte 1,96%.
Til Bloomberg sa Wu: "Å lære AI å være en programmerer er faktisk et veldig dypt algoritmisk problem som krever at systemet tar komplekse beslutninger og ser noen skritt inn i fremtiden for å avgjøre hvilken rute det skal velge."
"Det er nesten som et spill vi alle har spilt i tankene våre i årevis, og nå har vi muligheten til å kode det inn i et AI-system."
Denne enorme forbedringen demonstrerer Devins avanserte problemløsningsevner og potensialet de har til å øke produktiviteten og effektiviteten i programvareutviklingen.
Devins evne til å utføre komplekse programvaretekniske oppgaver på egen hånd gir et glimt inn i en fremtid der manuell programmering er så godt som utryddet.
Nvidias administrerende direktør Jensen Huang var inne på dette under World Government Summit i Dubai, og sa til publikum: "Det er vår jobb å skape datateknologi slik at ingen trenger å programmere. Og at programmeringsspråket er menneskelig, alle i verden er nå programmerere. Dette er mirakelet med kunstig intelligens."
Men kunstig intelligens er også utmerket til å erstatte kreative jobber, Så hvor skal menneskene henvende seg?
Det handler om å bruke AI når det er effektivt, samtidig som man dyrker kritisk tenkning og kreativ smidighet - og sannsynligvis en god dose flaks i den karriereveien man har valgt.