Cognition AI har introducerat Devin, som beskrivs som världens första helt autonoma AI-mjukvaruingenjör.
Cognition AI skapades av kodningsexperterna Scott Wu, Steven Hao och Walden Yan, med en serie A-finansiering på $21 miljoner under ledning av Peter Thiels Founders Fund.
En av grundarna, Scott Wu, beskrev Devin som en "outtröttlig, skicklig lagkamrat", som kunde arbeta tillsammans med människor eller självständigt slutföra hela projekt.
Devin är mycket mer sofistikerad än OpenAI och Microsofts CoPilot. Istället kan den jämföras med en AI-agent som utvecklar programvara från instruktioner på naturligt språk till ett färdigt projekt snarare än att spotta ut enskilda kodsegment.
Kognition AI släppt en serie videodemonstrationer detaljera Devins kapacitet inom ett brett spektrum av uppgifter inom mjukvaruutveckling och teknik.
Några av Devins applikationer som visades upp från Cognition AI-demonstrationen:
- Anpassningsförmåga till ny teknik: Efter att ha granskat ett blogginlägg använde Devin ControlNet on Modal för att generera bilder med dolda meddelanden, vilket visar på förmågan att kreativt lära sig och anpassa sig efter input.
- App-utveckling från början till slut: Devin utvecklade självständigt en interaktiv webbplats som simulerar Game of Life. Devin hanterade hela projektets livscykel, från att införliva funktioner baserade på användarförfrågningar till att distribuera applikationen på Netlify.
- Autonom felsökning: En annan av Devins viktigaste egenskaper är dess förmåga att identifiera och åtgärda buggar i kodbaser utan mänsklig inblandning. Cognition demonstrerade detta genom att visa hur Devin underhåller och felsöker en tävlingsbok i programmering med öppen källkod.
- Träning av AI-modeller: Devin flyttade fram gränserna för AI:s roll inom programvaruteknik genom att självständigt konfigurera och finjustera en stor språkmodell (LLM), med endast en länk till ett forskningsarkiv på GitHub. Ja, det här är en AI-modell som kan skapa AI-modeller på egen hand.
Devins kapacitet utvärderades noggrant i SWE-bench kodningsbenchmark. Detta utmanande test ber agenter att lösa verkliga GitHub-problem i öppna källkodsarkiv.
Devins prestation var anmärkningsvärd: han löste 13,86% av problemen korrekt från början till slut, vilket var ett stort steg framåt jämfört med den tidigare toppmodern som bara klarade 1,96%.
Till Bloomberg sa Wu: "Att lära AI att programmera är faktiskt ett mycket djupt algoritmiskt problem som kräver att systemet fattar komplexa beslut och ser några steg in i framtiden för att bestämma vilken väg det ska välja."
"Det är nästan som ett spel som vi alla har spelat i våra tankar i åratal, och nu finns det en chans att koda in det i ett AI-system."
Denna enorma förbättring visar på Devins avancerade problemlösningsförmåga och dess potential att öka produktiviteten och effektiviteten inom programvaruutveckling.
Devins förmåga att självständigt utföra komplexa programvaruutvecklingsuppgifter ger en glimt av en framtid där manuell programmering är i det närmaste utrotad.
Nvidias VD Jensen Huang tog upp detta vid World Government Summit i Dubai och sa till publiken: "Det är vårt jobb att skapa datorteknik som gör att ingen behöver programmera. Och att programmeringsspråket är mänskligt, alla i världen är nu programmerare. Det är detta som är miraklet med artificiell intelligens."
Men AI är också utmärkt för att ersätta kreativa jobb, så vart vänder sig människan?
Det kommer att handla om att använda AI när det är effektivt och samtidigt odla kritiskt tänkande och kreativ smidighet - och förmodligen en rejäl dos tur i din valda karriärbana.