Cognition AI heeft Devin geïntroduceerd, omschreven als 's werelds eerste volledig autonome AI-software engineer.
Cognition AI is opgericht door coderingsexperts Scott Wu, Steven Hao en Walden Yan, ondersteund door een Serie A-financiering van $21 miljoen onder leiding van Peter Thiel's Founders Fund.
Een van de oprichters, Scott Wu, beschreef Devin als een "onvermoeibare, vaardige teamgenoot" die in staat is om naast mensen te werken of zelfstandig hele projecten af te ronden.
Devin is veel geavanceerder dan OpenAI en Microsofts CoPilot. In plaats daarvan is het vergelijkbaar met een AI-agent die software ontwikkelt vanuit aanwijzingen in natuurlijke taal tot een afgerond project in plaats van individuele codesegmenten uit te spugen.
Cognitie AI een reeks videodemo's uitgebracht Devin's vaardigheden over een breed spectrum van softwareontwikkeling en engineeringstaken.
Enkele van Devin's getoonde toepassingen van de Cognition AI demo:
- Aanpassingsvermogen aan nieuwe technologieën: Na het lezen van een blogpost heeft Devin ControlNet on Modal met succes gebruikt om afbeeldingen te genereren die zijn ingesloten in verborgen berichten, wat aantoont dat ControlNet in staat is om creatief te leren en zich aan te passen aan input.
- End-to-end app-ontwikkeling: Devin ontwikkelde autonoom een interactieve website die de Game of Life simuleert. Devin beheerde de hele levenscyclus van het project, van het toevoegen van functies op basis van verzoeken van gebruikers tot het implementeren van de applicatie op Netlify.
- Autonoom debuggen: Een andere belangrijke eigenschap van Devin is de mogelijkheid om bugs in codebases te identificeren en te corrigeren zonder menselijke tussenkomst. Cognition demonstreerde dit door Devin een open-source competitief programmeerboek te laten onderhouden en debuggen.
- AI-model training: Devin verlegt de grenzen van de rol van AI in software-engineering door autonoom een groot taalmodel (LLM) op te zetten en af te stellen, waarbij hij alleen een link kreeg naar een onderzoeksrepository op GitHub. Ja, dit is een AI-model dat zelfstandig AI-modellen kan maken.
De capaciteiten van Devin werden rigoureus geëvalueerd met de SWE-bench coderingsbenchmark. Deze uitdagende test vraagt agenten om echte GitHub-problemen in open-source repositories op te lossen.
De prestaties van Devin waren opmerkelijk, hij loste 13,86% van de problemen end-to-end correct op, een enorme sprong voorwaarts ten opzichte van de vorige state-of-the-art, die slechts 1,96% haalde.
Tegen Bloomberg zei Wu: "AI leren programmeren is eigenlijk een heel diep algoritmisch probleem waarbij het systeem complexe beslissingen moet nemen en een paar stappen in de toekomst moet kijken om te beslissen welke route het moet kiezen."
"Het is bijna een spel dat we allemaal al jaren in ons hoofd spelen en nu hebben we de kans om het in een AI-systeem te coderen."
Deze enorme verbetering toont Devin's geavanceerde probleemoplossende vaardigheden en het potentieel ervan om de productiviteit en efficiëntie in softwareontwikkeling te verbeteren.
Devin's vermogen om autonoom complexe software engineering taken uit te voeren biedt een blik in een toekomst waarin handmatig programmeren zo goed als uitgestorven is.
Nvidia CEO Jensen Huang ging hier op in tijdens de World Government Summit in Dubai, waar hij het publiek vertelde: "Het is onze taak om computertechnologie zo te ontwikkelen dat niemand meer hoeft te programmeren. En dat de programmeertaal menselijk is, iedereen in de wereld is nu een programmeur. Dit is het wonder van kunstmatige intelligentie."
AI is echter ook uitstekend in het vervangen van creatieve banen, Waar kunnen mensen dan terecht?
Het gaat om het hanteren van AI wanneer dat effectief is, terwijl je kritisch denken en creatieve behendigheid cultiveert - en waarschijnlijk een flinke dosis geluk in je gekozen carrièrepad.