IBM a en fait annoncé Task CodeNet, un grand ensemble de données qui vise à aider à enseigner à l’IA comment comprendre et même écrire du code.
Le projet CodeNet a été annoncé aujourd’hui lors de la conférence Believe d’IBM et déclare être le plus grand ensemble de données open-source pour le code (environ 10 fois la taille du plus proche.)
CodeNet comprend 500 millions de lignes de code, 14 millions d’exemples et couvre 55 langages de programmation dont Python, C, Java, Allez, COBOL, Pascal, et plus encore.
Des emplois tels que GPT-3 d’OpenAI montrent comment les IA deviennent assez habiles à écrire les langues des êtres humains, mais l’écriture de leur propre code natif a en fait été laissée à nous. CodeNet a l’intention de modifier cela.
Pour un minimum de l’avenir prévisible, des tâches comme GPT-3 seront un outil pour les personnes qui peuvent augmenter leur productivité en fournissant une exigence fondamentale qui nécessitera encore quelques modifications pour se régler erreurs et compenser les endroits où les gens ont encore un avantage comme l’imagination, l’émotion et la compassion.
CodeNet sera comparable, du moins au début, car il conduira à des outils améliorés qui aideront à accélérer le l’écriture et la surveillance du code par des personnes en améliorant la compréhension de l’intelligence artificielle sur la façon de faire de tels travaux.
« Compte tenu de la richesse de ses programmes composés dans une grande variété de langues, notre société pense que Task CodeNet peut agir comme un ensemble de données de référence pour la traduction source-à-source et faites pour l’IA et le code ce que l’ensemble de données ImageNet a fait il y a des années pour la vision de système informatique », déclare IBM.
L’entrepreneur américain Marc Andreesen a composé de manière célèbre et correcte 2011 que «les applications logicielles mangent le travail ld « . Avance rapide jusqu’à aujourd’hui et même les voitures incluent désormais plus de 100 millions de lignes de code (et prolifèrent, avec l’avènement des voitures autonomes.)
Selon IBM, parmi ses grands clients automobiles, il a récemment approché l’entreprise pour aider à mettre à niveau une possession de 200 millions de dollars composée de 3 500 fichiers Java multi-générations. Ces fichiers comprenaient plus d’un million de lignes de code.
En utilisant sa pile AI for Code, IBM a réduit la procédure de migration de code en cours d’un an du client à seulement 4 semaines.
Cela exemple fait en sorte d’être le premier de beaucoup de dans les années à venir qui ont été considérablement accélérés et améliorés, grâce à Project CodeNet.
(Photo de ThisisEngineering RAEng sur Unsplash)
Toute l’actualité en temps réel, est sur L’Entrepreneur