Saagie sera au World IA Cannes Festival du 9 au 11 février→ Venez nous rencontrer, contactez nos équipes !

Écrire du code de qualité est essentiel en data

Data science et développement informatique sont deux domaines très proches l’un de l’autre. En particulier, la data emprunte beaucoup au développement, qu’il est utile de maîtriser pour être un spécialiste data accompli.

En effet, plusieurs logiciels permettant de faire de l’analyse de données via une interface graphique existent et se sont développés ces dernières années (par exemple, DataIku). Malgré tout, on n’échappe jamais à la nécessité de mettre les mains dans le cambouis (comprendre : écrire du code) lorsqu’on fait de la data.

Pour ces raisons, devenir un bon data scientist nécessite aussi de savoir coder correctement. Ce n’est pas une coïncidence si le DataOps s’inspire du DevOps : de nombreux principes et règles valides en développement informatique sont aussi valides en data.

Dans cet article, nous allons donc nous intéresser à quelques règles à respecter pour écrire du code de qualité lorsqu’on est data scientist.

Pourquoi écrire du code propre ?

Après tout, la question est légitime : est-ce vraiment nécessaire de mettre de l’énergie et de l’effort dans son code ? Ou bien serait-ce faire du zèle ?

Source : https://thedataist.com/ten-good-coding-practices-for-data-scientists/

Il existe plusieurs raisons valables pour s’appliquer lorsqu’on développe, notamment :

Bien sûr, il ne faut pas tomber dans le piège inverse et essayer de coder parfaitement, car cela n’existe pas. N’importe quel développeur regardant son code vieux de 6 mois trouvera des défauts à son travail.

Quelques conseils pour produire du code de meilleure qualité

 

Une certaine part de subjectivité entre dans l’évaluation de code informatique. Cependant, certaines règles mettent tout le monde d’accord (ou presque, mais vous n’aurez rien à vous reprocher au moins !).

Quelques principes à appliquer :

Après ces bonnes pratiques, voici des choses à éviter :

En tant que spécialiste data, on n’attendra pas de vous que vous soyez capable de développer des logiciels complexes, votre valeur ajoutée est ailleurs. Mais négliger la qualité du code écrit aura un impact négatif fort lorsqu’il faudra passer de la phase prototype à la phase production d’un projet data. Donc prenez le temps de vous renseigner sur les conventions et les bonnes pratiques relatives au langage que vous utilisez.