Git: un outil nécessaire pour les data-scientists

Cette partie du site présente un élément qui n’est pas propre à Python mais qui est néanmoins indispensable : la pratique de Git.

Une grande partie du contenu de la partie provient du cours Travail collaboratif avec R ou d’un cours dédié fait avec Romain Avouac.

Le chapitre de présentation de Git propose une introduction visant à présenter l’intérêt d’utiliser cet outil. Une mise en pratique est proposée avec un cadavre exquis.

Utilisation de Git avec Python

Git est à la fois un outil et un langage. Il est donc nécessaire d’installer, dans un premier temps Git Bash, puis de connecter son outil préféré pour faire du Python (qu’il s’agisse de Jupyter, VSCode ou PyCharm).

L’un des intérêts d’utiliser une approche cloud est que l’utilisateur final n’a pas à se préoccuper de l’installation de ces différentes briques. Les interfaces Git sont parfois déjà configurées pour faciliter l’usage. C’est le cas sur le SSPCloud.

Configuration

Configurer PyCharm pour utiliser le plugin Git

Aller dans File > Settings > Version Control > Git pour définir le chemin vers lequel Pycharm doit trouver l’exécutable git. Si Git a été installé dans un chemin standard, Pycharm le trouve ; sinon, il faut lui donner (dans le dossier d’installation git, bien choisir l’exécutable présent dans le sous-dossier cmd/git.exe)1

Récupération d’un dépôt sur github via git bash

Configurer Jupyter pour utiliser le plugin Git

La marche à suivre est présentée sur cette page

Configurer Visual Studio pour utiliser le plugin Git

Vous pouvez par exemple vous référer à cette documentation

  • Git : un élément essentiel au quotidien

    Git est un système de contrôle de version qui facilite la sauvegarde, la gestion des évolutions et le partage d’un projet informatique. Il s’agit d’un élément devenu indispensable dans le domaine de la data-science. Ce chapitre présente quelques concepts qui seront mis en pratique dans le suivant.

  • Un cadavre exquis pour découvrir Git

    Ce chapitre propose une mise en application de quelques principes centraux du langage Git vus précédemment


  1. Si la case Use credential helper est cochée, il est recommandé de la décocher car en cas de mot de passe tapé trop vite, les tentatives de connexion au dépôt distant seront systématiquement refusées ↩︎