Utiliser le plugin Data Analysis de ChatGPT est possible depuis le mois de juillet 2023. Attendu pour beaucoup de personne, ce plugin va révolutionner l’analyse des données. Mais quelle est l’utilité de ce plugin ? Comme y accéder ?
Dans cet article, je réponds à ces questions et vous accompagne dans son utilisation.
Qu’est-ce que Advanced Data Analysis ChatGPT ?
ChatGPT Data Analysis, anciennement ChatGPT Code Interpreter, est un plugin développé par OpenAI, créateur de ChatGPT et qui repose sur un modèle de langage avancé. Sa particularité est d’être capable de créer, analyser, à la fois, des données, des graphiques, ou encore générer du code. Le modèle peut également effectuer des calculs mathématiques.
C’est le plugin ChatGPT pour ceux qui veulent exploiter des données ou qui sont amateurs ou professionnels de la programmation Cet outil peut générer et comprendre différents langages de programmations. Idéal, si vous avez un besoin de débogage de votre code. Bref, vous l’aurez compris Data Analysis ChatGPT est une avancée pour les spécialistes de la donnée et des langages informatiques. Alors si cela est votre cas, je ne peux que vous conseiller de l’installer et de le tester.
Data Analysis ChatGPT est à la fois un plugin fait pour les professionnels comme pour les amateurs. L’avantage pour ces derniers, c’est qu’ils peuvent manier les données sans réelle expérience. Contrairement aux professionnels, qui eux, pourraient l’utiliser pour maximiser leurs temps et gagner en productivité dans leur domaine.
Comment installer Data Analysis sur ChatGPT ?
Pour utiliser Data Analysis de ChatGPT, la première étape est d’installer, ou du moins activer, le plugin directement depuis l’interface en allant vers l’onglet “Settings et beta”. Aller dans “Beta features” et cocher “Advanced data analysis”. Si jamais vous n’avez pas accès à cette option, c’est tout simplement parce que c’est accessible uniquement pour les abonnées de ChatGPT Plus. Alors rendez-vous dans l’onglet “My plan” pour vous abonner.
Une fois le plugin activé, vous pourrez utiliser la feature directement sur ChatGPT en sélectionnant ChatGPT-4, et ensuite Advanced data analysis.
Utiliser ChatGPT Data Analysis pour l’analyse des données
Pour mieux comprendre à quoi peut servir Data Analysis ChatGPT, je vais avant tout vous expliquer ce qu’est l’analyse de données. Et pour ça, j’ai demandé à ChatGPT de me donner sa définition, voilà ce qu’il dit : “ l’analyse des données consiste à examiner, nettoyer, transformer et modéliser des données avec l’objectif de découvrir des informations utiles, informer les conclusions et soutenir la prise de décision. Cette discipline est cruciale dans divers secteurs, car elle aide les organisations à prendre des décisions basées sur des données probantes plutôt que sur l’intuition ou l’instinct. “
Pour rappel, une donnée est une unité d’information qui peut être collectée, stockée, transmise et/ou analysée. Cela peut être un texte, un schéma, une photo ou encore un graphique. Généralement une donnée est informatique.
On retrouve cette discipline dans les secteurs suivants :
- la santé,
- la finance,
- l’éducation,
- les TIC,
- la publicité et le marketing,
- et l’énergie.
Comme vous voyez, l’analyse de donnée est présente dans différents secteurs. Ces professionnels sont alors susceptibles d’utiliser ce plugin dans leur métier comme Data scientist, analyste, ingénieur de données, expert SEO ou encore, architecte de donnée. Désormais, vous à une idée un peu plus claire de ce que c’est l’analyse de donnée, nous allons voir dans quels cas nous pouvons utiliser cet outil dans cette discipline.
Maintenant que nous savons ce pourquoi Data Analysis ChatGPT, a été spécialement conçu, c’est-à-dire analyser des données de différentes manières. Vous vous demandez sûrement comment on peut utiliser ce plugin dans l’analyse de donnée ?
Cela tombe bien, car je vous donne, ici, quelques cas d’utilisations possibles à faire avec cette feature. C’est parti !
Data Analysis ChatGPT peut vous aider à nettoyer vos données
En utilisant Data Analysis ChatGPT d’OpenAI, vous pouvez nettoyer des données. Mais alors qu’est-ce que le nettoyage de données ?
Le nettoyage de données, c’est très simple, cela consiste à identifier et à corriger (ou supprimer) les erreurs et les incohérences dans les données pour améliorer leur qualité.
Pour mieux comprendre en quoi cet outil peut vous aider à nettoyer des données, voici quelques exemples.
- Identification des anomalies : identifier des valeurs aberrantes ou des données incorrectes dans un fichier en appliquant des techniques statistiques ou en utilisant des modèles prédictifs.
- Normalisation et transformation : Des instructions pour normaliser ou transformer des données (comme la mise à l’échelle ou la conversion de types de données) pourraient être générées en utilisant ChatGPT.
- Imputation des valeurs manquantes : Fournir des suggestions sur les méthodes d’imputation à utiliser pour remplir les valeurs manquantes dans un jeu de données.
- Correction des erreurs : Identifier et corriger des erreurs telles que des fautes de frappe ou des incohérences dans les données.
- Exécution de code : Exécuter des scripts de nettoyage de données spécifiés par l’utilisateur.
- Suggestions basées sur des règles métier : Fournir des suggestions pour le nettoyage des données basées sur des règles métier spécifiques ou des meilleures pratiques du secteur.
- Visualisation des données : Créer des visualisations qui permettent de mieux comprendre les données et d’identifier les domaines qui nécessitent un nettoyage.
Si votre intérêt est de nettoyer des données, et que vous n’êtes pas expert, sachez tout de même qu’il est recommandé de faire appel à des spécialistes en données.
Les outils spécifiquement conçus pour le nettoyage de données, comme pandas en Python, ou des plateformes dédiées comme Talend ou Alteryx, sont généralement mieux adaptés à cette tâche.
Pour un nettoyage efficace des données, l’intégration de ces outils avec des compétences en programmation et une compréhension approfondie du domaine des données est souvent nécessaire.
Data Analysis ChatGPT peut vous aider à analyser vos données en créant des graphiques
Pour comprendre comment ChatGPT Advanced Data Analysis peut créer des graphiques et vous aider à analyser les données, nous allons prendre des métadonnées sur la pollution atmosphérique que le gouvernement a mis à disposition. Après avoir téléchargé le fichier, nous allons demander à ChatGPT d’afficher un graphique à partir du fichier.
Le plugin nous détaille les différentes informations du document puis nous propose de créer un graphique qui montre les différents emplacements des stations.
Ensuite, il va produire un graphique et donner des explications. D’un point de vue scientifique, je ne suis pas sûre de l’intérêt de créer un graphique à partir de ces données. Mais c’est un très bon exemple pour montrer les capacités de ChatGPT à extraire des données pour en faire un graphique.
Car si vous remarquez bien, les différents points des stations forment la France Hexagonale en haut et différentes croix sont présentes ailleurs dans les DROMS. Mayotte et La Réunion en bas à droite du graphique et les Antilles-Guyane au centre à gauche. Ce qui prouve bien que Data Analysis ChatGPT extrait correctement les données.
Si vous êtes curieux et que vous voulez réutiliser le code, vous pouvez cliquer sur “Show work”. ChatGPT fournit le code en python. Vous pouvez le copier-coller. Ce n’est pas merveilleux ?
Quelles sont les limites de Data Analysis ChatGPT ?
Globalement, on a pu tester les capacités de Advanced Data Analysis ChatGPT, certes pas aussi poussé que ce que l’on pourrait faire avec cette feature mais tout de même. C’est un outil assez performant qui possède une rapide exécution et semble correctement interpréter les données. Mais il a également des limites.
L’outil est accesible qu’avec ChatGPT Plus
Malheureusement, Advanced Data Analysis ChatGPT est disponible uniquement pour ceux qui ont l’abonnement ChatGPT Plus, il faudra donc débourser une vingtaine d’euros pour pouvoir accéder à cette feature. Elle n’est alors pas accessible à tous. Ce qui fait débat dans le monde de l’IA, puisque OpenAI est une organisation à but lucratif qui a pour objectif de réaliser des recherches sur l’IA, elle n’est pas donc censée en faire un business. Mais rappelons que ChatGPT est très gourmand en ressource, et par extension coûteux.
L’outil nécessite des connaissances
Même si le plugin de ChatGPT reste abordable pour les novices, pour exploiter tout son potentiel, il faut tout de même posséder des bases en donnée. Car rien ne remplace la capacité intellectuelle et les compétences d’un être humain.
Les données s’arrêtent à 2021
La plus grande limite de ChatGPT, et de sa feature, est que les données s’arrêtent en septembre 2021. L’outil n’est donc pas capable d’analyser des données postérieures à cette date. Vous pouvez tout de même lui fournir des informations et des fichiers. Mais si vous souhaitez qu’il génère les données, sachez qu’elles devront être antérieures à 2021. Auquel cas, le chatbot risque de vous fournir des fausses informations.