Introducción a PandasAI: una biblioteca de Python para la inteligencia artificial generativa

Pandas es la biblioteca más popular para manipular conjuntos de datos y marcos. Ha sido el estándar utilizado durante mucho tiempo. Pero con los avances en inteligencia artificial, se ha desarrollado una nueva biblioteca de código abierto llamada PandasAI que agrega capacidades de IA generativa a Pandas.

PandasAI no reemplaza a Pandas. En cambio, se le otorgan habilidades generativas de IA. De esta forma, puedes realizar análisis de datos chateando con PandasAI. Luego, abstrae lo que sucede en segundo plano y le proporciona el resultado de su consulta. Verificar Aprenda análisis de datos de forma gratuita: los mejores sitios web.

Instalar Pandas AI

pandasAI Disponible a través de PyPI (Python Package Index). Puede comenzar creando un nuevo entorno virtual si está utilizando un IDE local. Luego use el administrador de paquetes PiP para instalarlos.

pip install pandasai

Es posible que encuentre un error de conflicto de dependencia similar al que se describe a continuación si está utilizando Google Colab.

No rebaje su versión de IPython. Simplemente reinicie Runtime y vuelva a ejecutar el bloque de código. El problema se resolverá.

ملاحظة: El código fuente completo está disponible en Repositorio Github.

Comprender el modelo de conjunto de datos

El conjunto de datos de muestra con el que trabajará utilizando PandasAI es el conjunto de datos de precios de viviendas de California de Kaggle. Este conjunto de datos contiene información sobre viviendas del Censo de California de 1990. Contiene diez columnas que proporcionan estadísticas para estos hogares. Una hoja de datos para ayudarlo a obtener más información sobre este conjunto de datos está disponible en Kaggle. Aquí están las primeras cinco filas del conjunto de datos.

Cada columna representa una estadística para una casa.

Conexión de PandasAI al modelo de lenguaje grande

Para conectar PandasAI a un modelo de lenguaje grande (LLM) como el modelo OpenAI, necesita acceder a su clave API. Para obtener la llave, ve a la plataforma. OpenAI. Luego inicie sesión en su cuenta. Localizar API dentro de la página de opciones que aparece.

A continuación, haz clic en tu perfil y selecciona una opción. Ver claves API. En la página siguiente, haga clic en el botón Crear nueva clave secreta. Finalmente, asigne un nombre a su clave API.

OpenAI generará su clave API. Cópielo donde lo necesite mientras conecta PandasAI a OpenAI. Asegúrese de mantener segura su clave secreta para que cualquier persona con acceso a ella pueda realizar llamadas a OpenAI en su nombre. OpenAI luego cargará su cuenta por la cantidad de llamadas.

Ahora que tiene la clave API, cree una nueva secuencia de comandos de Python y pegue el código a continuación. No necesitará cambiar este código ya que basará sus afirmaciones en él la mayor parte del tiempo.

import pandas as pd
from pandasai import PandasAI

# Replace with your dataset or dataframe
df = pd.read_csv(“/content/housing.csv”)

# Instantiate a LLM
from pandasai.llm.openai import OpenAI
llm = OpenAI(api_token=”your API token”)

pandas_ai = PandasAI(llm)

El código anterior importa tanto PandasAI como Pandas. Luego lee el conjunto de datos. Finalmente, renderiza OpenAI LLM.

Ahora está listo para hablar con sus datos. Verificar Cómo crear una instancia personalizada de ChatGPT con tus datos privados.

Realiza tareas sencillas con PandasAI

Para consultar sus datos, pase el marco de datos y solicite una instancia de la clase PandasAI. Comience por ver las primeras cinco filas de su conjunto de datos.

pandas_ai(df, prompt=’What are the first five rows of the dataset?’)

El resultado de la afirmación anterior es el siguiente:

Esta salida es idéntica a la salida anterior de Descripción general del modelo de conjunto de datos. Esto indica que PandasAI proporcionó resultados correctos y confiables.

A continuación, compruebe cuántas columnas hay en su conjunto de datos.

pandas_ai(df, prompt=’How many columns are in the dataset? ‘)

Devuelve 10, que es el número correcto de columnas en el conjunto de datos de viviendas de California.

Comprueba si faltan valores en el conjunto de datos.

pandas_ai(df, prompt=’Are there any missing values in the dataset?’)

PandasAI devuelve que la columna total_bedrooms tiene 207 valores faltantes, lo que vuelve a ser correcto.

Hay muchas tareas simples que puede realizar con PandasAI, no está limitado a las tareas mencionadas anteriormente.

Realiza consultas complejas con PandasAI

PandasAI no solo admite tareas simples. También puede usarlo para realizar consultas complejas en un conjunto de datos. Por ejemplo, en un conjunto de datos de viviendas, si desea determinar la cantidad de viviendas en una isla que valen más de $100.000 10 y tienen más de XNUMX habitaciones, puede usar la solicitud a continuación.

pandas_ai(df,prompt= “How many houses have a value greater than 100000,” “ are in an island and total bedrooms is more than 10?”)

La respuesta correcta es cinco. Este es el mismo resultado proporcionado por PandasAI.

Un analista de datos puede tardar en escribir y depurar resultados para consultas complejas. El mensaje anterior requiere solo dos líneas de lenguaje natural para realizar la misma tarea. Solo debe tener en cuenta exactamente lo que quiere lograr, y PandasAI se encargará del resto. Verificar Formas de usar ChatGPT como analizador de datos.

Dibujar gráficos usando PandasAI

Los gráficos son una parte vital de cualquier proceso de análisis de datos. Ayuda a los analistas de datos a visualizar los datos de una manera amigable para los humanos. PandasAI también tiene una función de dibujo de gráficos. Solo tienes que pasar el marco de datos y las instrucciones.

Comience creando un gráfico para cada columna en el conjunto de datos. Esto le ayudará a visualizar la distribución de las variables.

pandas_ai(df, prompt= “Plot a histogram for each column in the dataset”)

La salida es la siguiente:

PandasAI pudo trazar todas las columnas sin tener que pasar sus nombres al aviso.

PandasAI también puede dibujar diagramas sin decirle explícitamente cuál usar. Por ejemplo, es posible que desee conocer la correlación de los datos en un conjunto de datos de viviendas. Para lograr esto, puede pasar un reclamo de la siguiente manera:

pandas_ai(df, prompt= “Plot the correlation in the dataset”)

PandasAI dibuja una matriz de correlación como se muestra a continuación:

La biblioteca selecciona un mapa de calor y dibuja una matriz de correlación.

Pasar múltiples marcos de datos a una instancia de PandasAI

Trabajar con múltiples marcos de datos puede ser un desafío. Especialmente para alguien nuevo en el análisis de datos. PandasAI llena este vacío porque todo lo que tiene que hacer es pasar cada uno de los marcos de datos y comenzar a usar indicaciones para manipular los datos.

Cree dos marcos de datos con Pandas.

employees_data = {
 ‘EmployeeID’: [1, 2, 3, 4, 5],
 ‘Name’: [‘John’, ‘Emma’, ‘Liam’, ‘Olivia’, ‘William’],
 ‘Department’: [‘HR’, ‘Sales’, ‘IT’, ‘Marketing’, ‘Finance’]
}

salaries_data = {
 ‘EmployeeID’: [1, 2, 3, 4, 5],
 ‘Salary’: [5000, 6000, 4500, 7000, 5500]
}

employees_df = pd.DataFrame(employees_data)
salaries_df = pd.DataFrame(salaries_data)

Puede hacerle a PandasAI una pregunta que incluya cada uno de los marcos de datos. Simplemente pase ambos marcos de datos a la instancia de PandasAI.

pandas_ai([employees_df, salaries_df], “Which employee has the largest salary?”)

Ella devuelve a Olivia y es la respuesta correcta de nuevo.

Nunca ha sido tan fácil hacer análisis de datos, PandasAI le permite chatear y analizar sus datos fácilmente. Verificar Las mejores aplicaciones y herramientas de análisis de datos que puede aprender a usar rápidamente.

Comprender la tecnología que impulsa PandasAI

PandasAI simplifica el proceso de análisis de datos y, por lo tanto, ahorra mucho tiempo a los analistas de datos. Pero resume lo que está pasando en el fondo. Debe aprender sobre la IA generativa para poder obtener una descripción general de cómo funciona PandasAI bajo el capó. Esto también lo ayudará a mantenerse al día con las últimas innovaciones en el campo de la IA generativa. Puedes ver ahora Las formas en que la IA generativa cambiará el mercado laboral.

Ir al botón superior