Matplotlib és una poderosa biblioteca de traçat utilitzada en el llenguatge de programació Python. Proporciona una API orientada a objectes per incrustar trames a aplicacions que utilitzen conjunts d'eines GUI de propòsit general com Tkinter, wxPython o Qt. Una de les eines importants proporcionades per Matplotlib és la capacitat de crear un gràfic d'interval de confiança.
L'interval de confiança, com a terme estadístic, fa referència al grau de certesa en un mètode de mostreig. Un nivell de confiança us indica com de segur podeu estar, expressat com a percentatge. Per exemple, un nivell de confiança del 99% suggereix que cada una de les vostres estimacions de probabilitat és probable que sigui precisa el 99% del temps.
Creació d'un diagrama d'interval de confiança amb Matplotlib
La creació d'un gràfic d'interval de confiança a Matplotlib implica diversos passos. Aprofundim en l'explicació del codi Python corresponent per dur a terme aquests passos:
En primer lloc, hem d'importar les biblioteques necessàries:
import matplotlib.pyplot as plt import numpy as np from scipy.stats import sem, t from scipy import mean
Ara, podem calcular l'interval de confiança seguint aquests passos.
1. Determineu un conjunt de dades aleatori per al qual calcularem l'interval de confiança.
2. Calcula la mitjana i l'error estàndard del conjunt de dades.
3. Determineu el marge d'error de l'interval de confiança.
4. Finalment, calcula el rang de l'interval de confiança.
Aquí teniu el codi Python corresponent a aquests passos.
confidence = 0.95 data = np.random.rand(100) n = len(data) m = mean(data) std_err = sem(data) h = std_err * t.ppf((1 + confidence) / 2, n - 1) start = m - h end = m + h
La variable "confiança" és el nivell de confiança expressat com a percentatge, i "dades" conté el conjunt de dades aleatòria. La mitjana i l'error estàndard es calculen mitjançant la funció "mitjana" i "sem" de la biblioteca SciPy, respectivament. El marge d'error "h" es determina multiplicant l'error estàndard per la puntuació t, que obtenim de la distribució t mitjançant la funció "ppf". Finalment, calculem el rang de l'interval de confiança.
Representació de l'interval de confiança a Matplotlib
En aquesta darrera secció del codi, estem utilitzant Matplotlib per visualitzar l'interval de confiança.
plt.figure(figsize=(9,6)) plt.bar(np.arange(len(data)), data) plt.fill_between(np.arange(len(data)), start, end, color='b', alpha=0.1) plt.title('Confidence Interval') plt.show()
Utilitza una gràfica de barres per mostrar les dades i el mètode "fill_between" per representar l'interval de confiança. La funció 'figura' inicialitza una nova figura i la funció 'mostra' presenta la trama.
Creació d'un gràfic d'interval de confiança a Matplotlib és una manera convenient d'analitzar visualment les vostres dades, especialment les que impliquen anàlisis estadístiques. Aquesta potent eina ofereix una manera fàcil i intuïtiva presentar dades complexes en una forma que es pugui interpretar fàcilment, cosa que la converteix en un conjunt d'eines essencials per a qualsevol analista o científic de dades de Python. Si entenem com manipular i utilitzar això, podem fer que el procés d'interpretació de dades sigui més eficient i precís.