Solucionat: com trobar mitjans i modes mitjans

Darrera actualització: 09/11/2023

Trobar la mitjana, la mitjana i el mode a Python: una guia completa sobre l'anàlisi de dades

L'anàlisi de dades és una part essencial per entendre i interpretar conjunts de dades. Un aspecte fonamental de l'anàlisi de dades és calcular la mitjana, la mediana i la modalitat de les dades. Aquestes tres mesures representen tendències centrals i són útils per identificar tendències i patrons a les dades. En aquest article, explorarem els conceptes de mitjana, mediana i mode, i com calcular-los mitjançant Python. També parlarem de diverses biblioteques i funcions implicades en la resolució de problemes similars.

**Mitjana** és el valor mitjà d'un conjunt de dades, calculat dividint la suma dels valors pel nombre de valors del conjunt de dades. **Media** és el valor mitjà d'un conjunt de dades quan s'ordena en ordre ascendent o descendent. Si el conjunt de dades té un nombre senar de valors, la mediana és el valor que es troba exactament al mig, mentre que per a un nombre parell de valors, la mediana és la mitjana dels dos valors mitjans. **Mode** es refereix als valors que apareixen amb més freqüència al conjunt de dades.

Per calcular aquestes mesures, escriurem un programa Python que prengui una llista de nombres com a entrada i retorni la mitjana, la mediana i la moda. Seguim un enfocament pas a pas per implementar aquesta solució.

# Step 1: Define a function to calculate the mean
def calculate_mean(numbers):
    return sum(numbers) / len(numbers)

# Step 2: Define a function to calculate the median
def calculate_median(numbers):
    sorted_numbers = sorted(numbers)
    length = len(numbers)
    mid_index = length // 2

    if length % 2 == 0:
        median = (sorted_numbers[mid_index - 1] + sorted_numbers[mid_index]) / 2
    else:
        median = sorted_numbers[mid_index]

    return median

# Step 3: Define a function to calculate the mode
def calculate_mode(numbers):
    from collections import Counter
    count = Counter(numbers)
    mode = count.most_common(1)[0][0]
    return mode

# Step 4: Implement the main function
def main():
    numbers = [int(x) for x in input("Enter numbers separated by spaces: ").split()]
    mean = calculate_mean(numbers)
    median = calculate_median(numbers)
    mode = calculate_mode(numbers)

    print("Mean:", mean)
    print("Median:", median)
    print("Mode:", mode)

if __name__ == "__main__":
    main()

El codi anterior consta de quatre passos. En primer lloc, definim una funció per calcular la mitjana d'una llista de nombres. En el segon pas, definim una altra funció per calcular la mediana. Aquesta funció ordena la llista d'entrada i troba el valor mitjà segons la longitud de la llista. En el tercer pas, creem una funció per calcular el mode mitjançant la classe Counter del mòdul de col·leccions. L'últim pas consisteix a definir la funció principal, que pren l'entrada de l'usuari, crida a les funcions definides anteriorment i produeix la mitjana, la mediana i la modalitat de les dades d'entrada.

Biblioteques Python per a estadístiques i anàlisi de dades

Ofertes de Python múltiples biblioteques que ajuden amb l'anàlisi estadística i la manipulació de dades. Algunes de les biblioteques populars inclouen:

  • Ennuvolat – Una biblioteca potent per a càlculs numèrics, manipulació de matrius i àlgebra lineal.
  • pandes – Una biblioteca flexible que proporciona capacitats de manipulació i anàlisi de dades mitjançant estructures DataFrame.
  • SciPy – Una biblioteca que s'ocupa de la informàtica científica, incloent optimització, integració, interpolació i molt més.

Ús de Numpy i Pandas per calcular la mitjana, la mitjana i el mode

A més de la implementació bàsica de Python, podem utilitzar les biblioteques Numpy i Pandas per calcular la mitjana, la mediana i la moda de manera eficient.

A continuació es mostra un exemple de com utilitzar Numpy i Pandas per calcular aquestes tendències centrals per a un conjunt de dades:

import numpy as np
import pandas as pd

data = [4, 2, 7, 3, 9, 1, 6, 5, 8]

# Using Numpy
mean_numpy = np.mean(data)
median_numpy = np.median(data)

# Using Pandas
data_series = pd.Series(data)
mode_pandas = data_series.mode().tolist()

print("Mean (Numpy):", mean_numpy)
print("Median (Numpy):", median_numpy)
print("Mode (Pandas):", mode_pandas)

A l'exemple anterior, utilitzem les funcions de Numpy `mean()` i `median()` per calcular la mitjana i la mediana, respectivament. Per al mode, convertim les nostres dades en una sèrie Pandas i utilitzem la funció `mode()`, que retorna una llista de modes.

Aquest article proporciona una comprensió completa dels conceptes de mitjana, mediana i mode i com calcular-los utilitzant tant les biblioteques bàsiques de Python com les populars de Python. Amb aquests enfocaments, els analistes de dades poden analitzar i interpretar conjunts de dades de manera eficaç per treure conclusions significatives i identificar tendències en les dades.

Articles Relacionats:

Deixa el teu comentari