%pip install pandas
# or
!pip install pandas

import pandas as pd

data = {
    'Name': ['Alice', 'Bob', 'Charlie'],
    'Age': [25, 30, 35],
    'City': ['New York', 'Los Angeles', 'Chicago'],
    'Product': [44, 25, 56]
}
df = pd.DataFrame(data)
df

df['City']

0       New York
1    Los Angeles
2        Chicago
Name: City, dtype: object

df.City

0       New York
1    Los Angeles
2        Chicago
Name: City, dtype: object

data_series = pd.Series([220, 350, 580, 310, 610, 250], name="Total", dtype=int)
data_series

0    220
1    350
2    580
3    310
4    610
5    250
Name: Total, dtype: int64

# Data Frame
df["Product"].max()

56

# Data Series
data_series.min()

220

# Data Frame
f"Suma column Product Data Series: {df['Product'].sum()}"

'Suma column Product Data Series: 125'

# Data Series
f"Suma column Product Data Series: {data_series.sum()}"

' Suma column Product Data Series: 2320'

# Average for Data Series
f"Average: {data_series.sum()/len(data_series):.2f}"

'Average: 386.67'

data_series.head()

0    220
1    350
2    580
3    310
4    610
Name: Total, dtype: int64

data_series.tail()

1    350
2    580
3    310
4    610
5    250
Name: Total, dtype: int64

data_series.sample()

2    580
Name: Total, dtype: int64

round(data_series.head(6).mean(), 2)

386.67

# DataFrame.describe(percentiles=None, include=None, exclude=None, datetime_is_numeric=False)
data_series.describe()

count      6.000000
mean     386.666667
std      167.888852
min      220.000000
25%      265.000000
50%      330.000000
75%      522.500000
max      610.000000
Name: Total, dtype: float64

data = {
    'age': [25, 30, 35, 40, 45, 50],
    'salary': [50000, 60000, 70000, 80000, 90000, 100000],
    'department': ['HR', 'IT', 'Finance', 'HR', 'IT', 'Finance']
}

df = pd.DataFrame(data)

# Get the summary statistics for numerical columns
summary_numerical = df.describe()
print("Numerical summary:")
print(summary_numerical)

# Get the summary statistics for all columns, including categorical
summary_all = df.describe(include='all')
print("\nSummary including categorical data:")
print(summary_all)

Numerical summary:
             age         salary
count   6.000000       6.000000
mean   37.500000   75000.000000
std     9.354143   18708.286934
min    25.000000   50000.000000
25%    31.250000   62500.000000
50%    37.500000   75000.000000
75%    43.750000   87500.000000
max    50.000000  100000.000000

Summary including categorical data:
              age         salary department
count    6.000000       6.000000          6
unique        NaN            NaN          3
top           NaN            NaN         HR
freq          NaN            NaN          2
mean    37.500000   75000.000000        NaN
std      9.354143   18708.286934        NaN
min     25.000000   50000.000000        NaN
25%     31.250000   62500.000000        NaN
50%     37.500000   75000.000000        NaN
75%     43.750000   87500.000000        NaN
max     50.000000  100000.000000        NaN

	Name	Age	City	Product
0	Alice	25	New York	44
1	Bob	30	Los Angeles	25
2	Charlie	35	Chicago	56

Python - Pandas with Series and DataFrame¶