import pandas as pd # Carga la librería


              
                df = pd.read_csv("titanic.csv") # Carga el conjunto de datos


              
                df.head()


              
                def extract_title(string):
    string = string.split(',')[-1]
    string = string.strip()
    string = string.split('.')[0]
    return string
titles = df['Name'].apply(extract_title)


              
                titles = df['Name'].apply(lambda x: x.split(',')[-1].strip().split('.')[0])


              
                titles.head()

0      Mr
1     Mrs
2    Miss
3     Mrs
4      Mr
Name: Name, dtype: object


              
                titles.value_counts()

Mr              517
Miss            182
Mrs             125
Master           40
Dr                7
Rev               6
Col               2
Major             2
Mlle              2
Capt              1
Ms                1
Mme               1
the Countess      1
Don               1
Sir               1
Lady              1
Jonkheer          1
Name: Name, dtype: int64


              
                titles.value_counts(normalize=True) * 100

Mr              58.024691
Miss            20.426487
Mrs             14.029181
Master           4.489338
Dr               0.785634
Rev              0.673401
Col              0.224467
Major            0.224467
Mlle             0.224467
Capt             0.112233
Ms               0.112233
Mme              0.112233
the Countess     0.112233
Don              0.112233
Sir              0.112233
Lady             0.112233
Jonkheer         0.112233
Name: Name, dtype: float64


              
                emb = pd.get_dummies(df['Embarked'])
print(emb)

     C  Q  S
0    0  0  1
1    1  0  0
2    0  0  1
3    0  0  1
4    0  0  1
..  .. .. ..
886  0  0  1
887  0  0  1
888  0  0  1
889  1  0  0
890  0  1  0

[891 rows x 3 columns]


              
                emb = pd.get_dummies(df['Embarked'], prefix='Embarcado')
print(emb)

     Embarcado_C  Embarcado_Q  Embarcado_S
0              0            0            1
1              1            0            0
2              0            0            1
3              0            0            1
4              0            0            1
..           ...          ...          ...
886            0            0            1
887            0            0            1
888            0            0            1
889            1            0            0
890            0            1            0

[891 rows x 3 columns]


              
                emb = pd.get_dummies(df['Embarked'], prefix='Embarcado', drop_first=True)
print(emb)

     Embarcado_Q  Embarcado_S
0              0            1
1              0            0
2              0            1
3              0            1
4              0            1
..           ...          ...
886            0            1
887            0            1
888            0            1
889            0            0
890            1            0

[891 rows x 2 columns]

	PassengerId	Survived	Pclass	Name	Sex	Age	SibSp	Ticket	Fare	Cabin	Embarked
0	1	0	3	Braund, Mr. Owen Harris	male	22.0	1	A/5 21171	7.2500	NaN	S
1	2	1	1	Cumings, Mrs. John Bradley (Florence Briggs Th...	female	38.0	1	PC 17599	71.2833	C85	C
2	3	1	3	Heikkinen, Miss. Laina	female	26.0	0	STON/O2. 3101282	7.9250	NaN	S
3	4	1	1	Futrelle, Mrs. Jacques Heath (Lily May Peel)	female	35.0	1	113803	53.1000	C123	S
4	5	0	3	Allen, Mr. William Henry	male	35.0	0	373450	8.0500	NaN	S

Funciones Principales de Pandas.

1. Función apply()

2. Función value_counts()

3. Función get_dummies()