import numpy as np
E = np.matrix([ [0 , 1 , 1 , 1 , 0 , 1 , 0 ],
                [1 , 0 , 0 , 0 , 1 , 1 , 1 ],
                [1 , 1 , 1 , 1 , 1 , 1 , 1 ],
                [1 , 1 , 1 , 1 , 1 , 1 , 1 ],
                [1 , 1 , 1 , 1 , 1 , 0 , 0 ],
              ])
print(E)

[[0 1 1 1 0 1 0]
 [1 0 0 0 1 1 1]
 [1 1 1 1 1 1 1]
 [1 1 1 1 1 1 1]
 [1 1 1 1 1 0 0]]


vf = np.matrix([1,1,1,1,1])
print(vf.shape, E.shape)
print(vf * E)

(1, 5) (5, 7)
[[4 4 4 4 4 4 3]]


vc = np.matrix([1,1,1,1,1,1,1])
print(E.shape, vc.shape)
print(E * vc.T)

(5, 7) (1, 7)
[[4]
 [4]
 [7]
 [7]
 [5]]


vf = np.matrix([1,1,1,1,1])
vc = np.matrix([1,1,1,1,1,1,1]).T
print(vf.shape, E.shape, vc.shape)
print(vf * E * vc)

(1, 5) (5, 7) (7, 1)
[[27]]


print(E.T * E)

[[4 3 3 3 4 3 3]
 [3 4 4 4 3 3 2]
 [3 4 4 4 3 3 2]
 [3 4 4 4 3 3 2]
 [4 3 3 3 4 3 3]
 [3 3 3 3 3 4 3]
 [3 2 2 2 3 3 3]]


print(E * E.T)

[[4 1 4 4 3]
 [1 4 4 4 2]
 [4 4 7 7 5]
 [4 4 7 7 5]
 [3 2 5 5 5]]


import numpy as np
E = np.matrix(np.loadtxt("E.csv", delimiter=";"))
print(E.shape)

(11249, 919)


print(E[:5,:7]) # Mostrando los primeros 5 estudiantes y los primeros 7 cursos

[[1. 0. 0. 0. 0. 0. 0.]
 [1. 0. 0. 0. 0. 0. 0.]
 [1. 0. 0. 0. 0. 0. 0.]
 [1. 0. 0. 0. 0. 0. 0.]
 [1. 0. 0. 0. 0. 0. 0.]]


E_float = np.matrix(np.loadtxt("E.csv", delimiter=";"))
E_int = np.matrix(np.loadtxt("E.csv", delimiter=";", dtype=np.int8))


print(E_float.dtype)
print(E_int.dtype)

float64
int8


print(E_float.shape)
print(E_int.shape)

(11249, 919)
(11249, 919)


print(E_float[:1,:1].nbytes)
print(E_int[:1,:1].nbytes)
print(E_float.nbytes / E_int.nbytes)

8
1
8.0


%%time
E = np.matrix(np.loadtxt("E.csv", delimiter=";", dtype=int))

CPU times: user 8.31 s, sys: 385 ms, total: 8.7 s
Wall time: 7.75 s


print("Tamaño: ", E.shape) # Estudiantes, cursos
print("Tipo elementos: ", E.dtype) # 64 bits
print("Tamaño de un elemento: ", E[:1,:1].nbytes) # tamaño de cada elemento
print("Tamaño matriz (en Mb): ", E.nbytes/(1024*1024)) # tamaño de matriz en la RAM
print("Algunos elementos:\n", E[:5,:7]) # Algunos elementos

Tamaño:  (11249, 919)
Tipo elementos:  int64
Tamaño de un elemento:  8
Tamaño matriz (en Mb):  78.87139129638672
Algunos elementos:
 [[1 0 0 0 0 0 0]
 [1 0 0 0 0 0 0]
 [1 0 0 0 0 0 0]
 [1 0 0 0 0 0 0]
 [1 0 0 0 0 0 0]]


from matplotlib import pyplot as plt
fig, ax = plt.subplots(figsize=(32,32))
ax.matshow(E.T, aspect='equal')
plt.box(False)
plt.xlabel("Estudiante")
plt.ylabel("Curso")
plt.show()


from matplotlib import pyplot as plt
fig, ax = plt.subplots(figsize=(32,32))
ax.matshow(E.T, cmap=plt.cm.Greys, aspect='equal')
plt.xlabel("Estudiante")
plt.ylabel("Curso")
plt.show();


from matplotlib import pyplot as plt
fig, ax = plt.subplots(figsize=(32,10))
cax = ax.matshow(E[:5,:7], cmap=plt.cm.Greys, aspect='equal')
plt.colorbar(cax)
plt.xlabel("Curso")
plt.ylabel("Estudiante")
plt.grid(True)
plt.suptitle("Algunos elementos de la matriz - Numeración parte en 0")
plt.show()


%%time
# Version Naive
Ne, Nc = E.shape
E_sum = 0
for i in range(Ne):
    for j in range(Nc):
        E_sum = E_sum + E[i,j]
print("Cantidad de inscripciones: ", E_sum)

Cantidad de inscripciones:  51252
CPU times: user 8.18 s, sys: 51.8 ms, total: 8.23 s
Wall time: 7.8 s


%%time
vector_uno_cursos = np.matrix(np.ones([Nc,1])) 
vector_uno_estudiantes = np.matrix(np.ones([Ne,1]))
E_sum = (vector_uno_estudiantes.T * E) * vector_uno_cursos
print(E_sum)

[[51252.]]
CPU times: user 85.4 ms, sys: 29.7 ms, total: 115 ms
Wall time: 55 ms


%%time
vector_uno_cursos = np.matrix(np.ones([Nc,1], dtype=int)) 
vector_uno_estudiantes = np.matrix(np.ones([Ne,1], dtype=int))
E_sum = (vector_uno_estudiantes.T * E) * vector_uno_cursos
print(E_sum)

[[51252]]
CPU times: user 332 ms, sys: 6.94 ms, total: 339 ms
Wall time: 57.6 ms


%%time
# Versión nativa - matricial
E_sum = E.sum()
print("Cantidad de inscripciones: ", E_sum)

Cantidad de inscripciones:  51252
CPU times: user 46.2 ms, sys: 2.75 ms, total: 49 ms
Wall time: 8.14 ms


%%time
# Versión Naive : Toma demasiado tiempo!
N_aux = 10
ETE_v2 = np.zeros([N_aux, N_aux])
for i in range(N_aux):
    print("Fila %d de %d. Porcentaje de las filas completado: %.2f" %(i+1, N_aux, 100.*(i+1)/N_aux))
    for j in range(N_aux):
        for k in range(Ne):
            ETE_v2[i,j] = ETE_v1[i,j] + E[k,i]*E[k,j]

Fila 1 de 10. Porcentaje de las filas completado: 10.00

---------------------------------------------------------------------------
NameError                                 Traceback (most recent call last)
<timed exec> in <module>

NameError: name 'ETE_v1' is not defined


print(ETE_v2[:5,:5])

[[0. 0. 0. 0. 0.]
 [0. 0. 0. 0. 0.]
 [0. 0. 0. 0. 0.]
 [0. 0. 0. 0. 0.]
 [0. 0. 0. 0. 0.]]


print(919 * 919)
t = 2.0
print(t * 919 * 919 / 100 / 3600)

844561
4.692005555555556


E.dtype

dtype('int64')


%%time
# Versión matricial (nativa)
ETE_v3 = E.T * E

CPU times: user 1min 17s, sys: 688 ms, total: 1min 18s
Wall time: 1min 18s


print(ETE_v3[:5,:5])

[[  5   0   0   0   0]
 [  0 545   0   0   0]
 [  0   0 135  40   2]
 [  0   0  40  97   2]
 [  0   0   2   2  50]]


from matplotlib import pyplot as plt

def plot_matrix(A):
    fig, ax = plt.subplots(figsize=(12,12))
    A_aux = A.astype(float)
    masked_matrix = np.ma.array(A_aux, mask=(A_aux==0))
    cmap = plt.cm.Reds
    cmap.set_bad(color='white')
    cax = ax.matshow(masked_matrix, cmap=cmap, aspect='equal', interpolation='none')
    plt.colorbar(cax)
    plt.box(False)
    plt.grid(True)
    plt.xlabel("Curso", fontsize=10)
    plt.ylabel("Curso")
    plt.show()


plot_matrix(ETE_v3[:,:])

/miniconda3/lib/python3.7/site-packages/ipykernel_launcher.py:8: MatplotlibDeprecationWarning: You are modifying the state of a globally registered colormap. In future versions, you will not be able to modify a registered colormap in-place. To remove this warning, you can make a copy of the colormap first. cmap = copy.copy(mpl.cm.get_cmap("Reds"))

Wild Matrix¶

Matrices en la vida real¶

¿Data Science?¶

¿Data Science?¶

Algo que aprendí muy tarde¶

Combinación lineal de filas¶

Seleccionar la primera fila¶

Seleccionar la segunda fila¶

Combinación lineal de filas¶

Mezclar ambas filas¶

Combinación lineal de columnas¶

Seleccionar la primera columna¶

Seleccionar la segunda columna¶

Combinación lineal de columnas¶

Combinación de columnas¶

¿Porqué aprender Algebra Lineal?¶

¿Cómo aprender Algebra Lineal?¶

Matrices en u-exam¶

u-exam | notación¶

u-exam | notación¶

u-exam | notación¶

u-exam: contando inscripciones por estudiante¶

u-exam: contando los estudiantes por curso¶

u-exam: contando las inscripciones totales¶

u-exam: contando las inscripciones totales¶

u-exam: contando los créditos por estudiante¶

¿Qué representa $E^T \cdot E$?¶

¿Qué representa $E^T \cdot E$?¶

¿Qué representa $E^T \cdot E$?¶

¿Qué representa $E^T \cdot E$?¶

¿Qué representa $E \cdot E^T$?¶

¿Cómo hacer esto en el computador?¶

¿Cómo hacer esto en el computador?¶

¿Como hacer esto en el computador?¶

¿Cómo hacer esto en el computador?¶

¿Cómo hacer esto en el computador?¶

¿Cómo hacer esto en el computador?¶

u-exam | datos reales¶

u-exam | datos real¶

u-exam | datos real¶

u-exam | datos real¶

u-exam | datos real¶

u-exam | datos real¶

u-exam | datos real¶

u-exam | inscripciones totales¶

u-exam | inscripciones totales¶

Versión ingenua:¶

u-exam | inscripciones totales¶

Versión matricial:¶

u-exam | inscripciones totales¶

Versión con funciones nativas:¶

u-exam | inscripciones totales¶

u-exam | Estudiantes en común entre asignaturas¶

Versión ingenua¶

u-exam | Estudiantes en común entre asignaturas¶

Versión ingenua¶

u-exam | Estudiantes en común entre asignaturas¶

Versión matricial¶

u-exam | Estudiantes en común entre asignaturas¶

Versión matricial¶

u-exam | ¿Porqué hacemos esto?¶

Resumen y conclusiones¶