Chương 4 Toán cao cấp cơ bản

Trước khi đi vào nội dung chính của môn học, ngoài hai phần Xác suất và Thống kê đã được ôn tập qua hai section vừa rồi, ta cũng cần chuẩn bị thêm kiến thức về toán học, chủ yếu là Giải tíchĐại số tuyến tính đã được học ở môn Toán cao cấp 1,2,3.

Section này chủ yếu ôn lại những khái niệm chính trong bộ môn Toán cao cấp.

4.1 Giải tích

Sự ảnh hưởng của tỷ lệ thay đổi của một biến lên tỷ lệ thay đổi của một biến khác được đo lường bởi đạo hàm toán học. Nếu quan hệ giữa hai biến có thể được biểu diễn bởi đường cong, thì gradient của đường cong này chính là tỷ lệ của sự thay đổi đang đề cập.

Giả sử có một biến \(y\) được ánh xạ bởi hàm \(f\) từ biến \(x\), nghĩa là: \(y = f(x)\), khi đó đạo hàm của \(y\) theo \(x\) được viết:

\[\frac{dy}{dx} = \frac{df(x)}{dx}\]

Hoặc đơn giản hơn, ta ký hiệu \(f'(x)\). Đạo hàm được dùng để đo lường sự thay đổi tức thời của \(y\) đối với \(x\). Tức thời ở đây nghĩa là đối với một sự thay đổi của \(x\): \(\Delta x = \epsilon \rightarrow 0\)

Để hình dung đạo hàm toán học, xét hàm bậc hai \(y = f(t) = t^3 -3\). Đạo hàm của một hàm tuyến tính chính tại một điểm là độ nghiêng của đồ thị tại điểm đó. Tuy nhiên với hàm phi tuyến như \(y=f(t)\) thì sẽ có nhiều gradients tại mỗi điểm trên đồ thị. Trên hình chỉ ra hai điểm tại \(t=-4\)\(t=2\). Giá trị gradient này bằng với gradient của đường tiếp tuyến tiếp xúc với đồ thị \(f(t)\) tại chính điểm \(t\) đó.

Lưu ý, gradient sẽ mang giá trị \(0\) tại điểm mà đường cong thay đổi hướng, ta gọi đó là điểm chuyển tiếp. Điều này rất quan trọng trong các bài toán tối ưu hoá trong tài chính.

Để tìm đạo hàm của một hàm số có khả năng đạo hàm được, trong R ta sử dụng package mosaic. Chẳng hạn, ta biết rằng đạo hàm của \(f(x)=\sin(x)\) chính là \(\cos(x)\), nhưng nếu ta quên, trong R ta thực hiện như sau.

#library(mosaic)
D(expression(sin(x)),'x')
## cos(x)

Đối với những hàm số phức tạp hơn, như chứa tham số hoặc các hàm phức, R giải quyết vẫn rất tốt. Chẳng hạn hàm số \(f(t) = A \exp(kt)\sin(\frac{2\pi t}{P})\) trong đó \(A,k,P\) là các tham số và \(f(t)\) có chứa các hàm như \(\exp\)\(\sin\).

D(expression(A*exp(k*t)*sin(2*pi*t/P)), 't')
## A * (exp(k * t) * k) * sin(2 * pi * t/P) + A * exp(k * t) * (cos(2 * 
##     pi * t/P) * (2 * pi/P))

4.2 Đại số tuyến tính

Trước khi đi vào chi tiết, ta cần ôn lại vài thuật ngữ

  • scalar: một con số bất kỳ nào đó
  • vector: là một bảng 1 chiều gồm các con số
  • matrix (ma trận): một bảng 2 chiều gồm các con số. Quy mô của ma trận được quy định bởi số dòng và số cột.

Trong các phép toán ma trận, ngoại trừ phép cộng, phép trừ, phép nhân với một scalar là khá đơn giản, những phép tính sau phức tạp hơn:

  • phép nhân ma trận
  • hạng ma trận
  • phép nghịch đảo ma trận
  • trace ma trận
  • eigenvalues của ma trận

4.2.1 Phép nhân ma trận

Phép nhân hai ma trận được thực hiện đối với quy mô như sau: \((a\times b)(b \times c) = (a\times c)\), nghĩa là ma trận quy mô \(a \times b\) nhân với ma trận quy mô \(b \times c\) và cho ra một ma trận quy mô \(a \times c\). Phần tử của ma trận tích được tạo thành bằng cách nhân lần lượt các dòng của ma trận thứ nhất với các cột của ma trận thứ hai theo đúng thứ tự. Chẳng hạn:

\[\begin{bmatrix} 1&2 \\ 7&3 \\ 1&6 \end{bmatrix} \begin{bmatrix} 0&2&4&9 \\ 6&3&0&2 \end{bmatrix} = \begin{bmatrix} 1\times 0 + 2 \times 6 & ...&...&1 \times 9 + 2 \times 2 \\ ...&...&...&... \\ 1 \times 0 + 6 \times 6 &...&...& 1\times 9 + 6 \times 2 \end{bmatrix} = \begin{bmatrix} 12&8&4&13\\18&23&28&69\\36&20&4&21 \end{bmatrix}\]

4.2.2 Hạng ma trận

Hạng ma trận là số dòng lớn nhất độc lập tuyến tính. Chẳng hạn:

\[\text{rank} \begin{bmatrix}3&4 \\7&9 \end{bmatrix} = 2\]

\[\text{rank} \begin{bmatrix}3&6 \\2&4 \end{bmatrix} = 1\]

4.2.3 Ma trận nghịch đảo

Ma trận nghịch đảo của ma trận \(A\), ký hiệu \(A^{-1}\) là ma trận mà: \(AA^{-1}=A^{-1}A = I\)

Chẳng hạn ma trận nghịch đảo của \(\begin{bmatrix} 2&1\\4&6 \end{bmatrix}\)\(\begin{bmatrix} 3/4&-1/8\\-1/2&1/4 \end{bmatrix}\).

Lưu ý: không phải ma trận nào cũng có khả năng nghịch đảo.

4.2.4 Trace của ma trận

Trace của ma trận là tổng các phần tử nằm trên diagonal của ma trận đó. Đó là khu vực chéo từ góc trái trên xuống phải dưới của ma trận.

Chẳng hạn với ma trận \(A = \begin{bmatrix} 3&4\\7&9 \end{bmatrix}\) thì \(\text{Tr}(A) = 3+9=12\).

4.2.5 Eigenvalues của ma trận

Khái niệm eigenvalues1 của ma trận rất quan trọng trong việc kiểm định các mối quan hệ dài hạn của những chuỗi thời gian, một đặc trưng rất quan trọng trong kinh tế, đặc biệt là tài chính.

Gọi \(\Pi\) là ma trận vuông \(p \times p\), \(c\)vector \(p \times p\) khác \(0\)\(\lambda\) là chuỗi các scalars. \(\lambda\) gọi là nghiệm đặc trưng, hay bộ các nghiệm của ma trận \(\Pi\) nếu có thể viết:

\[ \Pi c = \lambda c\]

Phương trình trên có thể được viết:

\[\Pi c = \lambda I_p c\]

Do \(c \ne 0\) nên:

\[\Pi - \lambda I_p = 0\]

Ta cần bộ các nghiệm không âm, do đó định thức cần bằng 0:

\[|\Pi - \lambda I_p|=0\]

Phương trình trên gọi là phương trình đặc trưng. Ta xem xét hai ví dụ sau.

Nếu \(\Pi = \begin{bmatrix} 5&1\\2&4 \end{bmatrix}\) thì:

\[|\Pi - \lambda I_p| = \Big| \begin{bmatrix} 5&1\\2&4 \end{bmatrix} - \lambda \begin{bmatrix} 1&0\\0&1 \end{bmatrix} \Big| = \Big| \begin{bmatrix} 5-\lambda&1\\2&4 - \lambda \end{bmatrix} \Big| = \lambda^2 - 9\lambda + 18 = 0 \]

Phương trình trên cho hai nghiệm \(\lambda = 6\)\(\lambda = 3\).

Với phương pháp như trên, \(\Pi = \begin{bmatrix} 0.5&0.25\\0.7&0.35 \end{bmatrix}\) có hai eigenvalues\(0\)\(0.85\).

Các nghiệm đặc trưng này chính là các eigenvalues. Chúng có tính chất sau:

  • Tổng các eigenvalues bằng trace của ma trận: \(6+3 = 5+4 = 9\).
  • Số eigenvalues bằng hạng của ma trận.

Đoạn code dưới đây trong R sẽ thể hiện những ví dụ trên.

#Nhân ma trận
a <- matrix(c(1,7,1,2,3,6), ncol = 2)
b <- matrix(c(0,6,2,3,4,0,9,2), nrow = 2)
a%*%b
##      [,1] [,2] [,3] [,4]
## [1,]   12    8    4   13
## [2,]   18   23   28   69
## [3,]   36   20    4   21
# Hạng ma trận
rankMatrix(matrix(c(3,7,4,9), ncol = 2))[1]
## [1] 2
rankMatrix(matrix(c(3,2,6,4),nrow = 2))[1]
## [1] 1
# Trace ma trận
psych::tr(matrix(c(3,7,9,9), ncol = 2))
## [1] 12
# Nghịch đảo ma trận
solve(matrix(c(2,4,1,6), nrow = 2))
##       [,1]   [,2]
## [1,]  0.75 -0.125
## [2,] -0.50  0.250
# Eigenvalues
eigen(matrix(c(5,2,1,4), ncol = 2))$value
## [1] 6 3
eigen(matrix(c(0.5,0.7,0.25,0.35), nrow = 2))$value
## [1] 0.85 0.00

  1. tiếng Việt gọi là trị riêng, nhưng ở đây sẽ dùng nguyên văn từ tiếng Anh