Quantitative Methods CFA L1 – Practice Problems by Module

Cách dùng tài liệu này:

Mục lục bài tập

  1. LM01 – Rates & Returns (calc)
  2. LM02 – Time Value of Money (HEAVY calc)
  3. LM03 – Statistical Measures (calc)
  4. LM04 – Probability Trees & Bayes (calc)
  5. LM05 – Portfolio Mathematics (HEAVY calc)
  6. LM06 – Simulation Methods (theory)
  7. LM07 – Estimation & Inference (calc)
  8. LM08 – Hypothesis Testing (calc)
  9. LM09 – Tests of Independence (calc)
  10. LM10 – Simple Linear Regression (HEAVY calc)
  11. LM11 – Big Data Techniques (theory)

LM01: Rates & Returns

Dạng 1: HPR & continuously compounded return CALC

Q1.1
Cổ phiếu mua $20, cuối năm $25, cổ tức năm nay $1.25. (a) Tính HPR. (b) Một cổ phiếu khác giảm từ $90 → $80, tính lợi nhuận ghép lãi liên tục.
(a) HPR: HPR = P₁ − P₀ + IncomeP₀
= 25 − 20 + 1.2520 = 6.2520 = 31.25%

(b) Continuously compounded: r = ln(P₁/P₀) = ln(80/90) = ln(0.8889) = −11.78%
HPR = 31.25%; r liên tục = −11.78%

Dạng 2: Arithmetic vs Geometric mean return CALC

Q1.2
Lợi nhuận 4 năm: +5%, +12%, −3%, +8%. Tính arithmetic mean và geometric mean.
Arithmetic: 5 + 12 − 3 + 84 = 224 = 5.50%

Geometric: G = [(1+R₁)…(1+Rₙ)]1/n − 1
= [(1.05)(1.12)(0.97)(1.08)]1/4 − 1 = [1.231978]0.25 − 1 = 1.05353 − 1 = 5.35%
Geometric (5.35%) < Arithmetic (5.50%) — luôn đúng khi variance > 0.
Arithmetic = 5.50%; Geometric ≈ 5.35%

Dạng 3: Harmonic mean (cost averaging) CALC

Q1.3
Nhà đầu tư bỏ số tiền cố định mỗi tháng mua cổ phiếu tại 3 mức giá: 50, 55, 48. Giá mua bình quân thực tế?
Harmonic = nΣ(1/Xᵢ)
= 3 / (1/50 + 1/55 + 1/48) = 3 / (0.02000 + 0.018182 + 0.020833) = 30.059015 = 50.83
Harmonic (50.83) < arithmetic (51.0) — dùng khi nạp tiền đều đặn.
Giá mua bình quân ≈ 50.83

Dạng 4: Money-weighted vs Time-weighted return MIXED

Q1.4
Năm 1: đầu tư 100, cuối năm 110. Đầu năm 2 nạp thêm 100 (tổng 210). Cuối năm 2 = 240. Tính TWR và MWR (theo năm).
TWR: HPR₁ = 110/100 − 1 = 10.00%; HPR₂ = 240/210 − 1 = 14.286%
TWR = [(1.10)(1.14286)]1/2 − 1 = (1.257143)0.5 − 1 = 12.12%

MWR (IRR): CF₀ = −100, CF₁ = −100, CF₂ = +240
−100 − 100/(1+r) + 240/(1+r)² = 0 → r = 12.79%
BA II Plus (MWR qua CF/IRR):
CF0 = −100; C01 = −100, F01 = 1; C02 = 240, F02 = 1; IRR CPT → 12.79
MWR > TWR vì nạp nhiều tiền ngay trước kỳ lợi nhuận cao hơn. TWR loại bỏ ảnh hưởng timing → đo kỹ năng quản lý.
TWR ≈ 12.12%; MWR ≈ 12.79%

Dạng 5: Annualizing & real rate CALC

Q1.5
(a) Lợi nhuận 2%/quý → năm hóa? (b) Nominal = 6%, lạm phát = 2.5% → real rate (Fisher chính xác)?
(a) (1 + 0.02)4 − 1 = 1.082432 − 1 = 8.24%

(b) real = (1 + nominal)/(1 + inflation) − 1 = 1.06/1.025 − 1 = 3.41%
(a) 8.24%; (b) 3.41%

Dạng 6: Leveraged return CALC

Q1.6
Danh mục $25 triệu, tài trợ 20% bằng nợ với chi phí 6%/năm. Lợi nhuận đầu tư 10%/năm. Tính lợi nhuận đòn bẩy.
RL = RP + (VB/VE)(RP − rD)
Nợ = 5tr, vốn chủ = 20tr → VB/VE = 0.25
RL = 10% + 0.25 × (10% − 6%) = 10% + 0.25 × 4% = 11.0%
Leveraged return = 11.0%

LM02: Time Value of Money in Finance

Dạng 1: Định giá coupon bond CALC

Q2.1
Trái phiếu 6 năm, mệnh giá $1,000, coupon 5%/năm (trả hằng năm), YTM = 4.5%. Giá hôm nay?
PMT = 50, FV = 1,000, N = 6, I/Y = 4.5
PV = 50 × [1 − 1.045−6]/0.045 + 1,000 × 1.045−6 = 257.89 + 767.90 = 1,025.79
BA II Plus: N=6; I/Y=4.5; PMT=50; FV=1000; CPT PV → −1,025.79
YTM (4.5%) < coupon (5%) → premium bond (giá > par). Trái phiếu bán niên: chia coupon & YTM cho 2, nhân N với 2.
Giá ≈ $1,025.79

Dạng 2: Zero-coupon bond – giá & YTM CALC

Q2.2
Trái phiếu zero-coupon mua $726.27, mệnh giá $1,000, đáo hạn 10 năm. Tính YTM.
YTM = (FVPV)1/N − 1
= (1,000726.27)1/10 − 1 = (1.376817)0.1 − 1 = 1.032494 − 1 = 3.25%
BA II Plus: N=10; PV=−726.27; PMT=0; FV=1000; CPT I/Y → 3.25
YTM ≈ 3.25%

Dạng 3: Preferred stock / perpetuity CALC

Q2.3
Cổ phiếu ưu đãi trả cổ tức $3.75/năm vĩnh viễn, nhà đầu tư yêu cầu 8.5%. Sẵn sàng trả bao nhiêu?
V = Dr = 3.750.085 = 44.12
Giá ≈ $44.12

Dạng 4: Gordon Growth (DDM) – giá, r, hoặc g CALC

Q2.4
(a) Cổ tức vừa trả D₀ = 2.40, g = 3%, r = 8%. Tính giá. (b) Cổ phiếu giá $30, D₁ = 2.40, r = 9.75%. Tính implied g.
(a) V₀ = D₀(1+g)r − g = 2.40 × 1.030.08 − 0.03 = 2.4720.05 = 49.44

(b) g = r − D₁P₀ = 0.0975 − 2.4030 = 0.0975 − 0.08 = 1.75%
Bẫy: D₁ phải dùng cổ tức kỳ TỚI. Nếu đề cho D₀ vừa trả, nhân (1+g) trước.
(a) $49.44; (b) g = 1.75%

Dạng 5: Implied forward rate CALC

Q2.5
Spot 1 năm = 5.25%, spot 2 năm = 6.50%. Tính lãi suất kỳ hạn 1 năm bắt đầu sau 1 năm (F₁,₁).
F₁,₁ = (1+S₂)²1+S₁ − 1
= (1.065)²1.0525 − 1 = 1.1342251.0525 − 1 = 1.077601 − 1 = 7.76%
Forward (7.76%) cao hơn cả 2 spot → KHÔNG nằm giữa 2 spot.
F₁,₁ ≈ 7.76%

Dạng 6: Loan / mortgage payment CALC

Q2.6
Vay $15,000 trả góp hằng tháng trong 5 năm, lãi suất 12%/năm. Mỗi kỳ trả bao nhiêu?
I/Y = 12/12 = 1; N = 5 × 12 = 60; PV = 15,000; FV = 0 → CPT PMT = 333.67
BA II Plus: N=60; I/Y=1; PV=15000; FV=0; CPT PMT → −333.67
PMT ≈ $334/tháng

Dạng 7: Cash flow additivity / no-arbitrage MIXED

Q2.7
Hai cơ hội cùng vốn −1,000,000; CF Opp1 = (500k, 500k, 500k); Opp2 = (400k, 500k, 600k); r = 11%. Nên chọn cái nào (dùng cash flow additivity)?
Hiệu (Opp1 − Opp2) = (+100k, 0, −100k). PV của +100k ở năm 1 > PV của −100k ở năm 3 ở mọi r dương → Opp1 tốt hơn (chênh PV ≈ +$15k).
Không cần tính 2 NPV riêng — chỉ cần dấu của PV(hiệu dòng tiền).
Chọn Opportunity 1

LM03: Statistical Measures of Asset Returns

Dạng 1: Sample standard deviation & variance CALC

Q3.1
Mẫu giá (nghìn $): 125, 175, 150, 155, 135. Tính độ lệch chuẩn mẫu.
Mean = (125+175+150+155+135)/5 = 148
Σ(x−x̄)² = 529 + 729 + 4 + 49 + 169 = 1,480
Variance (mẫu) = 1,4805−1 = 370 → s = √370 = 19.24
Mẫu chia (n−1), KHÔNG chia n.
s ≈ 19.24

Dạng 2: Coefficient of variation (xếp hạng rủi ro) CALC

Q3.2
X: mean 0.9, s 0.7; Y: mean 1.2, s 4.7; Z: mean 1.5, s 5.2. Chứng khoán nào rủi ro tương đối cao nhất?
CV = smean
CVX = 0.70.9 = 0.78; CVY = 4.71.2 = 3.92; CVZ = 5.21.5 = 3.47
CVY lớn nhất.
Security Y (CV = 3.92)

Dạng 3: MAD & geometric (CAGR) CALC

Q3.3
Returns: 15%, 2%, 5%, −7%, 0%. (a) Tính MAD. (b) Tính geometric mean.
Mean = 15+2+5−7+05 = 3%
(a) MAD = |15−3|+|2−3|+|5−3|+|−7−3|+|0−3|5 = 12+1+2+10+35 = 5.60%

(b) Geometric = (1.15×1.02×1.05×0.93×1.00)1/5 − 1 = (1.14541)0.2 − 1 = 2.75%
MAD = 5.60%; Geometric = 2.75%

Dạng 4: Quantile + nội suy CALC

Q3.4
9 quan sát (sắp tăng): 4.2, 6.8, 7.0, 10.9, 11.6, 14.4, 17.0, 19.0, 22.5. Tìm giá trị ở phân vị thứ 70.
Ly = (n+1)(y100) = (9+1)(70100) = 7 → quan sát thứ 7 = 17.0% (L là số nguyên, không cần nội suy)
P₇₀ = 17.0%

Dạng 5: Skewness & kurtosis (lý thuyết) THEORY

Q3.5
(a) Phân phối lệch âm: thứ tự mean/median/mode? (b) Kurtosis = 4.2 nói gì về đuôi?
(a) Lệch âm: mean < median < mode.
(b) Kurtosis 4.2 > 3 → leptokurtic: nhọn hơn, đuôi béo hơn → xác suất biến cố cực trị cao hơn ở CẢ hai phía (lên & xuống).
(a) mean < median < mode; (b) đuôi béo 2 phía, nhiều outlier

Dạng 6: Target semideviation (downside risk) CALC

Q3.6
Lợi nhuận năm (%): 10, 12, 5, −3, 8, 15, −1. Ngưỡng mục tiêu = 10%. Tính target semideviation.
Chỉ lấy quan sát DƯỚI 10%: 5, −3, 8, −1 (bỏ 10, 12, 15 vì ≥ target).
Σ(R<target)(R − target)² = (5−10)² + (−3−10)² + (8−10)² + (−1−10)² = 25 + 169 + 4 + 121 = 319
Chia (n − 1) = 7 − 1 = 6 (n = tổng cỡ mẫu = 7):
Target semidev = √[Σ(R<target)(R − target)²n − 1] = √(3196) = √53.167 = 7.29%
Mẫu số là (n − 1) với n = TỔNG cỡ mẫu (7), KHÔNG phải số quan sát dưới ngưỡng. Chỉ phạt downside.
Target semideviation ≈ 7.29%

LM04: Probability Trees & Conditional Expectations

Dạng 1: Expected value qua cây xác suất 2 tầng CALC

Q4.1
Kinh tế tốt 60% (EPS 5.00 với xs 70%, 3.50 với 30%); xấu 40% (EPS 1.50 với 80%, 1.00 với 20%). Tính E(EPS).
Joint × EPS:
0.60×0.70×5.00 = 0.42×5.00 = 2.10
0.60×0.30×3.50 = 0.18×3.50 = 0.63
0.40×0.80×1.50 = 0.32×1.50 = 0.48
0.40×0.20×1.00 = 0.08×1.00 = 0.08
E(EPS) = 2.10 + 0.63 + 0.48 + 0.08 = 3.29
E(EPS) = $3.29

Dạng 2: Expected value & standard deviation từ bảng xác suất CALC

Q4.2
40% earn 10%; 40% earn 12.5%; 20% earn 30%. Tính E(R) và σ.
E(R) = 0.4×10 + 0.4×12.5 + 0.2×30 = 4 + 5 + 6 = 15%
Var = 0.4(10−15)² + 0.4(12.5−15)² + 0.2(30−15)² = 0.4×25 + 0.4×6.25 + 0.2×225 = 10 + 2.5 + 45 = 57.5
σ = √57.5 = 7.58%
E(R) = 15%; σ = 7.58%

Dạng 3: Bayes' formula (đảo điều kiện) CALC

Q4.3
Bond B vỡ nợ 25%, CCC vỡ nợ 40%. Danh mục 30% B, 70% CCC. Một bond vỡ nợ — xác suất nó là B?
P(default & B) = 0.25 × 0.30 = 0.075
P(default & CCC) = 0.40 × 0.70 = 0.280
P(default) = 0.075 + 0.280 = 0.355
P(B | default) = P(default & B)P(default) = 0.0750.355 = 0.211
3 bước: tính joint từng nhánh → cộng ra P(thông tin mới) → chia nhánh quan tâm cho tổng.
P(B | default) ≈ 0.211

Dạng 4: Counting – permutations, combinations & labeling CALC

Q4.4
(a) Từ 20 cổ phiếu, chọn 3 vào danh mục (thứ tự KHÔNG quan trọng) — bao nhiêu cách? (b) Từ 8 ứng viên, bổ nhiệm 3 chức danh khác nhau (CEO, CFO, COO) — bao nhiêu cách? (c) Gán 10 nhà phân tích nhãn 4 "buy", 3 "hold", 3 "sell" — bao nhiêu cách?
(a) Tổ hợp (không thứ tự): nCr = n!(n−r)!·r! = 20!17!·3! = 20×19×186 = 1,140

(b) Hoán vị (có thứ tự, chức danh khác nhau): nPr = n!(n−r)! = 8!5! = 8×7×6 = 336

(c) Labeling (multinomial): n!n1!·n2!·n3! = 10!4!·3!·3! = 3,628,80024×6×6 = 3,628,800864 = 4,200
Thứ tự quan trọng → permutation (P); không quan trọng → combination (C); chia thành nhiều nhóm có nhãn → công thức labeling n!/(n₁!…nₖ!).
BA II Plus: (a) 20 [2nd nCr] 3 = 1140; (b) 8 [2nd nPr] 3 = 336.
(a) 1,140; (b) 336; (c) 4,200

LM05: Portfolio Mathematics

Dạng 1: σ danh mục 2 tài sản (general) CALC

Q5.1
Pluto: E(R)=11%, σ=0.22; Neptune: E(R)=9%, σ=0.13; ρ=0.25. Danh mục 65% Pluto / 35% Neptune. Tính E(R) và σ.
E(RP) = 0.65×11 + 0.35×9 = 10.3%
σP = √[w₁²σ₁² + w₂²σ₂² + 2w₁w₂σ₁σ₂ρ] (σ tính theo %)
= √[0.65²×22² + 0.35²×13² + 2×0.65×0.35×22×13×0.25]
= √[204.49 + 20.7025 + 32.5325] = √257.725 = 16.05%
E(R) = 10.3%; σ = 16.05%

Dạng 2: σ với ρ = +1 và ρ = −1 CALC

Q5.2
(a) σA=18.9%, σB=14.73%, ρ=+1, equal weight. (b) σA=10.2%, σB=13.9%, ρ=−1, 75% A / 25% B.
(a) ρ = +1 → σP = bình quân trọng số = 0.5×18.9 + 0.5×14.73 = 16.82%

(b) ρ = −1: σP = √[0.75²×10.2² + 0.25²×13.9² + 2×0.75×0.25×10.2×13.9×(−1)]
= √[58.5225 + 12.0756 − 53.1675] = √17.4306 = 4.18%
ρ = +1 → không có lợi ích đa dạng hóa (σ = bình quân). ρ = −1 → rủi ro giảm mạnh, có thể về 0.
(a) 16.82%; (b) 4.18%

Dạng 3: Covariance & correlation CALC

Q5.3
(a) P(X=20,Y=0)=0.4, P(X=30,Y=50)=0.6; E(X)=26, E(Y)=30. Tính Cov(X,Y). (b) Cov=0.009, Var(A)=0.020, Var(B)=0.033. Tính ρ.
(a) Cov = 0.4×(20−26)(0−30) + 0.6×(30−26)(50−30) = 0.4×180 + 0.6×80 = 72 + 48 = 120

(b) ρ = CovσAσB = 0.009/(√0.020 × √0.033) = 0.009/(0.14142×0.18166) = 0.0090.025692 = 0.350
(a) Cov = 120; (b) ρ = 0.350

Dạng 4: Roy's safety-first MIXED

Q5.4
X: mean 12%, σ 14%; Y: mean 17%, σ 20%; Z: mean 22%, σ 25%. Ngưỡng 5%. Chọn danh mục tối ưu.
SFRatio = E(R) − thresholdσ
X: 12−514 = 0.50; Y: 17−520 = 0.60; Z: 22−525 = 0.68 → max → chọn Z
SFRatio lớn nhất = xác suất thấp nhất rơi dưới ngưỡng.
Portfolio Z (SFRatio = 0.68)

LM06: Simulation Methods

Dạng 1: Normal vs lognormal (lý thuyết) THEORY

Q6.1
Vì sao dùng lognormal để mô hình giá cổ phiếu thay vì normal?
Lognormal bị chặn dưới bởi 0lệch phải → giá tài sản không thể âm và return không < −100%. Normal cho phép giá âm (vô lý). Ngoài ra nếu Y lognormal thì ln(Y) là normal.
Vì giá ≥ 0 và return ≥ −100%; lognormal không âm, lệch phải

Dạng 2: Monte Carlo vs Bootstrap (lý thuyết) THEORY

Q6.2
Phân biệt Monte Carlo và bootstrap. Hạn chế chính của Monte Carlo?
Monte Carlo: analyst tự chỉ định phân phối & tham số cho input (mọi skew/kurtosis). Hạn chế: kết quả chỉ tốt bằng giả định input; không cho insight như giải tích.

Bootstrap: rút mẫu lại có hoàn lại từ dữ liệu quan sát thực; mỗi resample cùng cỡ mẫu gốc; 1 quan sát có thể xuất hiện nhiều lần; dùng phân phối thực nghiệm (không cần giả định).
MC: tự đặt phân phối, hạn chế = "garbage in, garbage out". Bootstrap: có hoàn lại, cùng cỡ, dữ liệu thực

Dạng 3: Continuously compounded return cộng dồn CALC

Q6.3
Giá: 1/8 = 112, 8/8 = 160, 15/8 = 120. Tính lợi nhuận ghép liên tục từ 1/8 → 15/8.
r = ln(120/112) = ln(1.07143) = 6.90%
(Kiểm tra cộng dồn: ln(160/112) + ln(120/160) = 35.67% + (−28.77%) = 6.90%)
r ≈ 6.90%

LM07: Estimation & Inference

Dạng 1: Nhận diện phương pháp lấy mẫu THEORY

Q7.1
(a) Chia tổng thể thành 10 nhóm theo vốn hóa, lấy 50 từ mỗi nhóm rồi gộp = ? (b) Khảo sát chỉ ứng viên làm cùng văn phòng cho tiện = ?
(a) Stratified random sampling (cỡ mỗi tầng tỷ lệ kích thước tầng, không bắt buộc bằng nhau).
(b) Convenience sampling (chọn theo dễ tiếp cận → rủi ro thiên lệch).
(a) Stratified; (b) Convenience

Dạng 2: Standard error of the mean CALC

Q7.2
Tổng thể có variance = 2.45, cỡ mẫu n = 40. Tính standard error của trung bình mẫu.
σ = √2.45 = 1.565
SE = σ√n = 1.565√40 = 1.5656.3246 = 0.247
Tăng n → SE giảm (bẫy: nhiều câu nói "SE tăng khi n tăng" là SAI).
SE ≈ 0.247

Dạng 3: CLT & resampling (lý thuyết) THEORY

Q7.3
(a) Phát biểu CLT về mean và variance của phân phối trung bình mẫu. (b) Jackknife khác bootstrap thế nào?
(a) Với n lớn (>30), phân phối trung bình mẫu ≈ chuẩn bất kể phân phối gốc; mean = μ; variance = σ²/n.
(b) Jackknife: bỏ lần lượt MỘT quan sát, thường lặp đúng n lần. Bootstrap: rút có hoàn lại, cùng cỡ, số lần lặp tùy chọn.
(a) ≈ normal, mean = μ, var = σ²/n; (b) jackknife bỏ 1 obs, lặp n lần

Dạng 4: Confidence interval – chọn z vs t CALC

Q7.4
(a) Mẫu n = 64, mean = 6.5%, s = 8% (σ chưa biết, n lớn). Dựng CI 95%. (b) Mẫu n = 16 từ tổng thể chuẩn, mean = 4.0%, s = 1.5% (σ chưa biết). Dựng CI 95% (t0.025, df=15 = 2.131).
(a) n > 30 → dùng z = 1.96. SE = 8√64 = 88 = 1.0
CI = 6.5 ± 1.96×1.0 = 6.5 ± 1.96 → (4.54%, 8.46%)

(b) n nhỏ, σ chưa biết, tổng thể chuẩn → dùng t (df = n−1 = 15). SE = 1.5√16 = 1.54 = 0.375
CI = 4.0 ± 2.131×0.375 = 4.0 ± 0.799 → (3.20%, 4.80%)
σ biết hoặc n lớn → z. σ chưa biết & mẫu nhỏ (tổng thể chuẩn) → t với df = n−1 (khoảng rộng hơn).
(a) (4.54%, 8.46%); (b) (3.20%, 4.80%)

Dạng 5: Nhận diện sampling bias THEORY

Q7.5
(a) Phân tích chỉ dùng các quỹ còn hoạt động hôm nay, bỏ quỹ đã đóng cửa → lợi nhuận trung bình bị thổi phồng. Bias gì? (b) Thử 300 chỉ báo kỹ thuật trên cùng dữ liệu đến khi tìm được 1 cái "thắng". Bias gì?
(a) Survivorship bias — chỉ giữ thực thể "sống sót", loại bỏ quỹ thất bại → kết quả lạc quan giả.
(b) Data-snooping (data-mining) bias — thử quá nhiều mô hình; quan hệ tìm thấy là ngẫu nhiên, không lặp lại out-of-sample.
(a) Survivorship bias; (b) Data-snooping bias

LM08: Hypothesis Testing

Dạng 1: z-statistic cho mean CALC

Q8.1
Kiểm định lương khởi điểm CFA ≥ $54,000. Mẫu n = 75, mean = $57,000, s = $1,300. Tính test statistic.
z = x̄ − μ₀s/√n
= (57,000 − 54,000)/(1,300/√75) = 3,000/(1,300/8.660) = 3,000150.11 = 19.99
n > 30 → dùng z. So với critical (1 tai 5% = 1.645) → bác bỏ H₀.
z = 19.99

Dạng 2: Type I / Type II / Power (lý thuyết) THEORY

Q8.2
(a) Mổ bỏ ruột thừa (H₀: viêm ruột thừa) nhưng thực ra do túi mật = lỗi loại nào? (b) P(Type II) = 18%, P(Type I) = 5%. Tính power.
(a) H₀ thực ra SAI mà không bác bỏ (vẫn mổ ruột thừa) → Type II error.
(b) Power = 1 − β = 1 − 0.18 = 0.82
Type I = bác bỏ H₀ đúng (= α). Type II = không bác bỏ H₀ sai (= β). Power = 1 − β. Tăng power tốt nhất: giữ α, tăng n.
(a) Type II error; (b) Power = 0.82

Dạng 3: Chọn test thống kê phù hợp THEORY

Q8.3
Test nào cho: (a) một phương sai tổng thể; (b) bằng nhau của hai phương sai; (c) so sánh 2 quỹ mẫu nhỏ, phi chuẩn?
(a) Chi-square (1 phương sai).
(b) F-test (so sánh 2 phương sai).
(c) Nonparametric (vd Mann–Whitney U) vì mẫu nhỏ & phi chuẩn → không thỏa giả định parametric.
(a) Chi-square; (b) F-test; (c) Nonparametric

Dạng 4: p-value & quyết định MIXED

Q8.4
Kiểm định 2 phía một mean. Test statistic z = 2.50. (a) Tính p-value (diện tích đuôi phải của z=2.50 ≈ 0.0062). (b) Ở α = 5% và α = 1%, có bác bỏ H₀ không?
(a) Test 2 phía → p = 2 × diện tích một đuôi = 2 × 0.0062 = 0.0124 (≈ 1.24%).
(b) So sánh p với α:
• α = 5% (0.05): p = 0.0124 < 0.05 → bác bỏ H₀.
• α = 1% (0.01): p = 0.0124 > 0.01 → KHÔNG bác bỏ H₀.
p-value = mức ý nghĩa nhỏ nhất còn bác bỏ được H₀. Quy tắc: p < α → bác bỏ. Hai phía → nhân đôi diện tích đuôi.
(a) p ≈ 0.0124; (b) bác bỏ ở 5%, không bác bỏ ở 1%

LM09: Parametric & Non-Parametric Tests of Independence

Dạng 1: t-test cho hệ số tương quan = 0 CALC

Q9.1
r = −0.525, n = 19. Tính t-statistic và kết luận ở mức 5% (critical t với df=17 ≈ 2.110).
t = r√(n−2)√(1−r²), df = n − 2 = 17
= −0.525 × √17 / √(1 − 0.275625) = −0.525 × 4.1231 / √0.724375 = −2.16460.85110 = −2.543
|−2.543| > 2.110 → bác bỏ H₀ ở mức 5% (có tương quan).
Chỉ cần r và n; KHÔNG cần mean/std của 2 biến. df = n − 2.
t = −2.543 → bác bỏ ở 5% (không bác bỏ ở 2%)

Dạng 2: Chi-square test of independence (contingency table) THEORY

Q9.2
Kiểm định 2 biến phân loại (ngành × hạng trái phiếu) độc lập. (a) Dùng thống kê gì? (b) Công thức? (c) df nếu bảng 3 hàng × 4 cột?
(a) Chi-square statistic (test 1 phía, đuôi phải).
(b) χ² = Σ (Observed − Expected)²Expected.
(c) df = (r−1)(c−1) = (3−1)(4−1) = 6
(a) Chi-square; (b) Σ(O−E)²/E; (c) df = 6

Dạng 3: Spearman rank correlation CALC

Q9.3
5 quỹ, hạng theo phí (X) và hạng theo lợi nhuận (Y): X = (1,2,3,4,5); Y = (2,1,3,5,4). Tính Spearman rs.
Hiệu hạng d = X − Y: (1−2, 2−1, 3−3, 4−5, 5−4) = (−1, +1, 0, −1, +1)
d² = 1, 1, 0, 1, 1 → Σd² = 4; n = 5
rs = 1 − 6 Σd²n(n²−1) = 1 − 6×45(25−1) = 1 − 24120 = 1 − 0.20 = 0.80
Dùng Spearman khi dữ liệu là thứ hạng hoặc phi chuẩn. Mẫu lớn → kiểm định bằng t với df = n − 2 (giống Pearson).
rs = 0.80

LM10: Simple Linear Regression

Dạng 1: Predicted value & residual CALC

Q10.1
ROE = 4 + 1.8 × GO. (a) Dự đoán ROE khi GO = 8%. (b) Nếu ROE quan sát = 21%, tính residual. (c) ROE đổi bao nhiêu khi GO tăng từ 5% → 6%?
(a) Ŷ = 4 + 1.8×8 = 18.4%
(b) residual = Y − Ŷ = 21 − 18.4 = 2.6%
(c) slope = 1.8 → ROE tăng 1.8% mỗi 1 đơn vị GO.
(a) 18.4%; (b) 2.6%; (c) 1.8%

Dạng 2: R², F-stat, correlation từ ANOVA CALC

Q10.2
ANOVA: SSR = 556, SSE = 679, SST = 1,235, df: regression 1, error 50. (a) R²? (b) Nếu MSE = 19.737 và SSR = 550, tính F.
(a) R² = SSRSST = 5561,235 = 0.45
(b) F = MSRMSE = 55019.737 = 27.87
(a) R² = 0.45; (b) F = 27.87

Dạng 3: Correlation từ R² (dấu theo slope) CALC

Q10.3
Hồi quy mid-cap ~ S&P 500, slope dương, R² = 0.599. Tính correlation r.
Hồi quy đơn: r = ±√R², dấu theo slope (dương)
r = √0.599 = 0.774
Nếu slope ÂM thì r = −√R².
r ≈ 0.774

Dạng 4: SEE & log-lin prediction MIXED

Q10.4
(a) SSE = 0.071475, df = 34. Tính SEE (standard error of estimate). (b) Mô hình log-lin: ln(net margin) = 0.5987 + 0.2951 × turnover. Dự đoán net margin khi turnover = 2.
(a) SEE = √MSE = √(SSEdf) = √(0.07147534) = √0.0021022 = 0.0459

(b) ln(margin) = 0.5987 + 0.2951×2 = 1.1889 → margin = e1.1889 = 3.28%
Mô hình log-lin: dự đoán ra ln(Y) → phải lấy e mũ để về Y.
(a) SEE ≈ 0.0459; (b) net margin ≈ 3.28%

Dạng 5: Giả định & heteroskedasticity (lý thuyết) THEORY

Q10.5
(a) Heteroskedasticity là gì? (b) Giả định nào KHÔNG đúng: "biến phụ thuộc phải phân phối chuẩn"?
(a) Phương sai phần dư KHÔNG đổi giữa các quan sát → vi phạm = heteroskedasticity. (Homoskedastic = không đổi.)
(b) Đúng — giả định là phần dư phân phối chuẩn; biến phụ thuộc KHÔNG bắt buộc chuẩn.
(a) variance phần dư thay đổi; (b) biến phụ thuộc không cần chuẩn (chỉ phần dư)

Dạng 6: CI cho slope & prediction interval CALC

Q10.6
Hồi quy n = 42 (df = 40, t0.025 = 2.021). (a) slope b₁ = 1.80, SE(b₁) = 0.45 — dựng CI 95% và kết luận về ý nghĩa thống kê. (b) Tại X₀, Ŷ = 18.4% với standard error of forecast sf = 1.20% — dựng prediction interval 95% cho Y.
(a) CI cho slope: b₁ ± tcrit·SE(b₁) = 1.80 ± 2.021×0.45 = 1.80 ± 0.909 → (0.891, 2.709).
Khoảng không chứa 0 → slope khác 0 có ý nghĩa ở 5%.

(b) Prediction interval: Ŷ ± tcrit·sf = 18.4 ± 2.021×1.20 = 18.4 ± 2.425 → (15.98%, 20.82%).
CI slope không chứa 0 ⇔ |tslope| > tcrit ⇔ p < α. Prediction interval rộng hơn khi X₀ càng xa x̄. Cả hai dùng df = n − 2.
(a) (0.891, 2.709) → có ý nghĩa; (b) (15.98%, 20.82%)

LM11: Introduction to Big Data Techniques

Dạng 1: 3 (4) chữ V của Big Data THEORY

Q11.1
"Low latency, multiple terabyte" mô tả đặc tính nào của Big Data?
"Terabyte" = Volume; "latency" = Velocity. (Variety = mức độ cấu trúc; Veracity = độ tin cậy khi suy diễn.)
Volume và Velocity

Dạng 2: Supervised vs unsupervised, overfit vs underfit THEORY

Q11.2
(a) Máy học mô hình output từ input gán nhãn = kỹ thuật gì? (b) Mô hình học cả nhiễu, dự báo kém trên dữ liệu mới = ?
(a) Supervised learning (có input + output gán nhãn). Unsupervised chỉ có input để tìm pattern.
(b) Overfit (quá phức tạp, coi nhiễu là tham số thật). Underfit = ngược lại (coi tham số thật là nhiễu).
(a) Supervised learning; (b) Overfitting

Dạng 3: Curation, text analytics, AI (lý thuyết) THEORY

Q11.3
(a) Điều chỉnh dữ liệu chứng khoán 2 nước cho khác ngày nghỉ lễ = bước xử lý nào? (b) Đếm số lần từ "buy/sell" trong báo cáo = kỹ thuật gì?
(a) Curation (đảm bảo chất lượng, làm sạch/điều chỉnh dữ liệu lỗi/thiếu). Capture = thu thập; Transfer = di chuyển dữ liệu.
(b) Text analytics (phân tích dữ liệu phi cấu trúc; NLP diễn giải ngôn ngữ người).
(a) Curation; (b) Text analytics

Final Exam Strategy / Chiến lược phòng thi

Tần suất dưới đây dựa trên số lượng câu mỗi dạng xuất hiện trong ngân hàng câu hỏi của bạn (390 câu, các dạng calc chiếm đa số).

Dạng bài (theo module)Tần suấtMẹo nhanh
HPR, geometric/harmonic mean, MWR vs TWR (LM01)Rất caoTWR = geomean HPR; MWR = IRR trên máy
Định giá bond / zero / perpetuity / Gordon DDM (LM02)Rất cao5 phím TVM; nhớ D₁ = D₀(1+g); bán niên chia 2
Std dev mẫu, CV, MAD, quantile, skew/kurtosis (LM03)Rất caoMẫu chia (n−1); CV = s/mean; vị trí = (n+1)(y/100)
Hồi quy: R², F, SEE, predict, r = ±√R² (LM10)Rất caoR²=SSR/SST; F=MSR/MSE; df = n−2; log-lin → e mũ
σ danh mục, Cov, ρ, Roy's SFRatio (LM05)CaoNhớ hạng tử 2w₁w₂σ₁σ₂ρ; chọn max SFRatio
Type I/II & power, z-stat, chọn test (LM08)Caoα = Type I; power = 1−β; tăng n để tăng power
Cây xác suất, E(X)/σ, Bayes (LM04)Trung bìnhBayes: joint/tổng joint; 3 bước
Lấy mẫu, CLT, SE = σ/√n, resampling (LM07)Trung bìnhn>30 → normal; SE giảm khi n tăng
t-test correlation (df=n−2), chi-square independence (LM09)Trung bìnht = r√(n−2)/√(1−r²); df = (r−1)(c−1)
Lognormal, Monte Carlo vs bootstrap (LM06)Thấp (lý thuyết)Lognormal: ≥0, lệch phải; bootstrap có hoàn lại
Big Data 3V, ML, curation/text analytics (LM11)Thấp (lý thuyết)Volume/Velocity/Variety; overfit = học cả nhiễu
Common mistakes / Lỗi hay gặp (rút từ giải thích đáp án sai):