Quantitative Methods CFA L1 – Practice Problems by Module
Cách dùng tài liệu này:
- Các dạng bài dưới đây được trích từ chính ngân hàng câu hỏi của bạn (390 câu Quant).
- Mỗi dạng có: ví dụ số cụ thể → lời giải step-by-step → đáp án.
- Box CALC tính toán, THEORY lý thuyết, MIXED kết hợp.
- Box màu tím chỉ cú pháp BA II Plus.
LM01: Rates & Returns
Dạng 1: HPR & continuously compounded return CALC
Q1.1
Cổ phiếu mua $20, cuối năm $25, cổ tức năm nay $1.25. (a) Tính HPR. (b) Một cổ phiếu khác giảm từ $90 → $80, tính lợi nhuận ghép lãi liên tục.
(a) HPR: HPR = P₁ − P₀ + IncomeP₀
= 25 − 20 + 1.2520 = 6.2520 = 31.25%
(b) Continuously compounded: r = ln(P₁/P₀) = ln(80/90) = ln(0.8889) = −11.78%
HPR = 31.25%; r liên tục = −11.78%
Dạng 2: Arithmetic vs Geometric mean return CALC
Q1.2
Lợi nhuận 4 năm: +5%, +12%, −3%, +8%. Tính arithmetic mean và geometric mean.
Arithmetic: 5 + 12 − 3 + 84 = 224 = 5.50%
Geometric: G = [(1+R₁)…(1+Rₙ)]1/n − 1
= [(1.05)(1.12)(0.97)(1.08)]1/4 − 1 = [1.231978]0.25 − 1 = 1.05353 − 1 = 5.35%
Geometric (5.35%) < Arithmetic (5.50%) — luôn đúng khi variance > 0.
Arithmetic = 5.50%; Geometric ≈ 5.35%
Dạng 3: Harmonic mean (cost averaging) CALC
Q1.3
Nhà đầu tư bỏ số tiền cố định mỗi tháng mua cổ phiếu tại 3 mức giá: 50, 55, 48. Giá mua bình quân thực tế?
Harmonic = nΣ(1/Xᵢ)
= 3 / (1/50 + 1/55 + 1/48) = 3 / (0.02000 + 0.018182 + 0.020833) = 30.059015 = 50.83
Harmonic (50.83) < arithmetic (51.0) — dùng khi nạp tiền đều đặn.
Giá mua bình quân ≈ 50.83
Dạng 4: Money-weighted vs Time-weighted return MIXED
Q1.4
Năm 1: đầu tư 100, cuối năm 110. Đầu năm 2 nạp thêm 100 (tổng 210). Cuối năm 2 = 240. Tính TWR và MWR (theo năm).
TWR: HPR₁ = 110/100 − 1 = 10.00%; HPR₂ = 240/210 − 1 = 14.286%
TWR = [(1.10)(1.14286)]1/2 − 1 = (1.257143)0.5 − 1 = 12.12%
MWR (IRR): CF₀ = −100, CF₁ = −100, CF₂ = +240
−100 − 100/(1+r) + 240/(1+r)² = 0 → r = 12.79%
BA II Plus (MWR qua CF/IRR):
CF0 = −100; C01 = −100, F01 = 1; C02 = 240, F02 = 1; IRR CPT → 12.79
MWR > TWR vì nạp nhiều tiền ngay trước kỳ lợi nhuận cao hơn. TWR loại bỏ ảnh hưởng timing → đo kỹ năng quản lý.
TWR ≈ 12.12%; MWR ≈ 12.79%
Dạng 5: Annualizing & real rate CALC
Q1.5
(a) Lợi nhuận 2%/quý → năm hóa? (b) Nominal = 6%, lạm phát = 2.5% → real rate (Fisher chính xác)?
(a) (1 + 0.02)4 − 1 = 1.082432 − 1 = 8.24%
(b) real = (1 + nominal)/(1 + inflation) − 1 = 1.06/1.025 − 1 = 3.41%
(a) 8.24%; (b) 3.41%
Dạng 6: Leveraged return CALC
Q1.6
Danh mục $25 triệu, tài trợ 20% bằng nợ với chi phí 6%/năm. Lợi nhuận đầu tư 10%/năm. Tính lợi nhuận đòn bẩy.
RL = RP + (VB/VE)(RP − rD)
Nợ = 5tr, vốn chủ = 20tr → VB/VE = 0.25
RL = 10% + 0.25 × (10% − 6%) = 10% + 0.25 × 4% = 11.0%
Leveraged return = 11.0%
LM02: Time Value of Money in Finance
Dạng 1: Định giá coupon bond CALC
Q2.1
Trái phiếu 6 năm, mệnh giá $1,000, coupon 5%/năm (trả hằng năm), YTM = 4.5%. Giá hôm nay?
PMT = 50, FV = 1,000, N = 6, I/Y = 4.5
PV = 50 × [1 − 1.045−6]/0.045 + 1,000 × 1.045−6 = 257.89 + 767.90 = 1,025.79
BA II Plus: N=6; I/Y=4.5; PMT=50; FV=1000; CPT PV → −1,025.79
YTM (4.5%) < coupon (5%) → premium bond (giá > par). Trái phiếu bán niên: chia coupon & YTM cho 2, nhân N với 2.
Giá ≈ $1,025.79
Dạng 2: Zero-coupon bond – giá & YTM CALC
Q2.2
Trái phiếu zero-coupon mua $726.27, mệnh giá $1,000, đáo hạn 10 năm. Tính YTM.
YTM = (FVPV)1/N − 1
= (1,000726.27)1/10 − 1 = (1.376817)0.1 − 1 = 1.032494 − 1 = 3.25%
BA II Plus: N=10; PV=−726.27; PMT=0; FV=1000; CPT I/Y → 3.25
YTM ≈ 3.25%
Dạng 3: Preferred stock / perpetuity CALC
Q2.3
Cổ phiếu ưu đãi trả cổ tức $3.75/năm vĩnh viễn, nhà đầu tư yêu cầu 8.5%. Sẵn sàng trả bao nhiêu?
V = Dr = 3.750.085 = 44.12
Giá ≈ $44.12
Dạng 4: Gordon Growth (DDM) – giá, r, hoặc g CALC
Q2.4
(a) Cổ tức vừa trả D₀ = 2.40, g = 3%, r = 8%. Tính giá. (b) Cổ phiếu giá $30, D₁ = 2.40, r = 9.75%. Tính implied g.
(a) V₀ = D₀(1+g)r − g = 2.40 × 1.030.08 − 0.03 = 2.4720.05 = 49.44
(b) g = r − D₁P₀ = 0.0975 − 2.4030 = 0.0975 − 0.08 = 1.75%
Bẫy: D₁ phải dùng cổ tức kỳ TỚI. Nếu đề cho D₀ vừa trả, nhân (1+g) trước.
(a) $49.44; (b) g = 1.75%
Dạng 5: Implied forward rate CALC
Q2.5
Spot 1 năm = 5.25%, spot 2 năm = 6.50%. Tính lãi suất kỳ hạn 1 năm bắt đầu sau 1 năm (F₁,₁).
F₁,₁ = (1+S₂)²1+S₁ − 1
= (1.065)²1.0525 − 1 = 1.1342251.0525 − 1 = 1.077601 − 1 = 7.76%
Forward (7.76%) cao hơn cả 2 spot → KHÔNG nằm giữa 2 spot.
F₁,₁ ≈ 7.76%
Dạng 6: Loan / mortgage payment CALC
Q2.6
Vay $15,000 trả góp hằng tháng trong 5 năm, lãi suất 12%/năm. Mỗi kỳ trả bao nhiêu?
I/Y = 12/12 = 1; N = 5 × 12 = 60; PV = 15,000; FV = 0 → CPT PMT = 333.67
BA II Plus: N=60; I/Y=1; PV=15000; FV=0; CPT PMT → −333.67
PMT ≈ $334/tháng
Dạng 7: Cash flow additivity / no-arbitrage MIXED
Q2.7
Hai cơ hội cùng vốn −1,000,000; CF Opp1 = (500k, 500k, 500k); Opp2 = (400k, 500k, 600k); r = 11%. Nên chọn cái nào (dùng cash flow additivity)?
Hiệu (Opp1 − Opp2) = (+100k, 0, −100k). PV của +100k ở năm 1 > PV của −100k ở năm 3 ở mọi r dương → Opp1 tốt hơn (chênh PV ≈ +$15k).
Không cần tính 2 NPV riêng — chỉ cần dấu của PV(hiệu dòng tiền).
Chọn Opportunity 1
LM03: Statistical Measures of Asset Returns
Dạng 1: Sample standard deviation & variance CALC
Q3.1
Mẫu giá (nghìn $): 125, 175, 150, 155, 135. Tính độ lệch chuẩn mẫu.
Mean = (125+175+150+155+135)/5 = 148
Σ(x−x̄)² = 529 + 729 + 4 + 49 + 169 = 1,480
Variance (mẫu) = 1,4805−1 = 370 → s = √370 = 19.24
Mẫu chia (n−1), KHÔNG chia n.
s ≈ 19.24
Dạng 2: Coefficient of variation (xếp hạng rủi ro) CALC
Q3.2
X: mean 0.9, s 0.7; Y: mean 1.2, s 4.7; Z: mean 1.5, s 5.2. Chứng khoán nào rủi ro tương đối cao nhất?
CV = smean
CVX = 0.70.9 = 0.78; CVY = 4.71.2 = 3.92; CVZ = 5.21.5 = 3.47
CVY lớn nhất.
Security Y (CV = 3.92)
Dạng 3: MAD & geometric (CAGR) CALC
Q3.3
Returns: 15%, 2%, 5%, −7%, 0%. (a) Tính MAD. (b) Tính geometric mean.
Mean = 15+2+5−7+05 = 3%
(a) MAD = |15−3|+|2−3|+|5−3|+|−7−3|+|0−3|5 = 12+1+2+10+35 = 5.60%
(b) Geometric = (1.15×1.02×1.05×0.93×1.00)1/5 − 1 = (1.14541)0.2 − 1 = 2.75%
MAD = 5.60%; Geometric = 2.75%
Dạng 4: Quantile + nội suy CALC
Q3.4
9 quan sát (sắp tăng): 4.2, 6.8, 7.0, 10.9, 11.6, 14.4, 17.0, 19.0, 22.5. Tìm giá trị ở phân vị thứ 70.
Ly = (n+1)(y100) = (9+1)(70100) = 7 → quan sát thứ 7 = 17.0% (L là số nguyên, không cần nội suy)
P₇₀ = 17.0%
Dạng 5: Skewness & kurtosis (lý thuyết) THEORY
Q3.5
(a) Phân phối lệch âm: thứ tự mean/median/mode? (b) Kurtosis = 4.2 nói gì về đuôi?
(a) Lệch âm: mean < median < mode.
(b) Kurtosis 4.2 > 3 → leptokurtic: nhọn hơn, đuôi béo hơn → xác suất biến cố cực trị cao hơn ở CẢ hai phía (lên & xuống).
(a) mean < median < mode; (b) đuôi béo 2 phía, nhiều outlier
Dạng 6: Target semideviation (downside risk) CALC
Q3.6
Lợi nhuận năm (%): 10, 12, 5, −3, 8, 15, −1. Ngưỡng mục tiêu = 10%. Tính target semideviation.
Chỉ lấy quan sát DƯỚI 10%: 5, −3, 8, −1 (bỏ 10, 12, 15 vì ≥ target).
Σ(R<target)(R − target)² = (5−10)² + (−3−10)² + (8−10)² + (−1−10)² = 25 + 169 + 4 + 121 = 319
Chia (n − 1) = 7 − 1 = 6 (n = tổng cỡ mẫu = 7):
Target semidev = √[Σ(R<target)(R − target)²n − 1] = √(3196) = √53.167 = 7.29%
Mẫu số là (n − 1) với n = TỔNG cỡ mẫu (7), KHÔNG phải số quan sát dưới ngưỡng. Chỉ phạt downside.
Target semideviation ≈ 7.29%
LM04: Probability Trees & Conditional Expectations
Dạng 1: Expected value qua cây xác suất 2 tầng CALC
Q4.1
Kinh tế tốt 60% (EPS 5.00 với xs 70%, 3.50 với 30%); xấu 40% (EPS 1.50 với 80%, 1.00 với 20%). Tính E(EPS).
Joint × EPS:
0.60×0.70×5.00 = 0.42×5.00 = 2.10
0.60×0.30×3.50 = 0.18×3.50 = 0.63
0.40×0.80×1.50 = 0.32×1.50 = 0.48
0.40×0.20×1.00 = 0.08×1.00 = 0.08
E(EPS) = 2.10 + 0.63 + 0.48 + 0.08 = 3.29
E(EPS) = $3.29
Dạng 2: Expected value & standard deviation từ bảng xác suất CALC
Q4.2
40% earn 10%; 40% earn 12.5%; 20% earn 30%. Tính E(R) và σ.
E(R) = 0.4×10 + 0.4×12.5 + 0.2×30 = 4 + 5 + 6 = 15%
Var = 0.4(10−15)² + 0.4(12.5−15)² + 0.2(30−15)² = 0.4×25 + 0.4×6.25 + 0.2×225 = 10 + 2.5 + 45 = 57.5
σ = √57.5 = 7.58%
E(R) = 15%; σ = 7.58%
Dạng 3: Bayes' formula (đảo điều kiện) CALC
Q4.3
Bond B vỡ nợ 25%, CCC vỡ nợ 40%. Danh mục 30% B, 70% CCC. Một bond vỡ nợ — xác suất nó là B?
P(default & B) = 0.25 × 0.30 = 0.075
P(default & CCC) = 0.40 × 0.70 = 0.280
P(default) = 0.075 + 0.280 = 0.355
P(B | default) = P(default & B)P(default) = 0.0750.355 = 0.211
3 bước: tính joint từng nhánh → cộng ra P(thông tin mới) → chia nhánh quan tâm cho tổng.
P(B | default) ≈ 0.211
Dạng 4: Counting – permutations, combinations & labeling CALC
Q4.4
(a) Từ 20 cổ phiếu, chọn 3 vào danh mục (thứ tự KHÔNG quan trọng) — bao nhiêu cách? (b) Từ 8 ứng viên, bổ nhiệm 3 chức danh khác nhau (CEO, CFO, COO) — bao nhiêu cách? (c) Gán 10 nhà phân tích nhãn 4 "buy", 3 "hold", 3 "sell" — bao nhiêu cách?
(a) Tổ hợp (không thứ tự): nCr = n!(n−r)!·r! = 20!17!·3! = 20×19×186 = 1,140
(b) Hoán vị (có thứ tự, chức danh khác nhau): nPr = n!(n−r)! = 8!5! = 8×7×6 = 336
(c) Labeling (multinomial): n!n1!·n2!·n3! = 10!4!·3!·3! = 3,628,80024×6×6 = 3,628,800864 = 4,200
Thứ tự quan trọng → permutation (P); không quan trọng → combination (C); chia thành nhiều nhóm có nhãn → công thức labeling n!/(n₁!…nₖ!).
BA II Plus: (a) 20 [2nd nCr] 3 = 1140; (b) 8 [2nd nPr] 3 = 336.
(a) 1,140; (b) 336; (c) 4,200
LM05: Portfolio Mathematics
Dạng 1: σ danh mục 2 tài sản (general) CALC
Q5.1
Pluto: E(R)=11%, σ=0.22; Neptune: E(R)=9%, σ=0.13; ρ=0.25. Danh mục 65% Pluto / 35% Neptune. Tính E(R) và σ.
E(RP) = 0.65×11 + 0.35×9 = 10.3%
σP = √[w₁²σ₁² + w₂²σ₂² + 2w₁w₂σ₁σ₂ρ] (σ tính theo %)
= √[0.65²×22² + 0.35²×13² + 2×0.65×0.35×22×13×0.25]
= √[204.49 + 20.7025 + 32.5325] = √257.725 = 16.05%
E(R) = 10.3%; σ = 16.05%
Dạng 2: σ với ρ = +1 và ρ = −1 CALC
Q5.2
(a) σA=18.9%, σB=14.73%, ρ=+1, equal weight. (b) σA=10.2%, σB=13.9%, ρ=−1, 75% A / 25% B.
(a) ρ = +1 → σP = bình quân trọng số = 0.5×18.9 + 0.5×14.73 = 16.82%
(b) ρ = −1: σP = √[0.75²×10.2² + 0.25²×13.9² + 2×0.75×0.25×10.2×13.9×(−1)]
= √[58.5225 + 12.0756 − 53.1675] = √17.4306 = 4.18%
ρ = +1 → không có lợi ích đa dạng hóa (σ = bình quân). ρ = −1 → rủi ro giảm mạnh, có thể về 0.
(a) 16.82%; (b) 4.18%
Dạng 3: Covariance & correlation CALC
Q5.3
(a) P(X=20,Y=0)=0.4, P(X=30,Y=50)=0.6; E(X)=26, E(Y)=30. Tính Cov(X,Y). (b) Cov=0.009, Var(A)=0.020, Var(B)=0.033. Tính ρ.
(a) Cov = 0.4×(20−26)(0−30) + 0.6×(30−26)(50−30) = 0.4×180 + 0.6×80 = 72 + 48 = 120
(b) ρ = CovσAσB = 0.009/(√0.020 × √0.033) = 0.009/(0.14142×0.18166) = 0.0090.025692 = 0.350
(a) Cov = 120; (b) ρ = 0.350
Dạng 4: Roy's safety-first MIXED
Q5.4
X: mean 12%, σ 14%; Y: mean 17%, σ 20%; Z: mean 22%, σ 25%. Ngưỡng 5%. Chọn danh mục tối ưu.
SFRatio = E(R) − thresholdσ
X: 12−514 = 0.50; Y: 17−520 = 0.60; Z: 22−525 = 0.68 → max → chọn Z
SFRatio lớn nhất = xác suất thấp nhất rơi dưới ngưỡng.
Portfolio Z (SFRatio = 0.68)
LM06: Simulation Methods
Dạng 1: Normal vs lognormal (lý thuyết) THEORY
Q6.1
Vì sao dùng lognormal để mô hình giá cổ phiếu thay vì normal?
Lognormal bị chặn dưới bởi 0 và lệch phải → giá tài sản không thể âm và return không < −100%. Normal cho phép giá âm (vô lý). Ngoài ra nếu Y lognormal thì ln(Y) là normal.
Vì giá ≥ 0 và return ≥ −100%; lognormal không âm, lệch phải
Dạng 2: Monte Carlo vs Bootstrap (lý thuyết) THEORY
Q6.2
Phân biệt Monte Carlo và bootstrap. Hạn chế chính của Monte Carlo?
Monte Carlo: analyst tự chỉ định phân phối & tham số cho input (mọi skew/kurtosis). Hạn chế: kết quả chỉ tốt bằng giả định input; không cho insight như giải tích.
Bootstrap: rút mẫu lại có hoàn lại từ dữ liệu quan sát thực; mỗi resample cùng cỡ mẫu gốc; 1 quan sát có thể xuất hiện nhiều lần; dùng phân phối thực nghiệm (không cần giả định).
MC: tự đặt phân phối, hạn chế = "garbage in, garbage out". Bootstrap: có hoàn lại, cùng cỡ, dữ liệu thực
Dạng 3: Continuously compounded return cộng dồn CALC
Q6.3
Giá: 1/8 = 112, 8/8 = 160, 15/8 = 120. Tính lợi nhuận ghép liên tục từ 1/8 → 15/8.
r = ln(120/112) = ln(1.07143) = 6.90%
(Kiểm tra cộng dồn: ln(160/112) + ln(120/160) = 35.67% + (−28.77%) = 6.90%)
r ≈ 6.90%
LM07: Estimation & Inference
Dạng 1: Nhận diện phương pháp lấy mẫu THEORY
Q7.1
(a) Chia tổng thể thành 10 nhóm theo vốn hóa, lấy 50 từ mỗi nhóm rồi gộp = ? (b) Khảo sát chỉ ứng viên làm cùng văn phòng cho tiện = ?
(a) Stratified random sampling (cỡ mỗi tầng tỷ lệ kích thước tầng, không bắt buộc bằng nhau).
(b) Convenience sampling (chọn theo dễ tiếp cận → rủi ro thiên lệch).
(a) Stratified; (b) Convenience
Dạng 2: Standard error of the mean CALC
Q7.2
Tổng thể có variance = 2.45, cỡ mẫu n = 40. Tính standard error của trung bình mẫu.
σ = √2.45 = 1.565
SE = σ√n = 1.565√40 = 1.5656.3246 = 0.247
Tăng n → SE giảm (bẫy: nhiều câu nói "SE tăng khi n tăng" là SAI).
SE ≈ 0.247
Dạng 3: CLT & resampling (lý thuyết) THEORY
Q7.3
(a) Phát biểu CLT về mean và variance của phân phối trung bình mẫu. (b) Jackknife khác bootstrap thế nào?
(a) Với n lớn (>30), phân phối trung bình mẫu ≈ chuẩn bất kể phân phối gốc; mean = μ; variance = σ²/n.
(b) Jackknife: bỏ lần lượt MỘT quan sát, thường lặp đúng n lần. Bootstrap: rút có hoàn lại, cùng cỡ, số lần lặp tùy chọn.
(a) ≈ normal, mean = μ, var = σ²/n; (b) jackknife bỏ 1 obs, lặp n lần
Dạng 4: Confidence interval – chọn z vs t CALC
Q7.4
(a) Mẫu n = 64, mean = 6.5%, s = 8% (σ chưa biết, n lớn). Dựng CI 95%. (b) Mẫu n = 16 từ tổng thể chuẩn, mean = 4.0%, s = 1.5% (σ chưa biết). Dựng CI 95% (t0.025, df=15 = 2.131).
(a) n > 30 → dùng z = 1.96. SE = 8√64 = 88 = 1.0
CI = 6.5 ± 1.96×1.0 = 6.5 ± 1.96 → (4.54%, 8.46%)
(b) n nhỏ, σ chưa biết, tổng thể chuẩn → dùng t (df = n−1 = 15). SE = 1.5√16 = 1.54 = 0.375
CI = 4.0 ± 2.131×0.375 = 4.0 ± 0.799 → (3.20%, 4.80%)
σ biết hoặc n lớn → z. σ chưa biết & mẫu nhỏ (tổng thể chuẩn) → t với df = n−1 (khoảng rộng hơn).
(a) (4.54%, 8.46%); (b) (3.20%, 4.80%)
Dạng 5: Nhận diện sampling bias THEORY
Q7.5
(a) Phân tích chỉ dùng các quỹ còn hoạt động hôm nay, bỏ quỹ đã đóng cửa → lợi nhuận trung bình bị thổi phồng. Bias gì? (b) Thử 300 chỉ báo kỹ thuật trên cùng dữ liệu đến khi tìm được 1 cái "thắng". Bias gì?
(a) Survivorship bias — chỉ giữ thực thể "sống sót", loại bỏ quỹ thất bại → kết quả lạc quan giả.
(b) Data-snooping (data-mining) bias — thử quá nhiều mô hình; quan hệ tìm thấy là ngẫu nhiên, không lặp lại out-of-sample.
(a) Survivorship bias; (b) Data-snooping bias
LM08: Hypothesis Testing
Dạng 1: z-statistic cho mean CALC
Q8.1
Kiểm định lương khởi điểm CFA ≥ $54,000. Mẫu n = 75, mean = $57,000, s = $1,300. Tính test statistic.
z = x̄ − μ₀s/√n
= (57,000 − 54,000)/(1,300/√75) = 3,000/(1,300/8.660) = 3,000150.11 = 19.99
n > 30 → dùng z. So với critical (1 tai 5% = 1.645) → bác bỏ H₀.
z = 19.99
Dạng 2: Type I / Type II / Power (lý thuyết) THEORY
Q8.2
(a) Mổ bỏ ruột thừa (H₀: viêm ruột thừa) nhưng thực ra do túi mật = lỗi loại nào? (b) P(Type II) = 18%, P(Type I) = 5%. Tính power.
(a) H₀ thực ra SAI mà không bác bỏ (vẫn mổ ruột thừa) → Type II error.
(b) Power = 1 − β = 1 − 0.18 = 0.82
Type I = bác bỏ H₀ đúng (= α). Type II = không bác bỏ H₀ sai (= β). Power = 1 − β. Tăng power tốt nhất: giữ α, tăng n.
(a) Type II error; (b) Power = 0.82
Dạng 3: Chọn test thống kê phù hợp THEORY
Q8.3
Test nào cho: (a) một phương sai tổng thể; (b) bằng nhau của hai phương sai; (c) so sánh 2 quỹ mẫu nhỏ, phi chuẩn?
(a) Chi-square (1 phương sai).
(b) F-test (so sánh 2 phương sai).
(c) Nonparametric (vd Mann–Whitney U) vì mẫu nhỏ & phi chuẩn → không thỏa giả định parametric.
(a) Chi-square; (b) F-test; (c) Nonparametric
Dạng 4: p-value & quyết định MIXED
Q8.4
Kiểm định 2 phía một mean. Test statistic z = 2.50. (a) Tính p-value (diện tích đuôi phải của z=2.50 ≈ 0.0062). (b) Ở α = 5% và α = 1%, có bác bỏ H₀ không?
(a) Test 2 phía → p = 2 × diện tích một đuôi = 2 × 0.0062 = 0.0124 (≈ 1.24%).
(b) So sánh p với α:
• α = 5% (0.05): p = 0.0124 < 0.05 → bác bỏ H₀.
• α = 1% (0.01): p = 0.0124 > 0.01 → KHÔNG bác bỏ H₀.
p-value = mức ý nghĩa nhỏ nhất còn bác bỏ được H₀. Quy tắc: p < α → bác bỏ. Hai phía → nhân đôi diện tích đuôi.
(a) p ≈ 0.0124; (b) bác bỏ ở 5%, không bác bỏ ở 1%
LM09: Parametric & Non-Parametric Tests of Independence
Dạng 1: t-test cho hệ số tương quan = 0 CALC
Q9.1
r = −0.525, n = 19. Tính t-statistic và kết luận ở mức 5% (critical t với df=17 ≈ 2.110).
t = r√(n−2)√(1−r²), df = n − 2 = 17
= −0.525 × √17 / √(1 − 0.275625) = −0.525 × 4.1231 / √0.724375 = −2.16460.85110 = −2.543
|−2.543| > 2.110 → bác bỏ H₀ ở mức 5% (có tương quan).
Chỉ cần r và n; KHÔNG cần mean/std của 2 biến. df = n − 2.
t = −2.543 → bác bỏ ở 5% (không bác bỏ ở 2%)
Dạng 2: Chi-square test of independence (contingency table) THEORY
Q9.2
Kiểm định 2 biến phân loại (ngành × hạng trái phiếu) độc lập. (a) Dùng thống kê gì? (b) Công thức? (c) df nếu bảng 3 hàng × 4 cột?
(a) Chi-square statistic (test 1 phía, đuôi phải).
(b) χ² = Σ (Observed − Expected)²Expected.
(c) df = (r−1)(c−1) = (3−1)(4−1) = 6
(a) Chi-square; (b) Σ(O−E)²/E; (c) df = 6
Dạng 3: Spearman rank correlation CALC
Q9.3
5 quỹ, hạng theo phí (X) và hạng theo lợi nhuận (Y): X = (1,2,3,4,5); Y = (2,1,3,5,4). Tính Spearman rs.
Hiệu hạng d = X − Y: (1−2, 2−1, 3−3, 4−5, 5−4) = (−1, +1, 0, −1, +1)
d² = 1, 1, 0, 1, 1 → Σd² = 4; n = 5
rs = 1 − 6 Σd²n(n²−1) = 1 − 6×45(25−1) = 1 − 24120 = 1 − 0.20 = 0.80
Dùng Spearman khi dữ liệu là thứ hạng hoặc phi chuẩn. Mẫu lớn → kiểm định bằng t với df = n − 2 (giống Pearson).
rs = 0.80
LM10: Simple Linear Regression
Dạng 1: Predicted value & residual CALC
Q10.1
ROE = 4 + 1.8 × GO. (a) Dự đoán ROE khi GO = 8%. (b) Nếu ROE quan sát = 21%, tính residual. (c) ROE đổi bao nhiêu khi GO tăng từ 5% → 6%?
(a) Ŷ = 4 + 1.8×8 = 18.4%
(b) residual = Y − Ŷ = 21 − 18.4 = 2.6%
(c) slope = 1.8 → ROE tăng 1.8% mỗi 1 đơn vị GO.
(a) 18.4%; (b) 2.6%; (c) 1.8%
Dạng 2: R², F-stat, correlation từ ANOVA CALC
Q10.2
ANOVA: SSR = 556, SSE = 679, SST = 1,235, df: regression 1, error 50. (a) R²? (b) Nếu MSE = 19.737 và SSR = 550, tính F.
(a) R² = SSRSST = 5561,235 = 0.45
(b) F = MSRMSE = 55019.737 = 27.87
(a) R² = 0.45; (b) F = 27.87
Dạng 3: Correlation từ R² (dấu theo slope) CALC
Q10.3
Hồi quy mid-cap ~ S&P 500, slope dương, R² = 0.599. Tính correlation r.
Hồi quy đơn: r = ±√R², dấu theo slope (dương)
r = √0.599 = 0.774
Nếu slope ÂM thì r = −√R².
r ≈ 0.774
Dạng 4: SEE & log-lin prediction MIXED
Q10.4
(a) SSE = 0.071475, df = 34. Tính SEE (standard error of estimate). (b) Mô hình log-lin: ln(net margin) = 0.5987 + 0.2951 × turnover. Dự đoán net margin khi turnover = 2.
(a) SEE = √MSE = √(SSEdf) = √(0.07147534) = √0.0021022 = 0.0459
(b) ln(margin) = 0.5987 + 0.2951×2 = 1.1889 → margin = e1.1889 = 3.28%
Mô hình log-lin: dự đoán ra ln(Y) → phải lấy e mũ để về Y.
(a) SEE ≈ 0.0459; (b) net margin ≈ 3.28%
Dạng 5: Giả định & heteroskedasticity (lý thuyết) THEORY
Q10.5
(a) Heteroskedasticity là gì? (b) Giả định nào KHÔNG đúng: "biến phụ thuộc phải phân phối chuẩn"?
(a) Phương sai phần dư KHÔNG đổi giữa các quan sát → vi phạm = heteroskedasticity. (Homoskedastic = không đổi.)
(b) Đúng — giả định là phần dư phân phối chuẩn; biến phụ thuộc KHÔNG bắt buộc chuẩn.
(a) variance phần dư thay đổi; (b) biến phụ thuộc không cần chuẩn (chỉ phần dư)
Dạng 6: CI cho slope & prediction interval CALC
Q10.6
Hồi quy n = 42 (df = 40, t0.025 = 2.021). (a) slope b₁ = 1.80, SE(b₁) = 0.45 — dựng CI 95% và kết luận về ý nghĩa thống kê. (b) Tại X₀, Ŷ = 18.4% với standard error of forecast sf = 1.20% — dựng prediction interval 95% cho Y.
(a) CI cho slope: b₁ ± tcrit·SE(b₁) = 1.80 ± 2.021×0.45 = 1.80 ± 0.909 → (0.891, 2.709).
Khoảng không chứa 0 → slope khác 0 có ý nghĩa ở 5%.
(b) Prediction interval: Ŷ ± tcrit·sf = 18.4 ± 2.021×1.20 = 18.4 ± 2.425 → (15.98%, 20.82%).
CI slope không chứa 0 ⇔ |tslope| > tcrit ⇔ p < α. Prediction interval rộng hơn khi X₀ càng xa x̄. Cả hai dùng df = n − 2.
(a) (0.891, 2.709) → có ý nghĩa; (b) (15.98%, 20.82%)
LM11: Introduction to Big Data Techniques
Dạng 1: 3 (4) chữ V của Big Data THEORY
Q11.1
"Low latency, multiple terabyte" mô tả đặc tính nào của Big Data?
"Terabyte" = Volume; "latency" = Velocity. (Variety = mức độ cấu trúc; Veracity = độ tin cậy khi suy diễn.)
Volume và Velocity
Dạng 2: Supervised vs unsupervised, overfit vs underfit THEORY
Q11.2
(a) Máy học mô hình output từ input gán nhãn = kỹ thuật gì? (b) Mô hình học cả nhiễu, dự báo kém trên dữ liệu mới = ?
(a) Supervised learning (có input + output gán nhãn). Unsupervised chỉ có input để tìm pattern.
(b) Overfit (quá phức tạp, coi nhiễu là tham số thật). Underfit = ngược lại (coi tham số thật là nhiễu).
(a) Supervised learning; (b) Overfitting
Dạng 3: Curation, text analytics, AI (lý thuyết) THEORY
Q11.3
(a) Điều chỉnh dữ liệu chứng khoán 2 nước cho khác ngày nghỉ lễ = bước xử lý nào? (b) Đếm số lần từ "buy/sell" trong báo cáo = kỹ thuật gì?
(a) Curation (đảm bảo chất lượng, làm sạch/điều chỉnh dữ liệu lỗi/thiếu). Capture = thu thập; Transfer = di chuyển dữ liệu.
(b) Text analytics (phân tích dữ liệu phi cấu trúc; NLP diễn giải ngôn ngữ người).
(a) Curation; (b) Text analytics
Final Exam Strategy / Chiến lược phòng thi
Tần suất dưới đây dựa trên số lượng câu mỗi dạng xuất hiện trong ngân hàng câu hỏi của bạn (390 câu, các dạng calc chiếm đa số).
| Dạng bài (theo module) | Tần suất | Mẹo nhanh |
| HPR, geometric/harmonic mean, MWR vs TWR (LM01) | Rất cao | TWR = geomean HPR; MWR = IRR trên máy |
| Định giá bond / zero / perpetuity / Gordon DDM (LM02) | Rất cao | 5 phím TVM; nhớ D₁ = D₀(1+g); bán niên chia 2 |
| Std dev mẫu, CV, MAD, quantile, skew/kurtosis (LM03) | Rất cao | Mẫu chia (n−1); CV = s/mean; vị trí = (n+1)(y/100) |
| Hồi quy: R², F, SEE, predict, r = ±√R² (LM10) | Rất cao | R²=SSR/SST; F=MSR/MSE; df = n−2; log-lin → e mũ |
| σ danh mục, Cov, ρ, Roy's SFRatio (LM05) | Cao | Nhớ hạng tử 2w₁w₂σ₁σ₂ρ; chọn max SFRatio |
| Type I/II & power, z-stat, chọn test (LM08) | Cao | α = Type I; power = 1−β; tăng n để tăng power |
| Cây xác suất, E(X)/σ, Bayes (LM04) | Trung bình | Bayes: joint/tổng joint; 3 bước |
| Lấy mẫu, CLT, SE = σ/√n, resampling (LM07) | Trung bình | n>30 → normal; SE giảm khi n tăng |
| t-test correlation (df=n−2), chi-square independence (LM09) | Trung bình | t = r√(n−2)/√(1−r²); df = (r−1)(c−1) |
| Lognormal, Monte Carlo vs bootstrap (LM06) | Thấp (lý thuyết) | Lognormal: ≥0, lệch phải; bootstrap có hoàn lại |
| Big Data 3V, ML, curation/text analytics (LM11) | Thấp (lý thuyết) | Volume/Velocity/Variety; overfit = học cả nhiễu |
Common mistakes / Lỗi hay gặp (rút từ giải thích đáp án sai):
- Std dev mẫu: chia (n−1), KHÔNG chia n. Variance đơn vị %², std dev đơn vị %.
- Gordon DDM: phải dùng D₁ = D₀(1+g) (cổ tức kỳ TỚI), không dùng D₀; nếu dùng D₀ sẽ ra đáp án sai bẫy sẵn.
- Bond bán niên: chia coupon & YTM cho 2 và nhân N với 2 — quên là sai số periods (bẫy hay gặp ở câu Grupo Ignacia).
- r liên tục vs HPR: khi giá tăng, HPR > r liên tục (không bằng nhau).
- σ danh mục: đừng quên hạng tử covariance 2w₁w₂σ₁σ₂ρ; ρ=+1 thì σ = bình quân trọng số (KHÔNG cần công thức đầy đủ).
- SFRatio: chọn ratio LỚN NHẤT (xác suất shortfall thấp nhất), không phải nhỏ nhất.
- Standard error: SE = σ/√n GIẢM khi n tăng (đáp án "SE tăng khi n tăng" luôn sai).
- Type I vs II: Type I = bác bỏ H₀ ĐÚNG (= α); Type II = không bác bỏ H₀ SAI (= β). Power = 1 − β.
- Correlation: ρ chỉ đo quan hệ TUYẾN TÍNH; ρ ≈ 0 không có nghĩa hai biến hoàn toàn không liên quan (có thể phi tuyến). ρ ≠ xác suất.
- Hồi quy: r = ±√R² — nhớ lấy dấu theo slope; df cho t-test slope & prediction = n − 2; chỉ phần dư cần phân phối chuẩn, biến phụ thuộc thì không.
- log-lin: output là ln(Y), phải lấy e mũ để ra Y.
- Stratified sampling: cỡ mẫu mỗi tầng TỶ LỆ kích thước tầng, KHÔNG bằng nhau.