Tôi đã kiểm tra mọi bộ lọc breakout phổ biến — đột biến khối lượng giao dịch, funding rate, open interest — trên 546 hợp đồng tương lai vĩnh cửu crypto. Ba trong số năm giả thuyết đã thất bại. Những giả thuyết còn lại đã trở thành chiến lược giao dịch với Tỷ lệ Sharpe 0.93.
Giá phá vỡ trên dải Bollinger Bands trên. Khối lượng giao dịch gấp 3 lần mức trung bình hàng ngày. Funding rate âm — các vị thế short sắp bị ép. Mọi tín hiệu đều nói hãy mở long.
Bạn vào lệnh. Bốn giờ sau, giá quay trở lại dưới dải, và bạn đang nhìn vào khoản lỗ.
Tôi đã từng như vậy. Vì vậy tôi đã ngừng đoán và bắt đầu đếm. Tôi đã thu thập 31,810 sự kiện breakout trên 546 hợp đồng tương lai vĩnh cửu Binance, tham chiếu chéo open interest từ 457 cặp giao dịch Bybit, và kiểm tra mọi bộ lọc breakout phổ biến mà tôi có thể tìm thấy. Những gì tôi phát hiện đã đảo lộn hầu hết những gì tôi nghĩ mình biết — và ba trong số những "tín hiệu xác nhận" được trích dẫn rộng rãi nhất hóa ra là vô giá trị.
Tôi có thể phân biệt thống kê breakout thật với breakout giả trước khi vào lệnh giao dịch không?
Tôi định nghĩa "thật" là một breakout trong đó giá theo sau ít nhất 1 ATR theo hướng breakout trong vòng 5 ngày, và "giả" là một breakout trong đó giá di chuyển ít hơn 0.5 ATR theo chiều thuận lợi trong khi di chuyển hơn 1 ATR theo chiều bất lợi.
Bộ dữ liệu: 546 hợp đồng tương lai vĩnh cửu Binance, 31,810 sự kiện breakout hàng ngày (phương pháp Bollinger Bands), và 787,635 sự kiện theo giờ trải dài từ 2020–2026. Để phân tích open interest, tôi đã tham chiếu chéo 457 cặp giao dịch với dữ liệu OI Bybit (5.6 năm với độ chi tiết 4 giờ).
Tôi đã kiểm tra nhiều bộ lọc breakout tiềm năng. Chỉ năm bộ lọc vượt qua sự xem xét thống kê ở quy mô lớn:
Hình 1: Tóm tắt tất cả các tín hiệu được kiểm tra trên 546 cặp giao dịch. Năm tín hiệu được xác nhận, ba tín hiệu bị từ chối hoặc đảo ngược.Các yếu tố dự báo mạnh nhất là loại coin (FADE/FOLLOW, chênh lệch 8pp), ngày trong tuần (Thứ Năm = 62% thật, Thứ Hai = 47%), và xếp hạng ngũ phân vị tự tương quan (Q1 = 59.6% so với Q5 = 51.2%, chênh lệch 8.4pp, p < 0.0001).
FADE và FOLLOW coin là gì? Tôi phát hiện ra rằng các coin được nhóm thành hai loại hành vi:
Lầm tưởng 1: "Đột biến khối lượng giao dịch xác nhận breakout." Trong mẫu 23 cặp giao dịch ban đầu của tôi, khối lượng giao dịch >= 2x mức trung bình cho thấy tỷ lệ thật 63.2% (p=0.008). Trông tuyệt vời phải không? Nhưng khi tôi mở rộng lên 546 cặp giao dịch, con số ĐẢO NGƯỢC xuống 49.5% — tệ hơn ngẫu nhiên. Phát hiện ban đầu là thiên kiến lựa chọn thuần túy hướng tới các coin thanh khoản cao, hoạt động tốt. Trong vũ trụ rộng lớn hơn, đột biến khối lượng giao dịch ở các coin vốn hóa nhỏ báo hiệu thao túng, không phải nhu cầu thực sự.
Lầm tưởng 2: "OI tăng có nghĩa là tiền mới vào = breakout thật." Đây có lẽ là "tín hiệu xác nhận" được trích dẫn phổ biến nhất trong các cộng đồng giao dịch crypto. Dữ liệu nói điều hoàn toàn ngược lại: OI giảm dự báo breakout theo sau tốt hơn (57.1% so với 50.6%, p = 0.000003). Cơ chế: OI giảm có nghĩa là các vị thế đã được giải tỏa, tạo ra một tình trạng sạch cho các động thái dựa trên niềm tin. OI tăng có nghĩa là vị thế đông đúc — mong manh và dễ bị đảo chiều.
Lầm tưởng 3: "Funding rate dự báo chất lượng breakout." Funding âm + breakout hướng lên = ép short = theo sau mạnh mẽ, đúng không? Sai. Mọi thử nghiệm funding rate đều tạo ra p-value trên 0.23. Sức mạnh dự báo bằng không. Funding phản ánh tâm lý vị thế hiện tại, không phải chất lượng breakout.
Chi tiết phương pháp đầy đủ trong phần Phương pháp ở cuối bài viết này.
Với những phát hiện này, tôi đã thiết kế năm chiến lược giao dịch:
Hai chiến lược đã bị loại bỏ trước khi tôi chạy backtest. Đây là sức mạnh của xác thực thống kê trước backtest — tôi đã tiết kiệm hàng giờ tính toán bằng cách kiểm tra các nguyên tắc cơ bản trước.
Tôi đã chạy một backtest walk-forward nghiêm ngặt: 6 fold kiểm tra không trùng lặp từ tháng 7 năm 2021 đến tháng 2 năm 2026, với chi phí giao dịch khứ hồi 22 bps.
Hình 4: Kết quả chiến lược riêng lẻ. S1 và S3 có lợi nhuận; S5 sụp đổ mặc dù vượt qua xác thực.Thất bại nspectacular của S5 đáng chú ý. Chiến lược này đã vượt qua TẤT CẢ 6 cổng xác thực trước backtest — các mẫu ngày trong tuần và giờ trong ngày có ý nghĩa thống kê trên 573 cặp giao dịch với p-value cực nhỏ (thấp tới 10^-217). Tuy nhiên trong kiểm tra walk-forward, nó đăng ký Sharpe -0.02 với 3 fold thua liên tiếp (2023–2025). Mẫu Thứ Năm 14:00 UTC theo giờ là thật trong tổng thể nhưng phụ thuộc vào chế độ — nó bay hơi trong các giai đoạn giảm giá.
Kết hợp danh mục đầu tư
Tôi đã kiểm tra tất cả 7 kết hợp có thể (3 đơn + 3 cặp + 1 ba):
Hình 5: Tất cả bảy kết hợp danh mục đầu tư được xếp hạng theo Tỷ lệ Sharpe.Người chiến thắng: S1+S3 với Sharpe 0.93, max drawdown -36.8%, và CAGR 25.0%.
Tại sao kết hợp S1 và S3 đánh bại cả hai riêng lẻ? Mối tương quan của chúng chỉ là 0.10 — chúng hiếm khi mất tiền vào cùng một ngày.
Hình 6: Mối tương quan gần bằng không giữa các chiến lược cung cấp sự đa dạng hóa danh mục đầu tư thực sự.Đường cong vốn chủ sở hữu
Hình 7: Đường cong vốn chủ sở hữu cho S1 (xanh dương), S3 (xanh lá), và kết hợp S1+S3 (đỏ). Các đường chấm hiển thị ranh giới fold walk-forward. Ròng của chi phí giao dịch 22 bps.Đường cong vốn chủ sở hữu cho thấy hiệu suất mạnh mẽ vào năm 2024 và đầu năm 2026, với drawdown đau đớn vào 2025-H1 khi TẤT CẢ các chiến lược đều mất tiền.
Hình 8: Biểu đồ drawdown S1+S3. Đường gạch ngang cam hiển thị cổng quyết định -15%.Chiến lược không bao giờ ở dưới ngưỡng này trong thời gian dài, nhưng vượt qua nó thường xuyên.
Tính nhất quán theo từng Fold
Hình 9: Tỷ lệ Sharpe theo từng fold. Fold 5 (2025-H1) là giai đoạn duy nhất mà tất cả các chiến lược đều thua lỗ. Fold 6 mạnh nhưng quá ngắn để đáng tin cậy.Đây là phát hiện quan trọng nhất của toàn bộ dự án.
S2 được thiết kế để long các coin có tự tương quan thấp nhất (Q1, tỷ lệ thật cao nhất 59.6%) và short các coin có tự tương quan cao nhất (Q5, tỷ lệ thật thấp nhất 51.2%). Tín hiệu dự đoán hoàn hảo coin nào sẽ theo sau thường xuyên hơn.
Hệ số thông tin hàng tháng là âm: -0.016.
Làm thế nào có thể như vậy? Bởi vì tần suất thành công không giống như độ lớn thành công. Các coin Q5 breakout ít hơn, nhưng khi chúng breakout, chúng DI CHUYỂN XA HƠN. Những người chiến thắng ở Q5 lớn hơn những người chiến thắng ở Q1, đủ để bù đắp cho Tỷ lệ chiến thắng thấp hơn.
Nói cách khác: tín hiệu dự đoán chính xác AI sẽ thắng thường xuyên hơn, nhưng những người thua ở Q1 và những người thắng ở Q5 có độ lớn không đối xứng làm đảo ngược lợi nhuận kỳ vọng.
1. Ý nghĩa thống kê không đảm bảo lợi nhuận. S5 vượt qua mọi thử nghiệm chi-squared với p-value cực nhỏ (10^-217). Tuy nhiên một lợi thế 1.4pp (55.2% so với 53.8%) đã bay hơi sau chi phí 22 bps trong các chế độ thị trường bất lợi. Yêu cầu cả ý nghĩa thống kê VÀ kinh tế.
2. Tỷ lệ chiến thắng cao không có nghĩa là lợi nhuận cao. Nghịch lý S2: bạn có thể dự đoán hoàn hảo coin nào breakout thường xuyên hơn và vẫn mất tiền, bởi vì tần suất != độ lớn. Luôn tính IC so với lợi nhuận tương lai, không chỉ Tỷ lệ chiến thắng.
3. Mở rộng vũ trụ của bạn trước khi tin tưởng một phát hiện. Đột biến khối lượng giao dịch "xác nhận" breakout ở 23 cặp giao dịch nhưng ĐẢO NGƯỢC ở 546. Thiên kiến lựa chọn hướng tới các coin thanh khoản cao, hoạt động tốt che giấu thực tế thao túng ở các coin vốn hóa nhỏ hơn.
4. Các tín hiệu trái ngược ẩn trước mắt. Câu chuyện OI phổ biến nhất ("OI tăng = tiền mới = breakout thật") là sai về mặt thực nghiệm. Tình trạng sạch (OI giảm) tạo ra breakout tốt hơn so với vị thế đông đúc.
5. Xác thực trước backtest tiết kiệm rất nhiều thời gian. S2 bị loại bỏ bằng một phép tính IC 30 giây, tiết kiệm 30+ phút backtest walk-forward trên một chiến lược vốn đã là một kẻ thua cuộc được đảm bảo.
S1+S3 có thể giao dịch được không? Chưa. Sharpe 0.93 đầy hứa hẹn, và CAGR 25.0% hấp dẫn, nhưng max drawdown -36.8% khiến nó không phù hợp để triển khai với quy mô vị thế hiện tại. Với quy mô thận trọng hơn (mục tiêu biến động 5–7% thay vì 15%), drawdown sẽ giảm một nửa xuống ~18%, làm cho nó có thể triển khai được một phần.
Những gì cần thiết để vượt qua Sharpe 1.0:
Nền tảng thống kê vững chắc. Tín hiệu (FOLLOW coin + OI giảm + ngày trong tuần thuận lợi) là thật và mạnh mẽ trên 546 cặp giao dịch. Thách thức là chuyển đổi lợi thế thống kê khiêm tốn đó (5–8pp) thành lợi nhuận sau chi phí nhất quán.
Bạn tin tưởng vào bộ lọc breakout nào — và nó đã vượt qua kiểm tra nghiêm ngặt chưa? Tôi thực sự muốn biết. Để lại bình luận hoặc liên hệ.
Tuyên bố từ chối trách nhiệm: Nghiên cứu này chỉ nhằm mục đích giáo dục. Hiệu suất trong quá khứ không đảm bảo kết quả trong tương lai. Luôn tự nghiên cứu kỹ lưỡng trước khi đưa ra quyết định đầu tư.
Tags: #QuantitativeFinance #Crypto #Breakouts #TradingStrategy #DataScience #WalkForward #StatisticalAnalysis
I Analyzed 31,810 Crypto Breakouts. Here's What Actually Predicts Real vs Fake. ban đầu được xuất bản trên Coinmonks trên Medium, nơi mọi người đang tiếp tục cuộc trò chuyện bằng cách đánh dấu và phản hồi câu chuyện này.


