Phân tích hiệu suất của các phép nới lỏng SDP và Moment-SOS trên các bộ dữ liệu hyperbolic tổng hợp.Phân tích hiệu suất của các phép nới lỏng SDP và Moment-SOS trên các bộ dữ liệu hyperbolic tổng hợp.

Hiệu suất Tối ưu trên Gaussian Tổng hợp và Tree Embeddings

Đọc trong 5 phút

Tóm tắt và 1. Giới Thiệu

  1. Các Nghiên Cứu Liên Quan

  2. Kỹ Thuật Nới Lỏng Lồi cho SVM Hyperbolic

    3.1 Kiến Thức Cơ Bản

    3.2 Công Thức Ban Đầu của HSVM

    3.3 Công Thức Bán Xác Định

    3.4 Nới Lỏng Moment-Tổng-Bình-Phương

  3. Thực Nghiệm

    4.1 Bộ Dữ Liệu Tổng Hợp

    4.2 Bộ Dữ Liệu Thực Tế

  4. Thảo Luận, Lời Cảm Ơn và Tài Liệu Tham Khảo

    \

A. Chứng Minh

B. Trích Xuất Giải Pháp trong Công Thức Nới Lỏng

C. Về Hệ Thống Phân Cấp Nới Lỏng Moment Tổng-Bình-Phương

D. Platt Scaling [31]

E. Kết Quả Thực Nghiệm Chi Tiết

F. Máy Vector Hỗ Trợ Hyperbolic Mạnh Mẽ

4.1 Bộ Dữ Liệu Tổng Hợp

\ Nhìn chung, chúng tôi quan sát thấy sự cải thiện nhỏ về độ chính xác kiểm tra trung bình và điểm F1 có trọng số từ SDP và Moment so với PGD. Đáng chú ý, chúng tôi nhận thấy rằng Moment thường cho thấy cải thiện nhất quán hơn so với SDP, trong hầu hết các cấu hình. Ngoài ra, Moment cho khoảng cách tối ưu 𝜂 nhỏ hơn SDP. Điều này phù hợp với kỳ vọng của chúng tôi rằng Moment chặt chẽ hơn SDP.

\ Mặc dù trong một số trường hợp, ví dụ khi 𝐾 = 5, Moment đạt được tổn thất nhỏ hơn đáng kể so với cả PGD và SDP, nhưng nói chung không phải như vậy. Chúng tôi nhấn mạnh rằng những tổn thất này không phải là các phép đo trực tiếp khả năng tổng quát hóa của các bộ phân tách hyperbolic lề tối đa; thay vào đó, chúng là sự kết hợp của việc tối đa hóa lề và phạt cho phân loại sai tỷ lệ với 𝐶. Do đó, quan sát thấy hiệu suất về độ chính xác kiểm tra và điểm F1 có trọng số tốt hơn, mặc dù tổn thất được tính bằng cách sử dụng các giải pháp trích xuất từ SDP và Moment đôi khi cao hơn so với PGD, có thể là do bối cảnh tổn thất phức tạp. Cụ thể hơn, sự gia tăng tổn thất quan sát được có thể được quy cho sự phức tạp của bối cảnh thay vì hiệu quả của các phương pháp tối ưu hóa. Dựa trên kết quả độ chính xác và điểm F1, theo kinh nghiệm các phương pháp SDP và Moment xác định các giải pháp tổng quát hóa tốt hơn so với những giải pháp thu được bằng cách chạy gradient descent đơn thuần. Chúng tôi cung cấp phân tích chi tiết hơn về ảnh hưởng của các siêu tham số trong Phụ lục E.2 và thời gian chạy trong Bảng 4. Ranh giới quyết định cho Gaussian 1 được hiển thị trong Hình 5.

\ Hình 3: Ba Gaussian Tổng Hợp (hàng trên) và Ba Nhúng Cây (hàng dưới). Tất cả các đặc điểm đều ở H2 nhưng được trực quan hóa thông qua phép chiếu stereographic trên B2. Các màu khác nhau đại diện cho các lớp khác nhau. Đối với bộ dữ liệu cây, các kết nối đồ thị cũng được trực quan hóa nhưng không được sử dụng trong đào tạo. Các nhúng cây được chọn đến trực tiếp từ Mishne et al. [6].

\ Nhúng Cây Tổng Hợp. Vì không gian hyperbolic phù hợp để nhúng cây, chúng tôi tạo các đồ thị cây ngẫu nhiên và nhúng chúng vào H2 theo Mishne et al. [6]. Cụ thể, chúng tôi gán nhãn các nút là dương nếu chúng là con của một nút được chỉ định và âm nếu không. Sau đó, các mô hình của chúng tôi được đánh giá để phân loại cây con, nhằm xác định ranh giới bao gồm tất cả các nút con trong cùng một cây con. Nhiệm vụ như vậy có nhiều ứng dụng thực tế. Ví dụ, nếu cây đại diện cho một tập hợp các token, ranh giới quyết định có thể làm nổi bật các vùng ngữ nghĩa trong không gian hyperbolic tương ứng với các cây con của đồ thị dữ liệu. Chúng tôi nhấn mạnh rằng một đặc điểm phổ biến trong nhiệm vụ phân loại cây con như vậy là sự mất cân bằng dữ liệu, thường dẫn đến khả năng tổng quát hóa kém. Do đó, chúng tôi nhằm sử dụng nhiệm vụ này để đánh giá hiệu suất của các phương pháp trong điều kiện thách thức này. Ba nhúng được chọn và trực quan hóa trong Hình 3 và hiệu suất được tóm tắt trong Bảng 1. Thời gian chạy của các cây được chọn có thể được tìm thấy trong Bảng 4. Ranh giới quyết định của cây 2 được trực quan hóa trong Hình 6.

\ Tương tự như kết quả của các bộ dữ liệu Gaussian tổng hợp, chúng tôi quan sát thấy hiệu suất tốt hơn từ SDP và Moment so với PGD, và do sự mất cân bằng dữ liệu mà các phương pháp GD thường gặp khó khăn, chúng tôi có sự gia tăng lớn hơn về điểm F1 có trọng số trong trường hợp này. Ngoài ra, chúng tôi quan sát thấy khoảng cách tối ưu lớn cho SDP nhưng khoảng cách rất chặt chẽ cho Moment, chứng nhận tính tối ưu của Moment ngay cả khi sự mất cân bằng lớp nghiêm trọng.

\ Bảng 1: Hiệu suất trên bộ dữ liệu Gaussian tổng hợp và cây cho 𝐶 = 10.0: độ chính xác kiểm tra 5 lần và điểm F1 có trọng số cộng và trừ 1 độ lệch chuẩn, và khoảng cách tối ưu tương đối trung bình 𝜂 cho SDP và Moment.

\

:::info Tác Giả:

(1) Sheng Yang, John A. Paulson School of Engineering and Applied Sciences, Harvard University, Cambridge, MA ([email protected]);

(2) Peihan Liu, John A. Paulson School of Engineering and Applied Sciences, Harvard University, Cambridge, MA ([email protected]);

(3) Cengiz Pehlevan, John A. Paulson School of Engineering and Applied Sciences, Harvard University, Cambridge, MA, Center for Brain Science, Harvard University, Cambridge, MA, và Kempner Institute for the Study of Natural and Artificial Intelligence, Harvard University, Cambridge, MA ([email protected]).

:::


:::info Bài báo này có sẵn trên arxiv theo giấy phép CC by-SA 4.0 Deed (Attribution-Sharealike 4.0 International).

:::

\

Cơ hội thị trường
Logo Treehouse
Giá Treehouse(TREE)
$0.06627
$0.06627$0.06627
-2.14%
USD
Biểu đồ giá Treehouse (TREE) theo thời gian thực
Tuyên bố miễn trừ trách nhiệm: Các bài viết được đăng lại trên trang này được lấy từ các nền tảng công khai và chỉ nhằm mục đích tham khảo. Các bài viết này không nhất thiết phản ánh quan điểm của MEXC. Mọi quyền sở hữu thuộc về tác giả gốc. Nếu bạn cho rằng bất kỳ nội dung nào vi phạm quyền của bên thứ ba, vui lòng liên hệ [email protected] để được gỡ bỏ. MEXC không đảm bảo về tính chính xác, đầy đủ hoặc kịp thời của các nội dung và không chịu trách nhiệm cho các hành động được thực hiện dựa trên thông tin cung cấp. Nội dung này không cấu thành lời khuyên tài chính, pháp lý hoặc chuyên môn khác, và cũng không được xem là khuyến nghị hoặc xác nhận từ MEXC.