XÂY DỰNG MÔ HÌNH PHÂN LỚP BÌNH LUẬN VỀ NHÀ HÀNG DỰA VÀO PHƯƠNG PHÁP HỌC MÁY

Abstract

Machine learning has been recognized as an efficient classification method, in which the effectiveness of the classification significantly depends on the characteristics of the object extracted from the dataset. With the current explosion of data in general, and especially comment data on online review websites in particular, classification faces numerous challenges. However, accurate classification will have significant implications for consulting activities. This study aimed to build a classification model based on machine learning for restaurant comments data. Data is collected from online review websites such as Tripadvisor.com.vn and Foody.vn. A technique for preprocessing comments to enhance semantic understanding is also proposed. Experiments were conducted using four machine learning algorithms: Naive Bayes (NB), Support Vector Machines (SVM), Decision Tree (DT), and K-Nearest Neighbor (KNN). The results demonstrate that SVM achieves the best classification outcome in comparison to NB, DT, and KNN.Học máy được biết đến là phương pháp phân lớp hiệu quả, trong đó hiệu quả của việc phân lớp khá phụ thuộc vào các đặc tính của đối tượng được trích chọn từ bộ dữ liệu. Với thực tế bùng nổ dữ liệu như hiện nay, đặc biệt là dữ liệu bình luận trên các website đánh giá trực tuyến, việc phân lớp gặp phải không ít thách thức. Tuy nhiên, việc phân lớp chính xác sẽ mang lại những ý nghĩa to lớn cho hoạt động tư vấn. Bài báo này nghiên cứu và xây dựng một mô hình phân lớp dựa trên học máy đối với dữ liệu là các bình luận về nhà hàng. Dữ liệu được thu thập từ các website đánh giá trực tuyến như Tripadvisor.com.vn và Foody.vn. Một kỹ thuật tiền xử lý các câu bình luận nhằm tăng ngữ nghĩa cũng được đề xuất. Thực nghiệm sử dụng 4 thuật toán học máy: Naive Bayes (NB), Support Vector Machines (SVM), Decision Tree (DT) và K-Nearest Neighbor (KNN). Kết quả cho thấy SVM cho kết quả phân lớp tốt nhất khi so sánh với NB, DT và KNN

    Similar works