8 research outputs found

    Ứng dụng kỹ thuật theo dõi đối tượng cho bài toán nhận dạng hành vi của khách hàng trong siêu thị

    Get PDF
    Chúng tôi trình bày mô hình sử dụng các kỹ thuật theo dõi đối tượng để phân loại hoạt động của khách hàng trong siêu thị; từ đó xác định số lượng khách hàng quan tâm đến gian hàng và đánh giá hiệu quả trưng bày. Với hình ảnh thu được từ camera giám sát, hệ thống có thể nhận dạng được hầu hết các đối tượng là người đi vào vùng quan sát, theo dõi họ để có được quỹ đạo đường đi và thời gian lưu lại vùng quan sát. Quỹ đạo được phân đoạn và lấy tọa độ đại diện, sau đó dùng giải thuật máy học véc-tơ hỗ trợ để phân loại hoạt động của khách hàng gồm có quan tâm đến gian hàng và ghé vào lựa chọn hoặc là các hoạt động còn lại. Ngoài ra, trong bài báo, chúng tôi đề xuất các cải tiến nhằm cải thiện tốc độ của giải thuật theo dõi đối tượng trong trường hợp theo dõi nhiều đối tượng cùng lúc. Qua thực nghiệm, chúng tôi nhận thấy các đề xuất cải thiện tốc độ có hiệu quả đáng kể, trung bình tăng 2,8 lần so với ban đầu, trong khi độ chính xác không thay đổi. Dữ liệu nhận dạng người và nhận dạng hoạt động của khách hàng ở siêu thị được thu thập từ nguồn internet và dữ liệu thu được của camera giám sát đặt tại một siêu thị lớn ở tỉnh Sóc Trăng

    PHÂN LOẠI VĂN BẢN VỚI MÁY HỌC VECTOR HỖ TRỢ VÀ CÂY QUYẾT ĐỊNH

    Get PDF
    Bài toán phân loại văn bản, thực chất, có thể xem là bài toán phân lớp. Phân loại văn bản tự động là việc gán các nhãn phân loại lên một văn bản mới dựa trên mức độ tương tự của văn bản đó so với các văn bản đã được gán nhãn trong tập huấn luyện. Nhiều kỹ thuật máy học và khai phá dữ liệu đã được áp dụng vào bài toán phân loại văn bản, chẳng hạn: phương pháp quyết định dựa vào Bayes ngây thơ (Naive Bayes), cây quyết định (decision tree), k?láng giềng gần nhất (KNN), mạng nơron (neural network),? Máy học vectơ hỗ trợ (SVM) là một giải thuật phân lớp có hiệu quả cao và đã được áp dụng nhiều trong lĩnh vực khai phá dữ liệu và nhận dạng. Tuy nhiên SVM chưa được áp dụng một cách có hiệu quả vào phân loại văn bản vì đặc điểm của bài toán phân loại văn bản là không gian đặc trưng thường rất lớn. Bài viết này nghiên cứu máy học vector hỗ trợ (SVM), áp dụng nó vào bài toán phân loại văn bản và so sánh hiệu quả của nó với hiệu quả của giải thuật phân lớp cổ điển, rất phổ biến đó là cây quyết định. Nghiên cứu chỉ ra rằng SVM với cách lựa chọn đặc trưng bằng phương pháp tách giá trị đơn (SVD) cho kết quả tốt hơn so với cây quyết định

    Xây dựng trò chơi tic-tac-toe với người đấu với máy trong phiên bản thực tế tăng cường

    No full text
    Thực tế tăng cường (Augmented Reality - AR) là một công nghệ kết hợp giữa thông tin kỹ thuật số và thế giới thực trong thời gian thực, dữ liệu đầu vào được ghi nhận thông qua camera của các thiết bị như điện thoại, laptop,… Các thông tin được tăng cường thường là đối tượng 3D, video, âm thanh,… Trong bài báo này, chúng tôi trình bày về việc xây dựng một chương trình chơi trò chơi tic-tac-toe với người đấu với máy ứng dụng công nghệ thực tế tăng cường. Sử dụng kỹ thuật xử lý ảnh và phép biến đổi Hough để phát hiện 4 đường của bàn cờ, từ đó trích xuất ra được 9 ô cờ. Đó sẽ là cơ sở để chúng tôi có thể phát hiện được dấu ‘X’ mà người chơi đi, chúng tôi sử dụng mô hình phân lớp phân tầng với mỗi tầng là bộ phân lớp AdaBoost, qua thực nghiệm, kết quả nhận dạng chính xác đạt hơn 98%. Để ra nước đi của máy một cách “thông minh”, chúng tôi áp dụng giải thuật cắt tỉa Alpha-Beta

    Nghiên cứu ứng dụng kỹ thuật theo dõi đối tượng xây dựng hệ thống camera giám sát thông minh

    No full text
    Bài báo trình bày các kết quả nghiên cứu về việc xây dựng hệ thống camera giám sát thông minh sử dụng kỹ thuật theo dõi đối tượng. Phần cốt lõi của hệ thống là bộ theo dõi đối tượng, hoạt động dựa trên trên việc kết hợp giữa (i) truy vết đối tượng bằng luồng quang học, (ii) so khớp các đặc trưng cục bộ và (iii) tìm sự đồng thuận lớn nhất của các đặc trưng cục bộ. Cũng trong bài báo này, một thuật giải thuật mới đã được đề xuất nhằm tăng tốc độ xử lý các khung ảnh bằng kỹ thuật ống dẫn (pipeline) trên các hệ thống máy tính đa nhân. Giải thuật này chia quá trình xử lý thành 4 giai đoạn liên tiếp, phụ thuộc nhau và giao cho 4 tiến trình xử lý chúng một cách độc lập. Việc đồng bộ giữa các tiến trình được thực hiện bằng mô hình sản xuất – tiêu thụ (producer – consumer). Điều này giúp tăng tốc độ xử lý lên đến 3,3 lần trên hệ thống máy tính 4 nhân. Hệ thống camera giám sát thông minh sẽ theo dõi đối tượng liên tục và phát tín hiệu cảnh báo khi đối tượng cần theo dõi biến mất trong một khoảng thời gian được định trước. Kết quả thực nghiệm cho thấy rằng các giải pháp đề xuất là hoàn toàn phù hợp

    PHÂN LOẠI DẤU VÂN TAY VỚI RỪNG NGẪU NHIÊN XIÊN PHÂN VÀ PHƯƠNG PHÁP BIỂU DIỄN ĐẶC TRƯNG KHÔNG ĐỔI

    Get PDF
    Nghiên cứu trình bày một phương pháp phân loại ảnh vân tay mới và đáng tin cậy dựa trên sự kết hợp giữa phương pháp biểu diễn ảnh bằng các nét đặc trưng không đổi (SIFT) và rừng ngẫu nhiên xiên phân (RF-ODT). Sự kết hợp này được giải thích theo hai lý do. Các véctơ mô tả SIFT không bị thay đổi trước những biến đổi tỉ lệ, tịnh tiến, phép quay, không bị thay đổi một phần đối với phép biến đổi hình học affine (thay đổi góc nhìn) và mạnh với những thay đổi về độ sáng, sự che khuất hay nhiễu. Sau bước tiền xử lý, ảnh được biểu diễn bởi một véctơ có số chiều rất lớn, do đó chúng tôi đề nghị mở rộng và sử dụng rừng ngẫu nhiên xiên phân - được biết đến như một trong những lựa chọn tốt để học và phân loại dữ liệu có số chiều lớn. Để đánh giá hiệu quả, chúng tôi sử dụng thiết bị đọc dấu vân tay để thu thập 480 ảnh vân tay từ 15 đồng nghiệp ở trường Đại học Cần Thơ. Sau khi tiến hành tiền xử lý dựa trên cơ sở véctơ mô tả SIFT, giải thuật rừng ngẫu nhiên xiên phân của chúng tôi đã phân loại chính xác đến 99.79% (chỉ nhầm lẫn duy nhất 1 ảnh, với nghi thức kiểm tra chéo). Kết quả này cho thấy hệ thống rất đáng tin cậy. Hơn nữa, giải thuật mở rộng của rừng ngẫu nhiên xiên phân như đã đề nghị cho kết quả phân lớp ảnh vân tay chính xác hơn một số giải thuật học khác

    Hiệu quả các nhóm mô hình học sâu trong bài toán phát hiện phương tiện giao thông

    Get PDF
    Các mô hình phát hiện đối tượng dựa trên mạng nơ-ron tích chập đang phát triển liên tục và được áp dụng rộng rãi trong nhiều lĩnh vực, đặc biệt là trong hệ thống giao thông thông minh. Trong nghiên cứu này, các kỹ thuật học sâu đã được áp dụng, đặc biệt là các mô hình phát hiện phương tiện giao thông trong thời gian thực: dựa trên “anchor” (điển hình như mô hình You Only Look Once - YOLO), dựa trên “keypoint”(điển hình như mô hình CenterNet), và dựa trên “transformer”(điển hình như mô hình Detection Transformers - DETR). Các mô hình đã được tinh chỉnh và huấn luyện thông qua kỹ thuật học chuyển tiếp để cải thiện khả năng phát hiện phương tiện giao thông. Kết quả của các thử nghiệm đã chỉ ra rằng mô hình YOLO đạt được độ chính xác cao nhất (98,3%) với thời gian thực thi là 11,7 ms. Trong khi đó, mô hình DETR thực hiện thời gian thực thi nhanh nhất (2,3 ms), nhưng độ chính xác thấp nhất (62,4%). Mô hình CenterNet là lựa chọn tốt nhất (94,11% - 8 ms) vì cân đối được giữa độ chính xác và thời gian thực thi, có thể được sử dụng trong các ứng dụng thời gian thực
    corecore