DKN[1] ( Deep Knowledge-Aware Network là một mô hình học sâu kết hợp thông tin từ biểu đồ tri thức để đề xuất tin tức. Cụ thể, DKN sử dụng phương pháp TransX[2] để học biểu diễn đồ thị tri thức, sau đó áp dụng mô hình CNN, đặt tên là KCNN, để kết hợp các thực thể từ và xinh vector cuối cùng cho một tin tức mới.
Các đặc trực của DKN
– DKN la fmootj mô hình học sau dựa trên nội dung cho CTR dự đoán thay vì phương pháp lọc dựa trên ID truyền thống – Nó sử dụng các thực thể tri thức chung trong nôi dung tin tức thông qua việc học từ semantic-level và knowlege-level của các bài báo tin tức – DKN sử dụng module attention để tính toán các xác nhận lịch sử tổng hợp của người dùngThực thi hệ thống khuyến nghị với MIND data
MIND dataset[3] là một tập dữ liệu tin tức tiếng Anh quy mô lớn. Nó được thu thập từ nhật ký hành vi ẩn danh của trang web Microsoft News. MIND chưa 1.000.000 người dùng, 161.013 tin bài và 15.777.377 nhật ký hiển thị. Mọi tin bày đều chưa nội dung phong phú bao gồm, tiêu đề, tốm tắt, nội dung, danh mục và các thực thể. Mỗi bản ghi hiện thị chức các sự kiện nhấp chuột, sự kiên không được nhấp chuột và hanh vi nhấp chuột tin tức lịch sử của người dùng này trước lần hiển thị này.Notebook training hệ thống khuyến nghị sử dụng tập dự liệu MIND
Đầu vào của model DKN gồm các file sau: – Dữ liệu được chia thành training/validation và testing files. – các file dữ liệu lịch sử của người dùng – tài liệu đặc tả feature – word embedding/entity embedding/ context embedding filesCài đặt và import thư viện:
Khi chạy các bạn có thể bị thiếu một số thư viện, bạn có thể dùng lệnh Pip để cài đặt nhanh như sau:
Tương tự với recommenders :
Tải và load dữ liệu
Khởi tạo các parameters, cũng giống như các mô hình khác các bên có thể tùy chỉnh các tham số như epoch, batch_size….
Traing model KKN
Đánh giá DKN model
Như đã làm ở phần xử lý data, chúng ta có chia dữ liệu thành data train/validation/test. Bây giờ bạn sẽ kiểm tra kết quả trên test set
Tài liệu tham khảo:
[1] Wang, Hongwei, et al. “DKN: Deep Knowledge-Aware Network for News Recommendation.” Proceedings of the 2018 World Wide Web Conference on World Wide Web. International World Wide Web Conferences Steering Committee, 2018.
[2] Knowledge Graph Embeddings including TransE, TransH, TransR and PTransE. https://github.com/thunlp/KB2E
[3] Wu, Fangzhao, et al. “MIND: A Large-scale Dataset for News Recommendation” Proceedings of the 58th Annual Meeting of the Association for Computational Linguistics. https://msnews.github.io/competition.html
[4] GloVe: Global Vectors for Word Representation. https://nlp.stanford.edu/projects/glove/
admin ơi dịch thêm bài đi ạ, mình đang muốn tìm hiểu thêm về các bài toán này