1. Trang chủ
  2. » Giáo Dục - Đào Tạo

BÁO CÁO BÀI TẬP LỚN HỌC PHẦN XỬ LÝ NGÔN NGỮ TỰ NHIÊN NGHIÊN CỨU VỀ KỸ THUẬT PHÂN TÍCH TÌNH CẢM CỦA DỮ LIỆU TWITTER

34 15 0

Đang tải... (xem toàn văn)

Tài liệu hạn chế xem trước, để xem đầy đủ mời bạn chọn Tải xuống

THÔNG TIN TÀI LIỆU

Thông tin cơ bản

Định dạng
Số trang 34
Dung lượng 550,54 KB

Cấu trúc

  • I. GIỚI THIỆU

  • II. ĐỊNH NGHĨA VÀ ĐỘNG LỰC

  • III. TẦM QUAN TRỌNG VÀ BỐI CẢNH

  • IV. KỸ THUẬT PHÂN LOẠI

  • V. DOCUMENT-LEVEL SENTIMENT ANALYSIS APPROACHES

  • VI. CÁCH TIẾP CẬN PHÂN TÍCH NHẬN THỨC CẤP ĐỘ CÂU

  • VII. THẢO LUẬN VÀ KẾT QUẢ

  • VIII. KẾT LUẬN

  • REFERENCES

Nội dung

GIỚI THIỆU

Phân tích cảm xúc, hay còn gọi là khai thác ý kiến hoặc trí tuệ nhân tạo cảm xúc, sử dụng công nghệ xử lý ngôn ngữ tự nhiên (NLP), khai thác văn bản và ngôn ngữ học tính toán để nhận diện và đánh giá các trạng thái cảm xúc cùng thông tin chủ quan một cách có hệ thống Phương pháp này thường tập trung vào giọng điệu trong các tài liệu của khách hàng, chẳng hạn như khảo sát, đánh giá trực tuyến và các nội dung trên mạng xã hội.

Phân tích tình cảm là quá trình xác định quan điểm của diễn giả hoặc người viết thông qua phản hồi cảm xúc đối với một chủ đề nhất định Bố cục có thể là nhận định đầy cảm xúc hoặc mong đợi phản hồi từ người tiêu dùng Trên internet hiện nay có nhiều cuộc khảo sát và đề xuất khách hàng về các chủ đề khác nhau, khiến người tiêu dùng gặp khó khăn trong việc lựa chọn do số lượng lớn thông tin Khai thác thông tin từ các đánh giá và phân loại chúng là nhiệm vụ quan trọng, sử dụng các phương pháp tiếp cận NLP và trích xuất thông tin để phân tích ý kiến từ nhiều tác giả Quá trình này bao gồm nhiều chiến lược, như tính toán và truy xuất thông tin, với mục tiêu phát hiện tính phân cực của tài liệu văn bản, phân loại thành các loại “tích cực”, “tiêu cực” hoặc “công bằng” Khai thác cảm xúc có thể được thực hiện ở ba cấp độ khác nhau.

 Phân loại tình cảm ở cấp độ tài liệu: Ở cấp độ này, tài liệu có thể được phân loại là "tích cực", Tiêu cực" hoặc "trung lập".

 Phân loại tình cảm ở cấp độ câu: Ở cấp độ này, mỗi câu được phân loại là

“tích cực”, “tiêu cực” hoặc không thiên vị.

Tình cảm có thể được phân loại theo các khía cạnh và đặc điểm, trong đó các câu hoặc tài liệu được phân loại thành ba nhóm chính: “tích cực”, “tiêu cực” và “không thiên vị” Phân loại này dựa trên các khía cạnh cụ thể của nội dung và thường được gọi là “nhóm đánh giá cấp độ quan điểm”.

Bài báo này nghiên cứu các phương pháp phân tích tình cảm trên dữ liệu Twitter và so sánh lý thuyết các phương pháp hiện đại Nội dung được chia thành hai phần chính: phần đầu tiên giải thích các định nghĩa, động lực và kỹ thuật phân loại trong phân tích tình cảm, trong khi phần thứ hai trình bày các phương pháp phân tích ở cấp độ tài liệu và câu Các phương pháp phân tích tình cảm cho Twitter bao gồm tiếp cận có giám sát, không giám sát, từ vựng và kết hợp Cuối cùng, bài viết nêu bật các cuộc thảo luận và so sánh giữa các phương pháp này.

ĐỊNH NGHĨA VÀ ĐỘNG LỰC

Phân tích tình cảm là một chiến lược quan trọng giúp đánh giá ý kiến của cá nhân hoặc nhóm, như người theo dõi thương hiệu hoặc khách hàng trong các cuộc trò chuyện với đại diện hỗ trợ Phương pháp này theo dõi các cuộc thảo luận để đánh giá tâm trạng và cảm xúc, đặc biệt là những cảm xúc liên quan đến doanh nghiệp, sản phẩm hoặc dịch vụ.

Phân tích cảm xúc là công cụ đánh giá ngôn ngữ để xác định tính tích cực, tiêu cực hoặc trung tính trong lời nói và viết Các công cụ hiện nay có khả năng xử lý lượng lớn phản hồi của khách hàng một cách chính xác Phân tích tình cảm không chỉ khám phá ý kiến về sản phẩm và dịch vụ mà còn về các chương trình khuyến mãi Nội dung do khách hàng tạo ra trên mạng xã hội, bao gồm khảo sát, bình luận và ghi âm, cung cấp cái nhìn sâu sắc về quan điểm của họ Những thông tin này giúp dự đoán xu hướng kinh doanh và xã hội, như chào hàng sản phẩm và kết quả chính trị, qua việc đánh giá quan điểm trong các cuộc trao đổi nội dung.

Khảo sát quan điểm là một lĩnh vực nghiên cứu năng động nhằm nâng cao hiểu biết về cảm xúc trong nội dung máy tính, đồng thời thúc đẩy việc sử dụng dữ liệu suy luận mạnh mẽ hơn Trong số các nền tảng mạng xã hội, Twitter nổi bật với lượng người dùng lớn và sự gia tăng nhanh chóng về khối lượng thông tin.

Twitter là một nền tảng mạng xã hội cho phép người dùng tạo và chia sẻ các 'tweet' với người theo dõi hoặc khách hàng khác Đến năm 2016, Twitter đã thu hút hơn 313 triệu người dùng hoạt động hàng tháng.

Twitter hiện có 100 triệu khách hàng hàng ngày, với 77% trong số họ nằm ngoài Hoa Kỳ, tạo ra hơn 500 triệu tweet mỗi ngày Vào năm 2017, Twitter đứng thứ mười hai toàn cầu về hoạt động và xử lý hơn 15 tỷ lệnh gọi API hàng ngày Nội dung của Twitter cũng được xuất hiện trên hơn một triệu trang web bên ngoài Sự phát triển mạnh mẽ này đã khiến Twitter trở thành chủ đề thu hút nhiều sự quan tâm, vì các tweet thường phản ánh cảm xúc của khách hàng về các vấn đề gây tranh cãi Trong bối cảnh truyền thông xã hội, phân tích tình cảm và khai thác ý kiến là những nhiệm vụ đầy thách thức do lượng thông tin khổng lồ được tạo ra.

TẦM QUAN TRỌNG VÀ BỐI CẢNH

Quan điểm đóng vai trò quan trọng trong hành động của con người, ảnh hưởng đến thực tiễn xã hội Các tổ chức cần tìm hiểu cảm xúc của người tiêu dùng về sản phẩm và dịch vụ của họ thông qua các nền tảng trực tuyến như Facebook và Twitter Những nền tảng này tạo cơ hội cho người tiêu dùng chia sẻ trải nghiệm và ý kiến, từ đó hình thành những cộng đồng ảo nơi họ có thể tác động lẫn nhau Các cá nhân thường viết blog, để lại nhận xét hoặc ghi lại suy nghĩ về nhiều chủ đề khác nhau, cung cấp cho nhà quảng cáo thông tin quý giá về hành vi và tâm lý của khách hàng Tuy nhiên, việc quản lý và phân tích nội dung do người dùng tạo ra trên mạng xã hội gặp nhiều thách thức do thông tin phân tán Điều tra ý kiến là một phương pháp hữu hiệu giúp khai thác thông tin từ web một cách có hệ thống, giúp nhà quảng cáo hiểu rõ hơn về cảm xúc và trạng thái tâm trí của người tiêu dùng, từ đó nâng cao hiệu quả nghiên cứu.

Phân tích cảm xúc giúp các tổ chức hiểu rõ mức độ yêu thích và không yêu thích của khách hàng đối với sản phẩm và hình ảnh công ty Đồng thời, nó cũng đóng vai trò quan trọng trong việc phân tích dữ liệu của các ngành và tổ chức, hỗ trợ họ trong việc đưa ra các quyết định kinh doanh hiệu quả.

KỸ THUẬT PHÂN LOẠI

Trong lĩnh vực học máy, các phương pháp phân loại như Naive Bayes, Maximum Entropy và Support Vector Machine đã được phát triển để phân loại dữ liệu không được gắn nhãn, và chúng được phân loại là phương pháp học máy có giám sát vì yêu cầu dữ liệu đào tạo Việc đào tạo một bộ phân loại hiệu quả rất quan trọng, vì nó sẽ cải thiện độ chính xác của các dự đoán trong tương lai.

Naive Bayes là một phương pháp phân loại dựa trên Định lý Bayes, với giả định rằng các đặc trưng là độc lập Bộ phân loại này đánh giá rằng sự gần gũi của một đối tượng trong một lớp không bị ảnh hưởng bởi các đặc điểm khác Ví dụ, một quả táo có thể được nhận diện dựa trên màu sắc đỏ, hình tròn và kích thước khoảng 3 inch, bất chấp sự phụ thuộc giữa các đặc điểm Naive Bayes thường hoạt động hiệu quả hơn so với các chiến lược phân loại khác Giả thuyết Bayes cho phép tính toán khả năng xảy ra của các sự kiện thông qua các xác suất liên quan, như P(a | b), P(a), P(b) và P(b | a).

Xác suất p(a|b) đại diện cho xác suất của sự kiện a khi đã biết sự kiện b xảy ra, trong khi p(b|a) là xác suất của sự kiện b khi có sự kiện a Xác suất của lớp a được ký hiệu là p(a) và xác suất của lớp b được ký hiệu là p(b).

Naive Bayes là một thuật toán phổ biến trong việc phân loại văn bản đa lớp và đã được áp dụng hiệu quả trong phân tích tình cảm.

Bộ phân loại Maximum Entropy (MaxEnt) ước tính phân phối có điều kiện của một lớp dựa trên một bản ghi đã cho bằng cách sử dụng hàm mũ với trọng số cho các ràng buộc Mô hình này thuộc họ tham số pMaxEnt(a, b) nhằm tối đa hóa khả năng xảy ra Để giải quyết vấn đề tối ưu hóa, các phương pháp như chia tỷ lệ lặp lại và tối ưu hóa gần như Newton thường được áp dụng.

Trong đó a là lớp, b là dự đoán Trọng lượng của vectơ được biểu thị là αi.

Máy vectơ hỗ trợ (SVM) được biết là hoạt động tốt trong phân tích tình cảm

SVM (Support Vector Machine) điều tra thông tin và xác định các giới hạn lựa chọn giữa các lớp dữ liệu trong không gian đầu vào Mỗi dữ liệu được biểu diễn dưới dạng véc tơ và được sắp xếp thành các lớp khác nhau Máy tính xác định ranh giới phân chia giữa hai lớp dựa trên các mẫu huấn luyện Nghiên cứu đã chỉ ra rằng SVM hoạt động hiệu quả hơn so với trình phân loại Nạve Bayes trong các vấn đề phân loại văn bản.

DOCUMENT-LEVEL SENTIMENT ANALYSIS APPROACHES

Sharma và cộng sự đã đề xuất một hệ thống phân tích tình cảm không giám sát, có khả năng xác định hướng tình cảm của các tài liệu văn bản dựa trên tính phân cực Hệ thống này phân loại các tài liệu thành hai loại: tích cực và tiêu cực.

Hệ thống khai thác ý kiến dựa trên tài liệu sử dụng chiến lược từ điển không giám sát để phân loại các từ tình cảm theo các cực tích cực, tiêu cực và trung lập Mạng từ được áp dụng để xác định từ vựng quan điểm, từ tương đương và từ trái nghĩa Nghiên cứu này tập trung vào việc phân tích các bài phê bình phim, từ đó phát hiện tình cảm phân cực của tài liệu Hệ thống đã phân loại tài liệu thành các kết quả tổng hợp, cung cấp thông tin hữu ích cho những người ra quyết định Nhờ vào việc xác định phần lớn từ vựng quan điểm, hệ thống có khả năng phân cực tình cảm của bất kỳ tài liệu nào.

Chunxu Wu [21] đã phát triển một phương pháp tổng hợp các định hướng ngữ nghĩa của ý kiến phụ thuộc vào ngữ cảnh thông qua Mạng từ Phương pháp này giúp xác định tình cảm của các quan điểm bằng cách sử dụng các biện pháp gần gũi về ngữ nghĩa, đặc biệt khi thông tin liên quan không đầy đủ Các thí nghiệm của Chunxu Wu [21] đã chứng minh rằng quy trình này rất hiệu quả trong việc xác định hướng đánh giá.

Taboada và cộng sự đã phát triển một kỹ thuật dựa trên từ vựng để phát hiện và phân loại tài liệu theo cảm xúc Kỹ thuật này sử dụng từ điển từ tích cực và tiêu cực để đảm bảo tính chính xác Họ cũng giới thiệu máy tính định hướng ngữ nghĩa (SO-CAL), áp dụng các bộ tăng cường và phủ định Phương pháp SO-CAL đạt được độ chính xác 76,37% khi áp dụng trên bộ dữ liệu đánh giá phim.

Harb và cộng sự đã đề xuất một phương pháp chiết xuất tình cảm ở cấp độ tài liệu qua ba giai đoạn Giai đoạn đầu tiên thu thập dữ liệu từ các tài liệu chứa ý kiến tự động trích xuất từ Internet Tiếp theo, các bộ tính từ tích cực và tiêu cực được xây dựng từ bộ dữ liệu này Cuối cùng, các tài liệu mới được phân loại dựa trên danh sách tính từ đã thu thập Nhiều thử nghiệm trên dữ liệu thực đã cho thấy phương pháp của Harb et al đạt điểm F1 0,717 cho tài liệu tích cực và 0,622 cho tài liệu tiêu cực.

Zagibalov và cộng sự đã nghiên cứu phân loại tình cảm trong các bài đánh giá sản phẩm viết bằng tiếng Trung Quốc, sử dụng phương pháp phân loại không giám sát tự dạy với hạt giống từ vựng Bắt đầu với từ "tốt" được gán nhãn tích cực, họ đã đào tạo lại các hạt giống này qua nhiều vòng lặp để phân loại cảm xúc Tiêu chí mật độ ý kiến được áp dụng để tính toán tỷ lệ cảm xúc cho từng tài liệu Kết quả thử nghiệm cho thấy trình phân loại đạt được 87% độ chính xác trong việc phát hiện phân cực cảm xúc sau 20 lần lặp lại.

Tripathy và cộng sự đã phân loại các bài đánh giá theo cực bằng cách sử dụng các thuật toán học máy có giám sát như Naive Bayes, SVM, random forest và phân tích phân biệt tuyến tính Quy trình bao gồm bốn bước: trước tiên là tiền xử lý để loại bỏ stop words, số và ký tự đặc biệt; sau đó, chuyển đổi các đánh giá văn bản thành ma trận số; tiếp theo, sử dụng các vectơ tạo ra làm đầu vào cho bốn bộ phân loại khác nhau Kết quả được phân loại từ hai bộ dữ liệu, và các chỉ số như độ chính xác, độ thu hồi, độ đo F và độ chính xác phân loại được tính toán để đánh giá hiệu suất Trong trường hợp bộ dữ liệu phân cực và IMDb, bộ phân loại random forest cho kết quả tốt hơn so với các bộ phân loại khác.

Saleh và cộng sự đã áp dụng SVM cho ba bộ dữ liệu khác nhau để phân loại các đánh giá tài liệu, sử dụng các chương trình n-gram để đánh giá hiệu quả của SVM Họ đã áp dụng ba phương pháp trọng số để tạo ra vectơ đặc trưng: TFIDF, Lần xuất hiện nhị phân (BO) và Lần xuất hiện kỳ hạn (TO) Nhiều thí nghiệm đã được thực hiện để đánh giá sự kết hợp của các phương pháp này Kết quả cho thấy, với tập dữ liệu Taboada, độ chính xác tốt nhất đạt được khi kết hợp SVM với TFIDF và trigram Đối với kho dữ liệu Pang, kết quả tối ưu là khi sử dụng BO và trigram Trong khi đó, với kho tài liệu SINAI, SVM đạt được điểm chính xác cao nhất khi kết hợp với TFIDF và bigram.

CÁCH TIẾP CẬN PHÂN TÍCH NHẬN THỨC CẤP ĐỘ CÂU

Phân tích này tập trung vào việc phân loại câu thành ba loại: tích cực, tiêu cực và trung tính Phân tích tình cảm trên Twitter là một ví dụ điển hình về phân tích tình cảm ở cấp độ câu Bài viết tiếp theo sẽ khám phá các phương pháp phân tích tình cảm trên Twitter, trong đó các phương pháp học máy được sử dụng để phân loại văn bản thành nhiều loại khác nhau Hai loại chiến lược học máy chính là học có giám sát (supervised learning) và phương pháp tổ hợp (ensemble).

Có bốn phương pháp phân tích tình cảm cơ bản trên Twitter: phương pháp máy học có giám sát, phương pháp tổng hợp, phương pháp dựa trên từ vựng và phương pháp kết hợp Mỗi phương pháp này mang lại những cách tiếp cận khác nhau để hiểu và phân tích cảm xúc của người dùng trên nền tảng mạng xã hội này.

A Phân tích cảm xúc trên Twitter bằng cách sử dụng phương pháp học máy có giám sát

Hiệu quả của các mô hình học máy trong phân tích cảm xúc trên Twitter phụ thuộc vào các tập dữ liệu được gắn nhãn sử dụng trong quá trình đào tạo Để đạt được kết quả đầu ra mong muốn, cần có hai bộ dữ liệu: bộ đào tạo và bộ kiểm tra Các phương pháp máy học như bộ phân loại có thể được áp dụng để phát hiện cảm xúc, với hiệu suất chủ yếu dựa vào số lượng dữ liệu đào tạo và các đặc trưng trích xuất Chiến lược phân tích tình cảm trên Twitter thường sử dụng các bộ phân loại phổ biến như SVM và NB Quy trình của các phương pháp tiếp cận học máy có giám sát trong phân tích cảm xúc trên Twitter được minh họa trong Hình 2.

Quy trình phân tích tình cảm trên Twitter bao gồm ba bước chính Đầu tiên, một bộ phân loại được đào tạo từ tập dữ liệu chứa các tweet có cảm xúc tích cực, tiêu cực và trung tính Dưới đây là ví dụ về các tweet minh họa cho từng loại cảm xúc.

 Các tweet sau đây là ví dụ về các tweet tích cực:

Thủ tướng Narendra Modi và Tổng thống Ghana, Nana Akufo-Addo đã có một cuộc gặp gỡ quan trọng, trong đó họ thảo luận về các vấn đề năng lượng, biến đổi khí hậu và quan hệ thương mại giữa hai quốc gia.

2) Billy D Williams @Msdebramaye For the children, they mark, and the children, they know The place where the sidewalk ends.

3) @abdullah “Hãy duy trì tất cả những điều tích cực trong đầu bạn” #PositiveTweets

1) (@ Nisha38871234): "#WorldBloodDonorDay Hiến máu là sự cống hiến tốt nhất trên thế giới Cứu một mạng người !!" Chúc ngủ ngon #Twitter và #TheLegionoftheFallen 5:45 sáng sớm vô cùng!

2) (@imunbiased) Be excellent to each other Up a WV holler … or in NoVA

3) Hôm nay, một số biên bản quan trọng đã được ký kết sẽ thúc đẩy tình hữu nghị giữa Ấn Độ và Pháp.

1) Bất kỳ cuộc thăm dò tin giả nào cũng đều tiêu cực, giống như CNN, #DonaldTrump

Hillary có thể xem xét việc thuê thiên tài hoặc ảo thuật gia đã trang điểm cho Palin vào năm 2008, và ngừng ăn mặc giống như bà dì kỳ quặc của tôi, người làm việc tại JCPenney không?

3) Sasha và Malia Obama, hai cô con gái vui vẻ selfie trong Lễ diễu hành nhậm chức của cha mình là Tổng thống Obama Theo

Các tweet chứa thông tin giá trị về nhiều chủ đề, nhưng cũng có thể bao gồm các ký tự không hữu ích cho việc phát hiện phân cực tình cảm Do đó, việc xử lý trước các tweet là cần thiết Bước này bao gồm việc chuyển đổi tất cả văn bản tweet thành chữ thường và làm sạch nội dung bằng cách xóa URL, ký tự hashtag (ví dụ: #Trump) và đề cập của người dùng.

Các phương pháp phân tích tình cảm trên Twitter không liên quan đến các ký tự đặc biệt Quá trình tiền xử lý bao gồm việc loại bỏ những từ được xem là đặc trưng phân biệt.

Sau khi hoàn tất quá trình tiền xử lý, bước tiếp theo là tiến hành dự đoán phân cực cảm xúc của các tweet Trong giai đoạn này, có thể áp dụng nhiều thuật toán dự đoán khác nhau, như SVM, Bayesian Classifier và Entropy Classifier Nghiên cứu của Vishal et al [17] đã xem xét các quy trình khai thác quan điểm hiện tại, bao gồm cả học máy và các phương pháp luận dựa trên từ vựng Họ đã sử dụng các thuật toán học máy như NB, Max Entropy và SVM, đồng thời chỉ ra những thách thức phổ biến trong việc thực hiện phân tích quan điểm trên Twitter.

Go và L.Huang [26] đã đề xuất một phương pháp kiểm tra kết luận thông tin trên Twitter thông qua giám sát xa, sử dụng các tweet có biểu tượng cảm xúc như tên linh động Họ giới thiệu một kỹ thuật phân loại tình cảm cho các tweet, phân loại chúng thành tích cực và tiêu cực, với dữ liệu đào tạo được thu thập theo phương pháp giám sát của Read [27] Để thực hiện điều này, nhóm nghiên cứu đã sử dụng API Twitter để trích xuất các tweet có biểu tượng cảm xúc, đồng thời loại bỏ các tweet lặp lại và các dòng không có cảm xúc rõ ràng Các bộ phân loại như NB, MaxEnt và SVM đã được áp dụng, với các tính năng được trích xuất bao gồm unigram, bigram và unigram kết hợp với POS Kết quả tốt nhất đạt được là từ bộ phân loại MaxEnt, với độ chính xác 83%, vượt qua NB với độ chính xác 82,7%.

Malhar và Ram [28] đã đề xuất một phương pháp giám sát hiệu quả để phân loại dữ liệu Twitter, cho thấy SVM vượt trội hơn so với các bộ phân loại khác với độ chính xác đạt 88% Thí nghiệm này kết hợp phân tích thành phần chính (PCA) với SVM nhằm giảm kích thước đặc trưng Ngoài ra, các phương pháp phân tích đặc trưng unigram, bigram và hybrid cũng được áp dụng Kết quả cho thấy việc tích hợp PCA với SVM và lựa chọn đặc trưng lai đã nâng cao độ chính xác phân loại lên tới 92%.

Anton và Andrey đã phát triển một mô hình trích xuất phân cực tình cảm từ dữ liệu Twitter, sử dụng các đặc trưng như n-gram và biểu tượng cảm xúc Kết quả thí nghiệm cho thấy SVM vượt trội hơn Nạve Bayes, với phương pháp tối ưu là SVM kết hợp với trích xuất đặc trưng unigram, đạt độ chính xác 81% và độ chính xác thu hồi 74%.

Po-Wei Liang và cộng sự đã phát triển một khuôn khổ gọi là “công cụ khai thác ý kiến” để tự động điều tra và phát hiện cảm xúc trong các thông điệp trên mạng xã hội Họ đã tiến hành phân tích các tweet có chú thích, trong đó chỉ trích xuất các thông điệp chứa đựng cảm xúc, loại bỏ những tweet không có quan điểm Các tweet được phân loại thành "quan điểm" và "không có quan điểm" bằng cách sử dụng bộ phân loại NB với biểu đồ unigram Đồng thời, họ đã loại bỏ các đặc trưng không liên quan thông qua chiến lược trích xuất chi-bình phương Kết quả thử nghiệm đã xác nhận tính đầy đủ của khuôn khổ phân tích tình cảm trong các ứng dụng blog chính hãng.

Pak và Paroubek đã áp dụng API Twitter cùng với các biểu tượng cảm xúc để thu thập và phân tích cảm xúc tích cực và tiêu cực, tương tự như nghiên cứu của Go et al Phân tích tình cảm được thực hiện theo nhiều nhãn, phân loại các tweet thành tích cực, tiêu cực hoặc trung tính Dữ liệu đào tạo được thu thập để thực hiện phân tích thống kê-ngôn ngữ, xác định tần suất từ ngữ Tập dữ liệu này được sử dụng để xây dựng bộ phân loại, với các thử nghiệm trên các phương pháp như SVM, CRF và MNB đa thức Kết quả cho thấy MNB kết hợp với các phần speech tags và tính năng n-gram mang lại hiệu suất tốt nhất.

Nghiên cứu của Kouloumpis và cộng sự khám phá tính hữu ích của các đặc trưng ngôn ngữ trong việc khai thác cảm xúc từ dữ liệu Twitter Họ đã sử dụng tập dữ liệu gắn thẻ băm (HASH) và biểu tượng cảm xúc (EMOT) để đào tạo các bộ phân loại, với tập dữ liệu iSieve được sử dụng để đánh giá Các bộ tính năng bao gồm unigram, bigram, lexicons, micro-blog và các yếu tố part-of-speech đã được giới thiệu Kết quả cho thấy rằng các đặc trưng bán phần của giọng nói không hiệu quả bằng việc phân tích tình cảm dữ liệu Twitter, trong khi các tính năng viết micro-blogging lại tỏ ra hữu ích nhất Điểm F cao nhất đạt được là 0,68 với bộ dữ liệu HASH và 0,65 khi kết hợp cả hai bộ dữ liệu HASH và EMOT.

THẢO LUẬN VÀ KẾT QUẢ

Trong nghiên cứu này, chúng tôi đã so sánh các kỹ thuật và kết quả khác nhau của hiệu suất thuật toán trong phân tích tình cảm trên Twitter Bảng 1 tóm tắt các phương pháp máy học có giám sát, trong đó SVM dựa trên unigram được coi là tiêu chuẩn để đo lường các chiến lược Việc tích hợp nhiều tính năng đã cải thiện độ chính xác phân loại, đặc biệt là khi kết hợp biểu tượng đơn sắc và biểu đồ sinh học Ngược lại, nghiên cứu của Anton và Andrey chỉ ra rằng bộ phân loại SVM với tính năng unigram hoạt động hiệu quả hơn so với các tính năng lai Kết quả từ Saif et al cho thấy việc kết hợp ngữ nghĩa với các tính năng cũng mang lại những cải tiến đáng kể.

Hamdan et al [34] đã chỉ ra rằng việc tích hợp nhiều tính năng như DBpedia, WordNet và SentiWordNet có thể cải thiện độ chính xác trong phân loại tình cảm Ngoài ra, nghiên cứu của Vishal và cộng sự [17] cho thấy các phương pháp học máy như Naive Bayes (NB), Max Entropy và Support Vector Machine (SVM) đạt hiệu suất tốt hơn khi sử dụng các tính năng bigram so với unigram hoặc trigram.

BẢNG I CÁCH TIẾP CẬN HỌC MÁY CÓ GIÁM SÁT ĐỂ PHÂN TÍCH TÌNH CẢM

Study Methods Algorithms Features Datasets Outcomes

NB, MaxEnt, and SVM classifiers

Tweets thu thập bằng cách sử dụng API Twitter

MaxEnt với cả unigram và bigram đạt độ chính xác 83% so với NB với độ chính xác 82,7%.

Unigrams, bigrams, hybrids (unigrams+ bigrams)

Tweet được thu thập bằng API Twitter

SVM sử dụng lựa chọn tính năng lai đạt độ chính xác 88% Ngoài ra, SVM với PCA đạt độ chính xác 92%. Anton and

Unigrams, bigrams, hybrids (unigrams+ bigrams)

Tweet được thu thập bằng hệ thống trực tuyến

SVM với unigram đạt điểm chính xác 81% và điểm thu hồi là 74%.

Tweet được thu thập bằng API Twitter

NB đa thức với bigram đạt được hiệu suất tốt hơn so với unigrams và trigrams.

Unigrams, bigrams, lexicon, POS features, and micro- blogging features

Thẻ bắt đầu bằng # (HASH) và biểu tượng cảm xúc (EMOT) được sử dụng trong tập dữ liệu đào tạo Đo lường F đạt 0,68 đối với HASH, cho thấy hiệu quả của việc sử dụng các thẻ này trong quá trình phân tích dữ liệu.

F là 0,65 đã được AdaBoost thu được cho bộ dữ liệu HASH và EMOT với sự kết hợp của n-gram, từ vựng và các tính năng tiểu blog

Bộ dữ liệu STS, HCR và OMD

Các tính năng ngữ nghĩa vượt trội hơn so với unigram và POS topic features semantic features

Cách tiếp cận chủ đề tình cảm cho thấy hiệu quả cao hơn so với cách tiếp cận ngữ nghĩa trong bộ dữ liệu HCR và OMD Nghiên cứu của Hamdan et al [34] đã chỉ ra rằng phương pháp giám sát mang lại kết quả khả quan trong việc phân tích tình cảm.

Các thử nghiệm cho thấy rằng việc thêm các tính năng như DBpedia, WordNet và SentiWordNet đã làm tăng độ chính xác của F-Measure một chút

Tỷ lệ của những cải thiện nhỏ này là khoảng 2% với SVM và 4% với NB.

Bảng 2 minh họa các cách tiếp cận tổng hợp khác nhau để phân tích tình cảm trên

Twitter Đối với bộ dữ liệu HCR, các phương pháp tổng hợp được đề xuất bởi da

Silva và cộng sự [38] đã kết hợp các phương pháp LR, RF, SVM và MNB với các tính năng BOW và từ điển, đạt được điểm F1 là 76,99 Trong khi đó, Fouad và cộng sự [42] đã chứng minh rằng phương pháp tổng hợp biểu quyết đa số kết hợp với lựa chọn tính năng thu thập thông tin đạt độ chính xác 84,75 Kết quả này cho thấy phương pháp của Fouad và cộng sự [42] vượt trội hơn so với phương pháp của da Silva và cộng sự [38], nhờ vào việc sử dụng thu thập thông tin như một phương pháp lựa chọn tính năng.

Saif và cộng sự đã chỉ ra rằng bộ phân loại NB đạt điểm F1 là 68,15 cho tập dữ liệu HCR, trong khi các phương pháp tổng hợp của da Silva và cộng sự, bao gồm LR, RF, SVM và MNB, chỉ đạt điểm F1 là 63,75 cho cùng tập dữ liệu Điều này cho thấy bộ phân loại NB có hiệu suất vượt trội hơn so với các phương pháp tổng hợp đã được đề xuất.

MNB với các đặc trưng BOW và từ vựng đạt điểm F1 là 68,20, cao hơn một chút so với 68,15 của bộ phân loại NB do Saif et al đề xuất So với các phương pháp tổng hợp của da Silva và cộng sự, bao gồm LR, RF, SVM và MNB, điểm F1 đạt được là 63,75 cho tập dữ liệu HCR Điều này cho thấy rằng việc sử dụng MNB với các tính năng BOW và từ vựng mang lại cải tiến nhẹ so với các phương pháp khác.

Theo nghiên cứu của Fouad và cộng sự, phương pháp tổng hợp mà họ phát triển cho thấy hiệu suất nhỉnh hơn so với bộ phân loại SVM khi áp dụng cho tập dữ liệu Sanders.

Bảng 2 cho thấy rằng ý tưởng biểu quyết đa số được áp dụng để xác định ý kiến cuối cùng của các tweet Đối với tập dữ liệu HCR, phương pháp NB với lựa chọn tính năng thu thập thông tin đạt được độ chính xác cao nhất là 85,09, vượt trội hơn so với phương pháp tổng hợp của Fouad và cộng sự (76,99) cũng như phương pháp của da Silva và cộng sự.

BẢNG II CÁC CÁCH TIẾP CẬN CẦN THIẾT ĐỂ PHÂN TÍCH TÌNH CẢM

Study Methods Algorithms Features Datasets Outcomes

Bộ dữ liệu quy mô lớn với 100 triệu trường hợp cho thấy các phương pháp tổng hợp đạt được độ chính xác 0,81 khi sử dụng 21 bộ phân loại, theo nghiên cứu của da Silva et al.

BOW, lexicon, and feature hashing

Tập dữ liệu Stanford (STS), Sanders, OMD và HCR

Một bộ phân loại tổng hợp có độ chính xác cao hơn khi kết hợp cả hai tính năng BOW và từ vựng Phương pháp đề xuất đạt được các điểm chính xác lần lượt là 76,99%, 81,06%, 84,89% và 76,81% cho các bộ dữ liệu HCR, STS, Sanders và OMD Hagen.

MLT-LT, KLUE, and TeamX n-grams, ALLCAPS, parts of speech, polarity dictionaries, punctuation marks, emoticons, word lengthening, clustering, negation, stems Đào tạo bán kết năm 2013

Phương pháp tổng hợp đã đạt được điểm F là 64,84 cho nhiệm vụ phụ B trong Cuộc thi bán kết năm 2015 (Nhiệm vụ 10).

The MartínezCáma Ensemble ranks various algorithms, including the Word2Vec method and a linguistic resources-based approach, utilizing a skip-gram scorer to enhance performance.

Corpus of the TASS competition đã đạt được điểm số F1 là 62,98% Tuy nhiên, thuật toán xếp hạng và skip-gam đã thu được điểm số F1 macro là 61,60%

Ensemble The majority vote, SVM,

Sentiment lexicons and BOW features

2013 Bộ phân loại tổng hợp đã nhận được điểm F là 86,05% cho nhiệm vụ 2A.

Various combination s of BOW, lexicon- based features, emoticon- based and POS features.

Trong nghiên cứu về bộ dữ liệu Stanford (STS) và HCR, bộ phân loại tổng hợp (bỏ phiếu theo đa số) của Sanders đạt được độ chính xác 93,94%, vượt trội hơn so với 92,71% của SVM Đối với tập dữ liệu Stanford -1K, bộ phân loại nhóm biểu quyết đa số ghi nhận độ chính xác từ 78,70% đến 78,10%, trong khi SVM chỉ đạt được 78,10% Đối với HCR, phương pháp Naive Bayes (NB) đạt được độ chính xác 85,09%, cao hơn so với các phương pháp tổng hợp phiếu bầu theo đa số, chỉ đạt 84,75%.

Bảng 3 tóm tắt các thuật toán dựa trên từ vựng được khảo sát trong bài báo này Xia et al [45] cho thấy phương pháp cảm tính dựa trên từ vựng của họ đạt độ chính xác phân loại 0,692 cho tập dữ liệu OMD, trong khi phương pháp tổng hợp của da Silva và cộng sự [38] đạt 76,81 Sự khác biệt này có thể do việc sử dụng bộ phân loại nhóm biểu quyết đa số và kết hợp các từ vựng với các tính năng BOW.

Bảng 4 cho thấy các thuật toán kết hợp được khám phá trong cuộc khảo sát này.

Phương pháp của chúng tôi đạt được độ chính xác 76,55% trên tập dữ liệu STS, vượt trội hơn so với các phương pháp dựa trên từ vựng của Xia và cộng sự với điểm 72,6% Bên cạnh đó, phương pháp tổng hợp bỏ phiếu theo đa số của Fouad và cộng sự đạt 78,70% Tuy nhiên, kết quả tốt nhất thuộc về da Silva et al với độ chính xác 81,06% cho cùng tập dữ liệu STS.

BẢNG III CÁC PHƯƠNG PHÁP DỰA TRÊN LEXICON ĐỂ PHÂN TÍCH TÌNH

Study Methods Algorith ms Features Datasets Outcomes

Khám phá các từ ngữ tình cảm bằng tiếng lóng trong Phân tích cảm xúc (ESSA)

Unigrams Bộ dữ liệu STS và OMD Đã đạt được độ chính xác phân loại là 0,726 cho tập dữ liệu STS và 0,692 cho tập dữ liệu OMD.

Ngày đăng: 24/11/2021, 20:46

Nguồn tham khảo

Tài liệu tham khảo Loại Chi tiết
[1] R. Xia, C. Zong, and S. Li, "Ensemble of feature sets and classification algorithms for sentiment classification," Information Sciences, vol. 181, no. 6, pp.1138-1152, 2011/03/15/ 2011 Sách, tạp chí
Tiêu đề: Ensemble of feature sets and classificationalgorithms for sentiment classification
[2] R. Sharma, S. Nigam, and R. Jain, "Opinion mining of movie reviews at document level," arXiv preprint arXiv:1408.3829, 2014 Sách, tạp chí
Tiêu đề: Opinion mining of movie reviews atdocument level
[3] R. Sharma, S. Nigam, and R. Jain, "Polarity detection at sentence level,"International Journal of Computer Applications, vol. 86, no. 11, 2014 Sách, tạp chí
Tiêu đề: Polarity detection at sentence level
[4] D. Factiva, "Quick Study: Direct Correction Established Between Social Meidia Engagement and Strong Financial Performance," PR News, 2009 Sách, tạp chí
Tiêu đề: Quick Study: Direct Correction Established Between SocialMeidia Engagement and Strong Financial Performance
[5] S. R. Das and M. Y. Chen, "Yahoo! for Amazon: Sentiment extraction from small talk on the web," Management science, vol. 53, no. 9, pp. 1375-1388, 2007 Sách, tạp chí
Tiêu đề: Yahoo! for Amazon: Sentiment extraction fromsmall talk on the web
[10] A. DuVander, "Which APIs are handling billions of requests per day?,"Programmable Web, 2012 Sách, tạp chí
Tiêu đề: Which APIs are handling billions of requests per day
[11] A. Giachanou and F. Crestani, "Like It or Not: A Survey of Twitter Sentiment Analysis Methods," ACM Comput. Surv., vol. 49, no. 2, pp. 1-41, 2016 Sách, tạp chí
Tiêu đề: Like It or Not: A Survey of Twitter SentimentAnalysis Methods
[12] A. M. Kaplan and M. Haenlein, "Users of the world, unite! The challenges and opportunities of Social Media," Business horizons, vol. 53, no. 1, pp. 59-68, 2010. [13] A. Abirami and V. Gayathri, "A survey on sentiment analysis methods and approach," in Advanced Computing (ICoAC), 2016 Eighth International Conference on, 2017: IEEE, pp. 72-76 Sách, tạp chí
Tiêu đề: Users of the world, unite! The challengesand opportunities of Social Media," Business horizons, vol. 53, no. 1, pp. 59-68,2010. [13] A. Abirami and V. Gayathri, "A survey on sentiment analysis methodsand approach
[14] K. P. Murphy, "Naive bayes classifiers," University of British Columbia, vol.18, 2006 Sách, tạp chí
Tiêu đề: Naive bayes classifiers
[15] A. L. Berger, V. J. D. Pietra, and S. A. D. Pietra, "A maximum entropy approach to natural language processing," Comput. Linguist., vol. 22, no. 1, pp.39-71, 1996 Sách, tạp chí
Tiêu đề: A maximum entropyapproach to natural language processing
[16] A. S. Nugroho, A. B. Witarto, and D. Handoko, "Support vector machine,"Teori dan Aplikasinya dalam Bioinformatika, Ilmu Komputer. com, Indonesia, 2003 Sách, tạp chí
Tiêu đề: Support vector machine
[17] V. Kharde and P. Sonawane, "Sentiment analysis of twitter data: A survey of techniques," arXiv preprint arXiv:1601.06971, 2016 Sách, tạp chí
Tiêu đề: Sentiment analysis of twitter data: A survey oftechniques
[18] A. Harb, M. Plantié, G. Dray, M. Roche, F. Trousset, and P. Poncelet, "Web Opinion Mining: How to extract opinions from blogs?," in Proceedings of the 5th international conference on Soft computing as transdisciplinary science and technology, 2008: ACM, pp. 211-217 Sách, tạp chí
Tiêu đề: WebOpinion Mining: How to extract opinions from blogs
[19] B. Pang, L. Lee, and S. Vaithyanathan, "Thumbs up?: sentiment classification using machine learning techniques," in Proceedings of the ACL-02 conference on Empirical methods in natural language processing-Volume 10, 2002: Association for Computational Linguistics, pp. 79-86 Sách, tạp chí
Tiêu đề: Thumbs up?: sentiment classificationusing machine learning techniques
[20] J. Khairnar and M. Kinikar, "Machine learning algorithms for opinion mining and sentiment classification," International Journal of Scientific and Research Publications, vol. 3, no. 6, pp. 1-6, 2013 Sách, tạp chí
Tiêu đề: Machine learning algorithms for opinion miningand sentiment classification
[21] C. Wu, L. Shen, and X. Wang, "A new method of using contextual information to infer the semantic orientations of context dependent opinions," in Artificial Intelligence and Computational Intelligence, 2009. AICI'09.International Conference on, 2009, vol. 4: IEEE, pp. 274-278 Sách, tạp chí
Tiêu đề: A new method of using contextualinformation to infer the semantic orientations of context dependent opinions
[22] M. Taboada, J. Brooke, M. Tofiloski, K. Voll, and M. Stede, "Lexiconbased methods for sentiment analysis," Computational linguistics, vol. 37, no. 2, pp. 267- 307, 2011 Sách, tạp chí
Tiêu đề: Lexiconbasedmethods for sentiment analysis
[23] T. Zagibalov and J. Carroll, "Unsupervised classification of sentiment and objectivity in Chinese text," in Proceedings of the Third International Joint Conference on Natural Language Processing: Volume-I, 2008 Sách, tạp chí
Tiêu đề: Unsupervised classification of sentiment andobjectivity in Chinese text
[24] A. Tripathy and S. K. Rath, "Classification of sentiment of reviews using supervised machine learning techniques," International Journal of Rough Sets and Data Analysis (IJRSDA), vol. 4, no. 1, pp. 56-74, 2017 Sách, tạp chí
Tiêu đề: Classification of sentiment of reviews usingsupervised machine learning techniques
[25] M. R. Saleh, M. T. Martớn-Valdivia, A. Montejo-Rỏez, and L. UreủaLúpez,"Experiments with SVM to classify opinions in different domains," Expert Systems with Applications, vol. 38, no. 12, pp. 14799- 14804, 2011 Sách, tạp chí
Tiêu đề: Experiments with SVM to classify opinions in different domains

HÌNH ẢNH LIÊN QUAN

BẢNG I. CÁCH TIẾP CẬN HỌC MÁY CÓ GIÁM SÁT ĐỂ PHÂN TÍCH TÌNH CẢM - BÁO CÁO BÀI TẬP LỚN HỌC PHẦN XỬ LÝ NGÔN NGỮ TỰ NHIÊN NGHIÊN CỨU VỀ KỸ THUẬT PHÂN TÍCH TÌNH CẢM CỦA DỮ LIỆU TWITTER
BẢNG I. CÁCH TIẾP CẬN HỌC MÁY CÓ GIÁM SÁT ĐỂ PHÂN TÍCH TÌNH CẢM (Trang 23)
Bảng 2 minh họa các cách tiếp cận tổng hợp khác nhau để phân tích tình cảm trên - BÁO CÁO BÀI TẬP LỚN HỌC PHẦN XỬ LÝ NGÔN NGỮ TỰ NHIÊN NGHIÊN CỨU VỀ KỸ THUẬT PHÂN TÍCH TÌNH CẢM CỦA DỮ LIỆU TWITTER
Bảng 2 minh họa các cách tiếp cận tổng hợp khác nhau để phân tích tình cảm trên (Trang 24)
Bảng 2. Điều này được cho là do ý tưởng biểu quyết đa số được sử dụng để xác định ý - BÁO CÁO BÀI TẬP LỚN HỌC PHẦN XỬ LÝ NGÔN NGỮ TỰ NHIÊN NGHIÊN CỨU VỀ KỸ THUẬT PHÂN TÍCH TÌNH CẢM CỦA DỮ LIỆU TWITTER
Bảng 2. Điều này được cho là do ý tưởng biểu quyết đa số được sử dụng để xác định ý (Trang 25)
BẢNG III. CÁC PHƯƠNG PHÁP DỰA TRÊN LEXICON ĐỂ PHÂN TÍCH TÌNH - BÁO CÁO BÀI TẬP LỚN HỌC PHẦN XỬ LÝ NGÔN NGỮ TỰ NHIÊN NGHIÊN CỨU VỀ KỸ THUẬT PHÂN TÍCH TÌNH CẢM CỦA DỮ LIỆU TWITTER
BẢNG III. CÁC PHƯƠNG PHÁP DỰA TRÊN LEXICON ĐỂ PHÂN TÍCH TÌNH (Trang 27)
BẢNG IV. CÁC PHƯƠNG PHÁP HYBRID ĐỂ PHÂN TÍCH TÌNH CẢM - BÁO CÁO BÀI TẬP LỚN HỌC PHẦN XỬ LÝ NGÔN NGỮ TỰ NHIÊN NGHIÊN CỨU VỀ KỸ THUẬT PHÂN TÍCH TÌNH CẢM CỦA DỮ LIỆU TWITTER
BẢNG IV. CÁC PHƯƠNG PHÁP HYBRID ĐỂ PHÂN TÍCH TÌNH CẢM (Trang 28)
Hình n-gram và bigram. Các thuật toán phân tích tình cảm Twitter dựa trên tập hợp - BÁO CÁO BÀI TẬP LỚN HỌC PHẦN XỬ LÝ NGÔN NGỮ TỰ NHIÊN NGHIÊN CỨU VỀ KỸ THUẬT PHÂN TÍCH TÌNH CẢM CỦA DỮ LIỆU TWITTER
Hình n gram và bigram. Các thuật toán phân tích tình cảm Twitter dựa trên tập hợp (Trang 29)

TỪ KHÓA LIÊN QUAN

w