Hiểu về điểm Sentiment trên Natural Language AI của Google

976 lượt xem

Sáng nay có bạn chat vào nhóm học viên mình về bài đăng trên Facebook của anh Đặng Lê Nam Hải, với chủ đề điểm xanh, đỏ, vàng của Sentiment trên Natural Language AI. Mình cũng có phân tích sơ bộ qua tin nhắn cho các bạn học viên nắm, nhân tiện đây mình có đôi dòng chia sẻ luôn cho bạn nào chưa biết thì nắm thêm.

nam-hai
Bài đăng của anh Đặng Lê Nam Hải trên Facebook cá nhân (xem bài đăng)

Phân tích điểm Sentiment trên Natural Language AI

Sentiment trên Natural Language AI của Google được chia làm 2 cấp độ: Document-levelSentence-level

1. Document-level sentiment analysis:

Phân tích cảm xúc cấp độ tài liệu (Document-level sentiment analysis) là một kỹ thuật xử lý ngôn ngữ tự nhiên (NLP) nhằm xác định thái độ hoặc cảm xúc chung được thể hiện trong một văn bản dài, ví dụ như bài báo, bài đăng trên mạng xã hội, bài đánh giá sản phẩm, v.v. Document-level giúp bạn hiểu được ý kiến tổng thể của tác giả hoặc người nói về chủ đề được đề cập.

Cách thức hoạt động:

Phân tích các yếu tố ngôn ngữ: Hệ thống phân tích cảm xúc sẽ xem xét các yếu tố ngôn ngữ khác nhau trong văn bản, chẳng hạn như:

  • Lựa chọn từ ngữ: Những từ ngữ tích cực (ví dụ: “tuyệt vời”, “hoàn hảo”) và tiêu cực (ví dụ: “tồi tệ”, “kinh khủng”) có thể cung cấp về cảm xúc của tác giả.
  • Cấu trúc câu: Cấu trúc câu, chẳng hạn như câu cảm thán hoặc câu hỏi tu từ, có thể thể hiện sự phấn khích, nghi ngờ hoặc tức giận.
  • Sử dụng các dấu chấm câu: Dấu chấm than (!) thường được sử dụng để thể hiện sự phấn khích hoặc ngạc nhiên, trong khi dấu chấm hỏi (?) có thể thể hiện sự nghi ngờ hoặc tò mò.

Sử dụng thuật toán máy học (Machine Learning): Hệ thống phân tích cảm xúc sử dụng các thuật toán Machine Learning được đào tạo trên một tập dữ liệu khổng lồ gồm văn bản và nhãn cảm xúc tương ứng. Thuật toán học được cách xác định mối tương quan giữa các yếu tố ngôn ngữ và cảm xúc, từ đó có thể dự đoán cảm xúc của văn bản mới.

Ví dụ: phân tích cảm tính ở cấp độ tài liệu về đánh giá sản phẩm có thể cho bạn biết rằng người đánh giá đó nhìn chung về sản phẩm tích cực hay tiêu cực, tốt hay xấu.

Xem thêm  Thư tình chia tay từ khóa TOP

Ứng dụng:

  • Phân tích ý kiến khách hàng: Phân tích đánh giá sản phẩm và phản hồi dịch vụ để hiểu mức độ hài lòng của khách hàng.
  • Phân tích xu hướng thị trường: Theo dõi các bài đăng trên mạng xã hội và các cuộc thảo luận trực tuyến để nắm bắt cảm xúc chung của công chúng về một sản phẩm, dịch vụ hoặc sự kiện nào đó.
  • Phát hiện ngôn ngữ kích động thù địch: Xác định các bài đăng hoặc bình luận có chứa ngôn ngữ xúc phạm hoặc thù địch trên mạng xã hội hoặc diễn đàn trực tuyến.

Ưu điểm:

  • Cung cấp cái nhìn tổng quan về cảm xúc chung trong một văn bản dài.
  • Có thể tự động hóa quy trình, giúp tiết kiệm thời gian và công sức.
  • Có thể áp dụng cho nhiều loại văn bản khác nhau.

Hạn chế:

  • Độ chính xác có thể phụ thuộc vào chất lượng văn bản và độ phức tạp của cảm xúc.
  • Có thể khó phân biệt giữa mỉa mai và sự thật.
  • Cần có dữ liệu đào tạo chất lượng cao để đảm bảo độ chính xác của mô hình.

Document-level sentiment analysis là một công cụ mạnh mẽ để hiểu cảm xúc chung được thể hiện trong văn bản. Tuy nhiên, cần lưu ý đến những hạn chế của nó và sử dụng nó một cách cẩn thận kết hợp với các phương pháp phân tích khác để có được kết quả toàn diện nhất.

sentiment-analytis

2. Sentence-level sentiment analysis:

Phân tích cảm xúc cấp độ câu (Sentence-level sentiment analysis) là một kỹ thuật xử lý ngôn ngữ tự nhiên (NLP) nhằm xác định thái độ hoặc cảm xúc được thể hiện trong từng câu của một văn bản dài. Nó cung cấp cái nhìn chi tiết hơn về cảm xúc so với phân tích cảm xúc cấp độ tài liệu, vì nó có thể xác định chính xác những phần nào của văn bản thể hiện sự tích cực, tiêu cực hoặc trung lập.

Cách thức hoạt động:

  • Phân tích từng câu: Hệ thống phân tích cảm xúc sẽ xem xét từng câu trong văn bản một cách riêng biệt.
  • Sử dụng các kỹ thuật tương tự như phân tích cảm xúc cấp độ tài liệu: Hệ thống sẽ sử dụng các kỹ thuật tương tự như phân tích cảm xúc cấp độ tài liệu để xác định các yếu tố ngôn ngữ liên quan đến cảm xúc trong mỗi câu, bao gồm lựa chọn từ ngữ, cấu trúc câu và dấu chấm câu.
  • Kết hợp thông tin ngữ cảnh: Hệ thống cũng sẽ xem xét ngữ cảnh của mỗi câu, bao gồm các câu trước và sau, để có được hiểu biết đầy đủ hơn về ý nghĩa và cảm xúc của nó.
Xem thêm  Google bắt đầu mở Bard cho một số lượng người dùng

Ví dụ: phân tích cảm xúc ở cấp độ câu của một bài báo có thể tiết lộ rằng bài báo đó là trung lập nhưng nó chứa một số câu tích cực về nền kinh tế và một số câu khác lại tiêu cực về môi trường chính trị.

Bạn có thể đọc thêm bài: Thuật toán Things và Thuật toán chuỗi của Google

Ưu điểm:

  • Cung cấp cái nhìn chi tiết về cảm xúc trong văn bản.
  • Có thể xác định chính xác các phần văn bản thể hiện cảm xúc cụ thể.
  • Giúp hiểu rõ hơn về ý đồ và quan điểm của tác giả.

Hạn chế:

  • Có thể phức tạp hơn và tốn thời gian hơn so với phân tích cảm xúc cấp độ tài liệu.
  • Độ chính xác có thể phụ thuộc vào chất lượng văn bản và độ phức tạp của cảm xúc.
  • Cần có dữ liệu đào tạo chất lượng cao và các thuật toán học máy mạnh mẽ để đạt được độ chính xác cao.

Ví dụ:

Phân tích cảm xúc cấp độ câu của một bài đánh giá sản phẩm như sau:

  • Câu 1: “Công ty X vừa ra mắt sản phẩm mới nhất của họ.” (Trung lập)
  • Câu 2: “Sản phẩm này được thiết kế để đáp ứng nhu cầu ngày càng tăng của người tiêu dùng.” (Tích cực)
  • Câu 3: “Tuy nhiên, một số ý kiến tỏ ra lo ngại về giá cả và độ bền của sản phẩm.” (Tiêu cực)

Phân tích cảm xúc cấp độ câu của một bài đánh giá sản phẩm:

  • Câu 1: “Tôi rất vui mừng khi được dùng thử sản phẩm mới này.” (Tích cực)
  • Câu 2: “Tính năng này thật dễ sử dụng và hiệu quả.” (Tích cực)
  • Câu 3: “Tuy nhiên, pin sản phẩm không được bền như tôi kỳ vọng.” (Tiêu cực)
Xem thêm  Câu chuyện kinh doanh: Người ăn xin mù

sentiment

Ứng dụng:

  • Phân tích phản hồi của khách hàng: Phân tích đánh giá sản phẩm và phản hồi dịch vụ để hiểu rõ hơn về trải nghiệm của khách hàng với từng khía cạnh cụ thể của sản phẩm hoặc dịch vụ.
  • Theo dõi các cuộc thảo luận trên mạng xã hội: Phân tích các bài đăng và bình luận trên mạng xã hội để xác định ý kiến ​​của mọi người về các chủ đề cụ thể và theo dõi sự thay đổi cảm xúc theo thời gian.
  • Tăng cường trải nghiệm người dùng: Cá nhân hóa nội dung và tương tác dựa trên cảm xúc của người dùng được thể hiện trong các truy vấn hoặc phản hồi của họ.

Sentence-level sentiment analysis là một công cụ mạnh mẽ để hiểu cảm xúc được thể hiện trong từng câu của văn bản. Nó cung cấp thông tin chi tiết có giá trị cho nhiều ứng dụng khác nhau, từ việc phân tích phản hồi của khách hàng đến theo dõi các cuộc thảo luận trên mạng xã hội. Tuy nhiên, cần lưu ý đến những hạn chế của nó và sử dụng nó một cách cẩn thận kết hợp với các phương pháp phân tích khác để có được kết quả toàn diện nhất.

Thật ra giờ mà nói đến tool này tool nọ thì có tầm 300 – 500 cái gì đó để hỗ trợ cho SEO, nhưng có ai nhớ mà dùng hết, nên chỉ là áp dụng tùy từng trường hợp (nhiều ông cứ lấy 1 cái ra làm thước đo rồi rao giảng như là cứ phải làm theo cái đó mới đúng, mới TOP).

Nên anh em làm SEO, thì cần nghiên cứu, phân tích và đọc thật nhiều tài liệu để có kiến thức nền cũng như nâng cao kiến thức + tư duy làm việc, cứ học rồi thử nghiệm, sẽ rút ra kinh nghiệm thôi.

Ghi chú: Mình thành lập website cá nhân này nhằm thỏa mãn đam mê viết lách, bao gồm những bài blog mình tự viết và cả những nội dung sưu tầm. Nếu bạn yêu thích hãy cùng kết nối với mình qua Zalo: 0949.339.222 hoặc Facebook: Trịnh Bảo. Cảm ơn bạn đã ghé thăm!

× sticky