Chủ Nhật, 25 tháng 10, 2015

Semantic search là gì và tại sao nó quan trọng?

Semantic search là gì?

Sẽ dễ hơn nếu như tôi đưa ra ví dụ hơn là cố gắng giải thích bằng lời. Bạn còn nhớ ngày xưa, lúc mà search trong Google sẽ cho kết quả dựa hoàn toàn vào từ khóa chứ?

Giống như khi tôi gõ “Portishead” mà không đặt nó trong ngữ cảnh nào, nó sẽ ra những kết quả liên quan tới ban nhạc này hoặc có thể là một con phố ở Somerset. Tuy vậy, với semantic search như bây giờ, nếu tôi gõ “Portishead”, tôi sẽ nhận được kết quả hoàn toàn liên quan tới ban nhạc bởi vì quá khứ tìm kiếm của tôi liên quan tới âm nhạc và không hề liên quan gì tới Somerset.

[​IMG] ​



Đây chính là ví dụ đơn giản về semantic search, lấy dữ liệu từ người dùng và đưa ra kết quả liên quan. Tuy vậy, semantic search có thể làm được nhiều hơn như vậy. Nó có thể lấy nhiều biến số liên quan tới người dùng và sử dụng nó để đưa ra kết quả chính xác hơn.

Việc này là ví dụ cho xu hướng chuyển từ đưa kết quả dựa theo từ khóa của người dùng tiến tới hiểu được toàn bộ hoàn cảnh mà người dùng tìm kiếm. Khi dựa mong muốn tìm kiếm, như khi tìm “nhà hàng steak” thì hoàn cảnh rất quan trọng như vị trí, thời gian, quá khứ tìm kiếm và sử dụng thiết bị gì để tìm kiếm. Google sẽ lấy tất cả thông tin mà người dùng search ngay tại thời điểm đó và lấy ra kết quả tốt nhất.

Những ví dụ khác về semantic search

Những trải nghiệm của tôi với sematic search toàn là những bất ngờ và nó đều là ở nước ngoài. Tôi đang sống tại New York. Trước khi đi ra nước ngoài, tôi có điền mẫu đơn du lịch. Sau khi đã trải qua một quá trình điền đơn, tôi được gợi nhớ rằng mình đã có một sự kiện nổi bật trong năm qua. Tôi gõ trên Google “how long does an ESTA last?” như trước khi gõ hết cả câu thì Google đã trả lại những gợi ý với 2 từ “how long”.


how-long-google-search-results.png ​

Sau đó tôi chuyển trang trình duyệt ẩn danh để xem người ta thường tìm hiểu những gì mà người ta thường hỏi với 2 từ “how long”.

how-long-google-search.png ​

Google đã hiểu hoàn cảnh mà tôi tìm kiếm, nó biết rằng tôi vừa bỏ thời gian điền đơn ở website của ESTA.

Trong cùng ngày hôm đó…

Bởi vì tôi sử dụng Gmail nên tôi nhận được toàn bộ thông tin về các chuyến bay trong mail này, Google đã cho tôi thông tin liên quan tới mình (được cập nhật tới đúng ngày) về chuyến bay, mặc dù tôi chỉ tìm kiếm thông tin về địa điểm tại Heathrow.

heathrow-google-search.png ​

Semantic search hoạt động như thế nào?

Trong năm 2013, Google chạy thuật toán Hummingbird, đây cũng là lúc mà người ta nhận ra rằng các câu trả lời của Google bắt đầu có giá trị và sâu sắc hơn khi bạn search. Theo báo cáo của TechCrunch trong thời điểm đó, Hummingbird là thuật toán đỉnh cao của Search Engine từ năm 2009, cho phép Google phân tích nhanh chóng hơn câu hỏi (so với phương pháp phân tích từng từ một) sau đó xác định và sắp xếp câu trả lời cho câu hỏi của bạn từ những content mà Google đã index.

Mỗi từ ngữ đều được Google hiểu theo nhiều ngữ cảnh và theo cách mà nó đã được sử dụng trên google từ trước đó, điều này có nghĩa là kết quả tìm kiếm sẽ chính xác hơn. Google sử dụng tất cả những dữ liệu tìm kiếm này để xây dựng hệ thống kiến thức riêng mà có lẽ bạn đã nghe qua với cái tên Knowledge Graph.

Knowledge Graph

Knowledge Graph là hệ thống sắp xếp, kết nối thông tin về hàng triệu người, địa điểm, tổ chức nổi tiếng từ rất nhiều nguồn dữ liệu, trong đó có wikipedia. Khi nó được giới thiệu vào năm 2012, kết quả trả về khá đơn giản, như hình bên dưới với link và những thông tin lấy ra từ Wikipedia.

portishead-google-search-knowledge-graph.png ​

Bây giờ, Knowledge Graph đã trở nên phức tạp hơn nhiều. Đây là kết quả tìm kiếm của tôi cho từ “best albums of 2015” và có được kết quả chiếm cả một hàng ngang trên trang.

best-albums-of-2015-google-search.png ​

Điều này dẫn tôi tới một câu hỏi…

Tại sao Google quan tâm quá mức tới việc xây dựng nguồn thông tin khổng lồ?

Và nó được đưa vào mục tiêu riêng của Google

Sứ mệnh của Google là hệ thống thông tin của thế giới và khiến nó có giá trị và tiếp cận được trên toàn thế giới.

Rất nhiều người sẽ hiểu được sứ mệnh làm cho internet tốt hơn, hữu dụng và trở thành một nơi dành cho người dùng. Nó cũng là lý do khiến tôi viết những bài viết của mình.

Tất nhiên, cũng có những người cho rằng, với việc trả kết quả nhanh và chính xác hơn, Google có thể khiến người dùng ở lại trang lâu hơn, từ đó gia tăng khả năng click vào quảng cáo.

Bạn có thể giúp Google đưa ra kết quả tốt hơn cho content của bạn bằng cách sử dụng HTML markup. Càng nhiều câu hỏi Google có thể trả lời với content của bạn thì càng ít người thực sự tương tác với trang web của bạn.

Không có nhận xét nào:

Đăng nhận xét