Giới thiệu
Vào 05.2011, bộ ba Google, Yahoo, Bing đã công bố schema.org và mọi người đã bắt đầu nói về dữ liệu có cấu trúc. Schema.org là một cách mới để các máy tìm kiếm hiểu các trang web. Nếu các tác giả nội dung web thêm một chút siêu dữ liệu vào các trang của họ — chỉ một vài thuật ngữ của bảng từ vựng — thì các kết quả tìm kiếm của họ hiển thị tốt hơn trong cả ba máy tìm kiếm.
Đánh dấu thêm đã không thay đổi cách hiển thị các kết quả tìm kiếm cho nhiều trang đã thực hiện schema.org. Mặc dù, các tác giả nội dung web vẫn còn háo hức để nhận được các trang của họ được đánh dấu và sẵn sàng để sử dụng trong cả ba máy tìm kiếm lớn.
Schema.org đặt ra một thách thức cho các tác giả web chưa có kinh nghiệm với các cú pháp khác nhau để bổ sung thêm dữ liệu có cấu trúc vào HTML. Các cú pháp là:
- Microformats (vi định dạng).
- RDFa
- Microdata (Vi dữ liệu).
Để tăng thêm thách thức này, Google (máy tìm kiếm có ảnh hưởng nhất đối với nhiều tác giả web) đã cho biết nó sẽ chỉ xử lý microdata. Microdata, là mới nhất trong ba cú pháp nói trên, vẫn chưa có nhiều công cụ hỗ trợ.
Trong bài này, hãy tìm hiểu cách sử dụng Drupal để thêm microdata vào các trang của bạn. Chuẩn bị nội dung của bạn sao cho có thể sử dụng nó trong các ứng dụng như Rich Snippets của Google.
Microdata là gì?
Microdata là một cách đơn giản để thêm dữ liệu có cấu trúc vào các trang web. Nó định nghĩa một vài thuộc tính, như
itemtype
và itemprop
, có thể được đặt vào các thẻ HTML để cho biết trang đó là về cái gì. Microdata được Ian Hickson, một biên tập viên về đặc tả HTML 5, giới thiệu vào năm 2009. Mặc dù, các nguồn gốc của ý tưởng này có trước đó lâu rồi.Microdata dựa trên RDFa, là một cách đặt RDF trong HTML. Ý tưởng về RDFa đã được Mark Birbeck giới thiệu vào năm 2004 với một lưu ý được W3C công bố. Sau đó, ý tưởng này được tích hợp vào phiên bản tiếp theo là XHTML. RDFa đã giới thiệu một số thuộc tính HTML mới, như
property
và about
và đã sử dụng lại một số thuộc tính, như rel
.RDFa mạnh mẽ, nhưng với các tác giả, có thể khó mà biết được liệu RDFa của họ có đúng không do các tương tác của các thuộc tính đôi khi phức tạp. RDFa cũng đã thừa hưởng một số tính năng của XML, như các tiền tố vùng tên, có thể gây khó hiểu.
Các microformat (vi định dạng), một phiên bản khác của dữ liệu có cấu trúc trong XHTML, đã được khởi chạy gần một năm sau bởi một nhóm các nhà phát triển. Trái ngược với RDFa, các microformat sử dụng lại các thuộc tính XHTML hiện có mà các tác giả nội dung web vẫn thường sử dụng, như thuộc tính
rel
trên các liên kết. Các microformat cũng thêm một ít ngữ nghĩa bên trong các thuộc tính đó. Người ta đã đặt tầm quan trọng vào cách chỉ đánh dấu nội dung nhìn thấy được; đối với nội dung không nhìn thấy được, rất dễ bị sử dụng sai hoặc mất đồng bộ với nội dung nhìn thấy được.Một vấn đề với các microformat là không có một cách chung để phân tích cú pháp chúng. Thay vào đó, người ta đã tăng thêm sự hỗ trợ cho mỗi microformat. Ví dụ, nếu bạn muốn xử lý dữ liệu lịch và dữ liệu địa chỉ, bạn phải chắc chắn rằng trình phân tích cú pháp của bạn hỗ trợ cả hai loại dữ liệu đó hoặc sử dụng hai trình phân tích cú pháp khác nhau. Cũng có thể rất khó để nhận được một microformat mới được xuất bản thông qua phương thức cộng đồng.
Microdata kết hợp các ý tưởng tốt từ cả hai các microformat lẫn RDFa với nhau. Microdata:
- Giảm sự phức tạp của RDFa bằng cách giảm số lượng các thuộc tính và các tùy chọn cho việc bố trí của chúng.
- Loại bỏ các tiền tố vùng tên.
- Duy trì phân tích cú pháp chung RDFa, giúp cho việc tạo các công cụ làm việc trên dữ liệu đã xuất bản dễ dàng hơn.
- Duy trì khả năng cho các nhóm người khác nhau để tạo các bộ các giá trị thuộc tính riêng của họ, được gọi là các bảng từ vựng, để sử dụng với microdata.