[Representation] Semantic Network – Biểu diễn qua mạng ngữ nghĩa P1
1. Cách chúng ta hiểu về những con số:
Toán học là môn học bắt buộc đối với tất cả mọi người vì nó được sử dụng nhằm ứng dụng trong mọi lĩnh vực của cuộc sống, và cơ bản nhất chính là những con số (gần gũi nhất với mọi người là hệ cơ số 10). Như chúng ta đã biết, số lượng số trong hệ cơ số 10 là vô hạn, nên rõ ràng để sử dụng được hệ cơ số 10 không ai lại đi học vẹt từng con số. Hay nói cách khác để ghi nhớ, hiểu và sử dụng, chúng ta đã đưa chúng trở thành một thứ gì đó, để mỗi khi gặp chắc chắn không thể lầm lẫn với những thứ khác.
2. Khái niệm chung về các hệ số:
a. Hệ cơ số 10:
Trong hệ cơ số 10, chúng ta có 10 chữ số 0, 1, 2, 3, 4, 5, 6, 7, 8, 9. Tất cả những số được sử dụng trong hệ cơ số 10 đều được cấu thành bởi chúng. Hay nói cách khác hệ cơ số 10 là một hệ gồm những số được cấu thành từ 10 chữ số trên.
b. Các hệ cơ số nói chung:
Tuy nhiên, với cách định nghĩa trên rõ ràng hệ cơ số chỉ đơn thuần phụ thuộc vào tập chữ số của nó. Vậy nên ta có hệ nhị phân, hệ 16 hay dùng cho máy tính, hệ 12 sử dụng những cách tính của người xưa (một vài dấu vết như năm có 12 tháng, đồng hồ có một vòng 12 giờ, có các cách đếm theo tá, trong tiếng Anh có one -> twelve). Hệ nhị phân chỉ gồm 2 chữ số, hệ 16 gồm 10 chữ số và thêm 6 chữ cái,… Đến đây chắc các bạn đã rút ra được concept của các hệ cơ số nói chung.
c. Khái niệm (concept) là vô cùng cần thiết:
Cũng như những hệ cơ số ở trên, chúng ta không thể học thuộc mọi thứ, phải có một cách nào đó để hiểu khái niệm về một vật, một loại vật, một lĩnh vực hay hiện tượng… Hiểu mọi thứ là ta có khái niệm về thứ đó, những thứ không thể khái niệm hoá được thì mới buộc phải học thuộc (rất ít).
3. Nhắc lại về Rule (dạng Luật):
Ở bài trước, chúng ta đã nói về biểu diễn tri thức dạng luật, và thấy rằng, các luật chỉ đưa ra các thông tin, muốn tổng hợp chúng thành những khái niệm sẽ tốn rất nhiều luật. Điều này khiến cho cơ sở tri thức trở nên cồng kềnh và hệ thống sẽ hoạt động kém hiệu quả. Vậy có cách nào để biểu diễn tốt hơn chỉ là thông tin ?
4. Làm sao để biểu diễn các khái niệm:
Hãy suy nghĩ một chút về cách con người hiểu mọi thứ. Trở lại với hệ cơ số, chúng ta hiểu nó bằng cách cho nó tập chữ số và số lượng. Ngoài ra còn có các phép tính + – x : … Vậy ta có thể biểu diễn hệ nhị phân như sau:
Tập chữ số gồm {0 ; 1}
Tập các phép tính {“+” ; “-” ; “x” ; “:”}
Và biểu diễn số 389 như sau:
Thuộc hệ cơ số X (chẳng hạn hệ cơ số 10)
Tập chữ số gồm {3 ; 8 ; 9}
Chúng ta có thể thấy khái niệm được biểu diễn khá tốt thông qua việc viết ra những thuộc tính của chúng. Những thuộc tính đó có thể là một khái niệm khác. Cứ như vậy chúng ta có một hệ thống gồm những khái niệm ràng buộc lẫn nhau, giúp con người hiểu về mọi thứ xung quanh cũng như bản thân.
5. Mạng ngữ nghĩa là gì:
Với cách tiếp cận trên, Richard H. Richens của trường Cambridge Language Research Unit vào năm 1956 đã đưa ra một cách cấu trúc dữ liệu nhằm biểu diễn tri thức cho máy tính với tên gọi Mạng Ngữ Nghĩa (Semantic Network). Ross Quillian tiếp tục phát triển từ năm 1966 – 1968.
Như đã trình bày ở trên, mạng ngữ nghĩa biểu diễn tri thức thông qua các khái niệm, tạo thành một mạng lưới. Mỗi khái niệm trong mạng ngữ nghĩa được mô tả bằng những thuộc tính và những quan hệ giữa nó với những khái niệm khác (chẳng hạn chó là động vật, chó là một khái niệm con của động vật). Ở hình trên là mạng ngữ nghĩa mô tả một số công thức trong tam giác, trong đó mỗi công thức là một khái niệm được mô tả thông qua những tham số và công thức giữa chúng. Mạng ngữ nghĩa trực quan đối với con người, nên mục đích chính của chúng là để thiết kế, còn khi triển khai chúng ta sẽ sử dụng một phương pháp tương đương là biểu diễn bằng frame. Bài sau chúng ta sẽ tiếp tục nói về mạng ngữ nghĩa cũng như cách ứng dụng thông qua ví dụ cụ thể, cũng như phân tích ưu và nhược điểm của nó.