Thuật Toán Trong ChatGPT (phần 4): Nơ Ron Nhân Tạo

1. Bối cảnh

Trong quá trình tìm hiểu về các thuật toán trong Chat GPT chúng ta đã hiểu ra rằng nó đang ứng dụng công nghệ học sâu để tạo sinh (Generate) ra các chuỗi ký tự tiếp theo sau khi chuỗi ký tự ban đầu đã được nhập vào. Công nghệ Học sâu là một ứng dụng của mô hình tính toán mạng nơ ron (Neural Network). Mạng nơ ron mô phỏng hoạt động xử lý thông tin trong hệ thần kinh của con người. Hệ thần kinh con người được cấu tạo nên từ các tế bào thần kinh.

Tế bào thần kinh (nơ ron) là đơn vị cơ bản cấu tạo nên hệ thần kinh của động vật. Ở loài giun thì chỉ có 302 tế bào thần kinh, và đây là mẫu sinh vật lý tưởng mà các nhà khoa học thần kinh sử dụng trong các thí nghiệm để lập bản đồ tất cả các tế bào thần kinh của nó. Ở loài người thì ước tính có khoảng 20 tỷ tế bào thần kinh ở vỏ não và khoảng 70 tỷ tế bào thần kinh ở tiểu não.

Năm 1871, nhà sinh lý học người Mỹ Henry Pickering Bowditch đã lần đầu tiên khám phá ra nguyên lý All-or-none (Tất cả hoặc không có gì) đối với sự co bóp của cơ tim. Nếu một kích thích khiến cơ tim co bóp thì nó sẽ co bóp với mức độ mạnh nhất có thể mà không phụ thuộc vào cường độ của kích thích. Sau đó các nhà khoa học thần kinh cũng đã nhận ra được rằng các tế bào thần kinh cũng hoạt động theo nguyên lý này. Khi một tế bào thần kinh phản ứng lại một kích thích, thì chúng sẽ tạo ra một xung điện với biên độ không đổi duy nhất mà không phụ thuộc vào cường độ của kích thích. Nói cách khác, đối với một kích thích bất kỳ thì tế bào thần kinh sẽ phản ứng ở mức độ tối đa hoặc không có phản ứng gì.

Hình bên phải mô tả nguyên lý này. Khi một tín hiệu điện kích thích có cường độ dưới ngưỡng (Threshold) sẽ không kích hoạt phản ứng của tế bào thần kinh. Nhưng khi cường độ của tín hiệu điện kích thích vượt qua ngưỡng sẽ kích hoạt tế bào thần kinh phản ứng để tạo ra một xung thần kinh với biên độ cực đại, cho dù cường độ tín hiệu kích thích có mạnh hơn thì biên độ của xung thần kinh phản ứng cũng không tăng lên.

Các nhà khoa học thần kinh đã phát hiện ra rằng các tế bào thần kinh (nơ ron) trong bộ não nhận input từ các giác quan của chúng ta bằng các tín hiệu điện như trên. Sau đó, các nơ ron sử dụng các tín hiệu điện này để lưu trữ thông tin và đưa ra quyết định dựa trên các input trước đó.

2. Nơ Ron Nhân Tạo

Năm 1957, nhà tâm lý học người Mỹ nổi tiếng trong lĩnh vực Trí tuệ nhân tạo tên là Frank Rosenblatt đã phát minh ra thuật toán Nơ Ron Nhân Tạo (Perceptron).

Hình bên phải mô tả một ví dụ về nơ ron nhân tạo. Mỗi hình tròn biểu thị một nơ ron, giá trị bên trong hình tròn mô tả cường độ của tín hiệu điện. Ở ví dụ này ta thấy nơ ron y nhận 3 tín hiệu input từ các nơ ron 1, x1, x2. Trong đó nơ ron 1 có trọng số b (b là viết tắt của bias) biểu thị mức độ sai số của các tín hiệu input, nơ ron x2x3 là các tín hiệu input, được gắn các trọng số lần lượt là w1w2 (w là viết tắt của weight) biểu thị mức độ quan trọng của tín hiệu input tương ứng. Cường độ dòng điện kích thích nơ ron y là giá trị của tổng a dưới đây:

Khi cường độ dòng điện kích thích lớn hơn giá trị ngưỡng (Threshold) thì sẽ kích hoạt nơ ron y phát ra tín hiệu. Ở ví dụ này chúng ta thiết lập giá trị ngưỡng là 0, và sử dụng hàm kích hoạt (Activation Function) h(x) dưới đây để tính toán ra giá trị output như dưới đây:

 

Như vậy đến đây chúng ta đã hiểu được thuật toán Nơ ron nhân tạo (Perceptron) mô phỏng hoạt động của tế bào thần kinh. Hãy chờ đón đọc bài viết tiếp theo về việc áp dụng thuật toán Nơ ron nhân tạo này để xây dựng nên Mạng nơ ron (Neural Network).

Add a Comment

Scroll Up