Kiến trúc của mạng nơ-ron được sử dụng trong ví dụ là mạng nơ-ron truyền thẳng với ba lớp: lớp đầu vào, lớp ẩn và lớp đầu ra. Lớp đầu vào bao gồm 784 đơn vị, tương ứng với số pixel trong ảnh đầu vào. Mỗi đơn vị trong lớp đầu vào đại diện cho giá trị cường độ của một pixel trong ảnh.
Lớp ẩn bao gồm 128 đơn vị, được kết nối đầy đủ với lớp đầu vào. Mỗi đơn vị trong lớp ẩn tính toán tổng trọng số của các đầu vào từ lớp đầu vào và áp dụng hàm kích hoạt để tạo đầu ra. Trong ví dụ này, hàm kích hoạt được sử dụng trong lớp ẩn là hàm đơn vị tuyến tính được chỉnh lưu (ReLU). Hàm ReLU được định nghĩa là f(x) = max(0, x), trong đó x là tổng trọng số của các đầu vào cho đơn vị. Hàm ReLU giới thiệu tính phi tuyến tính cho mạng, cho phép mạng tìm hiểu các mẫu và mối quan hệ phức tạp trong dữ liệu.
Lớp đầu ra bao gồm 10 đơn vị, mỗi đơn vị đại diện cho một trong các lớp có thể có trong bài toán phân loại. Các đơn vị trong lớp đầu ra cũng được kết nối đầy đủ với các đơn vị trong lớp ẩn. Tương tự như lớp ẩn, mỗi đơn vị trong lớp đầu ra tính tổng trọng số của các đầu vào từ lớp ẩn và áp dụng một hàm kích hoạt. Trong ví dụ này, hàm kích hoạt được sử dụng trong lớp đầu ra là hàm softmax. Hàm softmax chuyển đổi tổng trọng số của đầu vào thành phân phối xác suất trên các lớp, trong đó tổng xác suất bằng 1. Đơn vị có xác suất cao nhất biểu thị lớp dự đoán của hình ảnh đầu vào.
Tóm lại, kiến trúc mạng thần kinh được sử dụng trong ví dụ bao gồm một lớp đầu vào với 784 đơn vị, một lớp ẩn với 128 đơn vị sử dụng chức năng kích hoạt ReLU và một lớp đầu ra với 10 đơn vị sử dụng chức năng kích hoạt softmax.
Các câu hỏi và câu trả lời gần đây khác liên quan đến Xây dựng mạng nơron để thực hiện phân loại:
- Có cần thiết phải sử dụng chức năng học không đồng bộ cho các mô hình học máy chạy trong TensorFlow.js không?
- Mô hình được biên dịch và đào tạo trong TensorFlow.js như thế nào và vai trò của hàm mất entropy chéo phân loại là gì?
- Tầm quan trọng của tốc độ học tập và số lượng kỷ nguyên trong quá trình học máy là gì?
- Dữ liệu huấn luyện được chia thành các tập huấn luyện và kiểm tra trong TensorFlow.js như thế nào?
- Mục đích của TensorFlow.js trong việc xây dựng mạng thần kinh cho các nhiệm vụ phân loại là gì?
Thêm câu hỏi và câu trả lời:
- Cánh đồng: Trí tuệ nhân tạo
- chương trình: Các nguyên tắc cơ bản về EITC/AI/TFF TensorFlow (đi đến chương trình chứng nhận)
- Bài học: TensorFlow.js (đến bài học liên quan)
- Chủ đề: Xây dựng mạng nơron để thực hiện phân loại (đi đến chủ đề liên quan)
- ôn thi