EITC/AI/GVAPI Google Vision API là chương trình Chứng nhận CNTT Châu Âu về việc sử dụng API Vision trí tuệ nhân tạo của Google Cloud để hiểu hình ảnh được đào tạo trước.
Chương trình giảng dạy của EITC/AI/GVAPI Google Vision API tập trung vào các kỹ năng thực hành trong việc sử dụng các dịch vụ phân tích hình ảnh học máy tự động của Google Vision API (giao diện lập trình ứng dụng) được tổ chức theo cấu trúc sau, bao gồm nội dung video toàn diện làm tài liệu tham khảo cho Chứng chỉ EITC .
Google Vision API là dịch vụ phân tích hình ảnh của Google Cloud Platform dựa trên công nghệ máy học được đào tạo trước và liên tục cải tiến với các triển khai phức tạp liên quan đến học sâu. Đây là một trong những tiêu chuẩn hàng đầu trong ngành về độ chính xác để hiểu hình ảnh trí tuệ nhân tạo. Chương trình giảng dạy tham chiếu EITC/AI/GVAPI Google Vision API tập trung vào việc làm việc với AI tầm nhìn bằng Python thông qua API Vision của Google Cloud, là một dịch vụ đám mây AI mạnh mẽ cung cấp các mô hình học máy được đào tạo trước và luôn cải tiến. Sử dụng Vision AI, người ta có thể thực hiện các tác vụ để hiểu dữ liệu trực quan, chẳng hạn như gán nhãn cho hình ảnh để tổ chức cơ sở dữ liệu hình ảnh lớn, nhận các đỉnh cắt được đề xuất, phát hiện các cảnh quan hoặc địa điểm nổi tiếng, trích xuất văn bản và nhiều thứ khác.
Google Cloud cung cấp hai dịch vụ thị giác máy tính (được gọi chung là Vision AI) sử dụng máy học để hiểu hình ảnh và video với độ chính xác dự đoán cao, tức là AutoML Vision và Vision API. AutoML Vision tự động đào tạo các mô hình học máy tùy chỉnh. Nó cho phép tải lên hình ảnh và đào tạo các mô hình hình ảnh tùy chỉnh với giao diện đồ họa dễ sử dụng; tối ưu hóa các mô hình về độ chính xác, độ trễ và kích thước và xuất chúng sang bất kỳ ứng dụng nào trên đám mây hoặc sang một loạt các thiết bị ở rìa. Mặt khác, API Vision của Google Cloud cung cấp các mô hình học máy mạnh mẽ được đào tạo trước thông qua các API REST (Chuyển trạng thái đại diện) và RPC (Gọi thủ tục từ xa), gán nhãn cho hình ảnh và nhanh chóng phân loại chúng thành hàng triệu danh mục được xác định trước. Phát hiện đối tượng và khuôn mặt, đọc văn bản in và viết tay, đồng thời xây dựng siêu dữ liệu có giá trị thành danh mục hình ảnh. Do đó, bạn có thể sử dụng AutoML Vision để thu thập thông tin chi tiết từ hình ảnh trên đám mây hoặc ở rìa hoặc sử dụng các mô hình API Vision được đào tạo trước để phát hiện cảm xúc, hiểu văn bản từ dữ liệu trực quan, v.v.
Với API Tầm nhìn của Google Cloud, bạn có thể:
- Phát hiện đối tượng: Phát hiện đối tượng, vị trí của chúng và số lượng.
- Bật tính năng tìm kiếm sản phẩm của Vision: So sánh ảnh với hình ảnh trong danh mục sản phẩm của bạn và trả về danh sách các mặt hàng tương tự được xếp hạng.
- Phát hiện văn bản in và viết tay: Sử dụng OCR và tự động nhận dạng ngôn ngữ.
- Phát hiện khuôn mặt: Phát hiện khuôn mặt và các thuộc tính trên khuôn mặt. (Nhận dạng khuôn mặt không được hỗ trợ.)
- Xác định các địa điểm nổi tiếng và logo sản phẩm: Tự động xác định các địa danh nổi tiếng và logo sản phẩm.
- Gán các thuộc tính hình ảnh chung: Phát hiện các thuộc tính chung và gợi ý cắt xén thích hợp.
- Phát hiện các trang và thực thể web: Tìm các sự kiện tin tức, biểu trưng và hình ảnh tương tự trên web.
- Nội dung vừa phải: Phát hiện nội dung khiêu dâm (người lớn, bạo lực, v.v.) trong hình ảnh.
- Nhận dạng người nổi tiếng: Nhận dạng khuôn mặt người nổi tiếng trong hình ảnh (truy cập hạn chế, xem tài liệu.)
- Phân loại hình ảnh bằng cách sử dụng các nhãn xác định trước: Các mô hình được đào tạo trước tận dụng thư viện rộng lớn của các nhãn được xác định trước.
- Sử dụng dịch vụ gắn nhãn dữ liệu của Google: Google có thể giúp chú thích hình ảnh, video và văn bản.
- Sử dụng API: Sử dụng API REST và RPC.
Các trường hợp sử dụng có thể có cho Vision API là vô số.
Ví dụ: sử dụng Vision API, bạn có thể triển khai tìm kiếm sản phẩm Vision cho phép khách hàng của bạn tìm thấy các sản phẩm quan tâm trong hình ảnh và tìm kiếm trực quan danh mục sản phẩm (tìm kiếm hình ảnh, các sản phẩm tương tự được chỉ định tự động, v.v.).
Video trên giải thích cách Cloud AutoML Vision của Google sử dụng AI để phân tích hình ảnh.
Một hệ thống AI kép, có liên quan mật thiết đến API Google Vision được đào tạo trước và liên tục được nâng cấp là Google AutoML Vision cho phép các doanh nghiệp sử dụng mô hình học máy của riêng họ và đào tạo tùy chỉnh để hỗ trợ trí tuệ nhân tạo trong việc phân tích và hiểu thị giác. Là một phần của bộ sản phẩm máy học của Google Cloud, nó được thiết kế để giúp các nhà phát triển có kiến thức hạn chế về máy học đào tạo các mô hình thị giác tùy chỉnh cho các trường hợp sử dụng cụ thể của họ. Để có quyền truy cập theo yêu cầu vào mô hình chung được đào tạo trước, các nhà phát triển AI nên sử dụng API Google Vision.
Để tìm hiểu chi tiết về chương trình giảng dạy chứng nhận, bạn có thể mở rộng và phân tích bảng bên dưới.
Chương trình giảng dạy chứng chỉ Google Vision API của EITC/AI/GVAPI tham khảo các tài liệu giáo khoa truy cập mở dưới dạng video. Quá trình học tập được chia thành cấu trúc từng bước (chương trình -> bài học -> chủ đề) bao gồm các phần chương trình học có liên quan. Tư vấn không giới hạn với các chuyên gia tên miền cũng được cung cấp.
Để biết chi tiết về kiểm tra thủ tục Chứng nhận Làm thế nào nó hoạt động.
Tài nguyên tham khảo chương trình giảng dạy
AI của Google Vision
https://cloud.google.com/vision/
Tài liệu Google Vision API
https://cloud.google.com/vision/docs/
Tài liệu Tìm kiếm Sản phẩm Google Vision API
https://cloud.google.com/vision/product-search/docs/
Tài liệu về Tầm nhìn AutoML của Google
https://cloud.google.com/vision/automl/docs/
Google Qwiklabs dành cho API Cloud Vision
https://www.qwiklabs.com/catalog?keywords=Cloud+Vision+API
Tải xuống tài liệu chuẩn bị tự học ngoại tuyến hoàn chỉnh cho chương trình API Google Vision EITC/AI/GVAPI dưới dạng tệp PDF
Tài liệu chuẩn bị EITC/AI/GVAPI – phiên bản tiêu chuẩn
Tài liệu chuẩn bị EITC/AI/GVAPI – phiên bản mở rộng với các câu hỏi ôn tập