ChatGPT 'Đọc' Thông Tin Cá Nhân Từ Hình Ảnh Người Dùng Gửi Lên

ChatGPT vừa gây bất ngờ khi tự động nhận diện và đọc được thông tin cá nhân từ văn bản trong hình ảnh do người dùng tải lên, cho thấy khả năng xử lý thị giác mạnh mẽ hơn. Tìm hiểu thêm về tính năng này.

Bởi Đội ngũ Bước cùng AI
ChatGPT 'Đọc' Thông Tin Cá Nhân Từ Hình Ảnh Người Dùng Gửi Lên

Giới thiệu

ChatGPT của OpenAI gần đây đã gây ngạc nhiên khi tự động nhận diện và đọc được thông tin cá nhân từ văn bản trong hình ảnh do người dùng tải lên. Một người dùng phát hiện ra ChatGPT biết "callsign" (mã định danh radio) của mình, dù anh chưa bao giờ nhập trực tiếp thông tin này. Điều này cho thấy khả năng xử lý thị giác của AI đã tiến bộ vượt bậc, không chỉ dừng lại ở việc hiểu chữ viết thông thường mà còn có thể "đọc" thông tin từ ảnh.

Có gì mới?

Sự việc bắt đầu khi một người dùng chia sẻ ảnh chụp màn hình bảng điều khiển radio của mình với ChatGPT. Không ngờ, AI đã tự động quét và nhận diện được mã định danh radio có trong ảnh. Đây không phải là một tính năng được công bố rầm rộ, mà là một minh chứng thực tế cho thấy khả năng "nhìn" và xử lý thông tin từ hình ảnh của ChatGPT đã rất mạnh mẽ. Điều này mở ra nhiều tiềm năng nhưng cũng đặt ra các câu hỏi về quyền riêng tư và cách AI xử lý dữ liệu hình ảnh nhạy cảm.

Tính năng nổi bật

  • Nhận diện văn bản trong ảnh (OCR): ChatGPT có khả năng "đọc" chữ viết, số liệu, ký hiệu từ các hình ảnh được tải lên.
  • Hiểu ngữ cảnh từ hình ảnh: Không chỉ đọc, AI còn có thể hiểu được ý nghĩa của các thông tin thu thập từ ảnh trong ngữ cảnh cuộc trò chuyện.
  • Tự động trích xuất thông tin: AI có thể tự động trích xuất các dữ liệu quan trọng mà người dùng không cần phải chỉ định cụ thể.

Ý nghĩa với người Việt

Với khả năng này, các đối tượng như dân văn phòng, giáo viên hay chủ shop ở Việt Nam có thể hưởng lợi. Ví dụ, dân văn phòng có thể tải ảnh tài liệu để AI tóm tắt hoặc trích xuất dữ liệu. Giáo viên có thể chụp ảnh đề thi, bài tập để AI hỗ trợ soạn giáo án. Chủ shop có thể dùng để đọc thông tin từ hóa đơn, biên lai hay sản phẩm. Tuy nhiên, cần cẩn trọng với các thông tin cá nhân nhạy cảm.

Đã dùng được ở Việt Nam chưa?

Có, bạn hoàn toàn có thể sử dụng tính năng này của ChatGPT tại Việt Nam. Bạn không cần VPN. ChatGPT có các gói miễn phí và trả phí (Plus, Team, Enterprise). Để sử dụng các tính năng nâng cao như xử lý hình ảnh, bạn có thể cần đăng ký gói trả phí, thường yêu cầu thẻ thanh toán quốc tế.

So với đối thủ?

So với các đối thủ như Claude hay Gemini, khả năng xử lý hình ảnh của ChatGPT cũng đang được cải thiện liên tục và thể hiện sự cạnh tranh mạnh mẽ. Claude 3 cũng có khả năng phân tích hình ảnh tốt, trong khi Gemini của Google được phát triển với khả năng đa phương thức (multimodal) ngay từ đầu, cho phép nó xử lý hình ảnh, video và âm thanh một cách tự nhiên. Tuy nhiên, việc ChatGPT tự động đọc được thông tin cá nhân từ ảnh cho thấy một bước tiến đáng chú ý về khả năng suy luận thị giác.

Câu hỏi thường gặp

ChatGPT đọc thông tin từ hình ảnh như thế nào?

ChatGPT sử dụng công nghệ nhận diện ký tự quang học (OCR) tiên tiến để quét và trích xuất văn bản từ hình ảnh. Sau đó, nó dùng mô hình ngôn ngữ lớn để hiểu ngữ cảnh và ý nghĩa của văn bản đó.

Tôi có nên lo lắng về quyền riêng tư khi gửi ảnh cho ChatGPT không?

Có, bạn nên cẩn trọng. Khi gửi ảnh chứa thông tin cá nhân hoặc nhạy cảm, AI có thể đọc và xử lý chúng. Luôn kiểm tra kỹ nội dung ảnh trước khi tải lên và đọc chính sách bảo mật của OpenAI.

Tính năng này có sẵn cho tất cả người dùng ChatGPT không?

Khả năng xử lý hình ảnh tiên tiến thường có sẵn cho người dùng các gói trả phí như ChatGPT Plus, Team hoặc Enterprise. Người dùng bản miễn phí có thể có các tính năng giới hạn hơn.

Làm thế nào để tránh ChatGPT đọc thông tin không mong muốn từ ảnh?

Để tránh việc này, bạn nên che mờ hoặc xóa bỏ các thông tin nhạy cảm trên ảnh trước khi tải lên ChatGPT. Hoặc chỉ gửi những ảnh không chứa dữ liệu cá nhân.

Khả năng xử lý hình ảnh của ChatGPT có thể ứng dụng vào những việc gì khác?

Ngoài việc đọc thông tin cá nhân, tính năng này có thể dùng để tóm tắt tài liệu từ ảnh, chuyển đổi ảnh chụp bảng biểu thành dữ liệu, hoặc mô tả nội dung hình ảnh cho người khiếm thị.

Dùng ngay hôm nay

ChatGPT

Vai trò: Phân tích viên dữ liệu. Nhiệm vụ: Tôi đã tải lên một ảnh chụp màn hình bảng điều khiển. Hãy tóm tắt các thông số chính và cho biết bất kỳ thông tin nhận dạng nào bạn tìm thấy trong ảnh.
Bản miễn phí giới hạn~5 phút bắt đầu
Mở ChatGPT

Bài viết có thể chứa link giới thiệu — không ảnh hưởng giá bạn trả, ủng hộ Bước cùng AI tiếp tục viết miễn phí.

Bài liên quan