ChatGPT sẽ sớm cung cấp các tính năng mới cho phép người dùng tương tác thông qua nhận dạng giọng nói và hình ảnh, theo thông báo từ OpenAI vào ngày 25 tháng 9.
OpenAI đã thông báo rằng người dùng sẽ có thể tương tác với ChatGPT bằng lệnh thoại, mang lại trải nghiệm người dùng được cá nhân hóa hơn. Công ty cho biết tính năng này được hỗ trợ bởi mô hình chuyển văn bản thành giọng nói có thể tạo ra âm thanh từ lời nói mẫu tối thiểu do các diễn viên lồng tiếng chuyên nghiệp tạo ra. Họ cho biết tính năng này cũng được hỗ trợ bởi hệ thống nhận dạng giọng nói nguồn mở Whisper.
Các tính năng giọng nói dự kiến sẽ cung cấp nhiều tình huống sử dụng hơn, chẳng hạn như hỗ trợ các công việc như đọc truyện trước khi đi ngủ, tạo công thức nấu ăn, soạn bài phát biểu, ngâm thơ, giải thích các cụm từ thông dụng hoặc thậm chí giải quyết các cuộc tranh luận trên bàn ăn tối.
OpenAI bổ sung thêm rằng người dùng sẽ sớm có thể cung cấp hình ảnh cho ChatGPT (hoặc chọn một số phần hình ảnh nhất định) để diễn giải và phản hồi.
OpenAI thừa nhận rủi ro
OpenAI thừa nhận nguy cơ gian lận và mạo danh và cho biết, do đó, họ đang hạn chế các tính năng giọng nói đối với nền tảng trò chuyện thoại của mình. Nó nhấn mạnh rằng nó sử dụng diễn viên lồng tiếng chuyên nghiệp - không phải giọng nói của người dùng - cho âm thanh đầu ra. OpenAI nói thêm rằng một số nhóm khác được phép sử dụng khả năng giọng nói cho các mục đích khác; Ví dụ: Spotify đang dịch các podcast tham gia sang ngôn ngữ mới bằng giọng gốc của mỗi máy chủ.
Công ty lưu ý rằng nhận dạng hình ảnh mang lại rủi ro về quyền riêng tư và nói rằng, để đáp lại, nó đã hạn chế khả năng đưa ra tuyên bố về mọi người của ChatGPT. Nó lưu ý rằng ChatGPT không phải lúc nào cũng chính xác nhưng nói rằng các mô tả chung về hình ảnh có thể hữu ích, trích dẫn công việc trước đây của nó với Be My Eyes, một ứng dụng dành cho người mù và thị lực kém.
OpenAI cho biết họ sẽ giới thiệu các tính năng thoại và hình ảnh cho ChatGPT Plus và Enterprise trong hai tuần tới. Họ cho biết rằng các tính năng giọng nói sẽ có sẵn trên iOS và Android trên cơ sở chọn tham gia và các tính năng hình ảnh sẽ có sẵn trên tất cả các nền tảng.
Bài đăng OpenAI thông báo ChatGPT sẽ sớm thấy, nghe và nói' xuất hiện đầu tiên trên WebGiaCoin.
Theo Cryptoslate
|