Apple Siri trên iOS 18: dùng LLM của OpenAI như Copilot, có tiếng Việt, điều khiển được nhiều hơn?
- Người viết: CodeWeb lúc
- Tin tức
Một nguồn tin nói với Bloomberg rằng Apple sẽ tập trung tăng cường khả năng của Siri trong phiên bản cập nhật OS sắp tới, cho phép người dùng điều khiển sâu nhiều tính năng của các phần mềm bằng giọng nói, thay vì chỉ các lệnh đơn giản hoặc dùng shortcut thủ công như hiện nay. Các cập nhật này sẽ dự kiến sẽ được công bố tại sự kiện WWDC sắp diễn ra ít ngày tới.
Các tính năng của Siri “mới”
Cụ thể, hệ thống mới cho phép Siri dùng mô hình ngôn ngữ lớn LLM để hiểu được phần mềm đang chạy, hiểu được ngữ cảnh đang sử dụng của người dùng và từ đó, người dùng có thể yêu cầu Siri điều khiển được tất cả các tính năng trong phần mềm.
Nguồn tin giấu tên nói với Bloomberg rằng nhờ thuật toán LLM, Siri sẽ phân tích người dùng đang làm gì trên thiết bị và sẽ tự kích hoạt các tính năng điều khiển bằng Siri. Tính năng này lúc đầu sẽ hoạt động trên các ứng dụng của Apple với hàng trăm câu lệnh điều khiển.
Tuy nhiên, Siri mới sẽ được nâng cấp theo 2 giai đoạn. Đầu tiên thì nó sẽ vẫn chỉ hỗ trợ từng câu lệnh đơn lẻ, tới giai đoạn sau thì Apple mới tiếp tục nâng cấp nó để có thể hiểu được một chuỗi các lệnh nối tiếp nhau. Vậy là sau khi "hoàn thiện", người dùng có thể yêu cầu Siri tóm tắt một đoạn ghi âm cuộc họp, sau đó gởi tới các đồng nghiệp, hoặc, có thể yêu cầu iPhone crop một bức ảnh, sau đó email tới một người bạn chẳng hạn.
Thời điểm ra mắt và lúc chính thức đến tay người dùng
Nguồn tin nói rằng hiện Apple đang chuẩn bị demo một số tính năng tại sự kiện WWDC sắp tới, bao gồm chuyển đoạn ghi âm thành văn bản rồi tóm tắt, recap nhanh một trang web hoặc các thông báo, tự động phản hồi tin nhắn, chỉnh sửa ảnh chuyên sâu bằng AI, dùng AI tạo emoji. Phần lớn các tác vụ AI cơ bản sẽ hoạt động ngay trên thiết bị trong khi các khả năng chuyên sâu hơn sẽ cần đưa lên đám mây xử lý.
Về thời gian chính thức xài được. Theo thông lệ, WWDC sẽ là lúc Apple giới thiệu loạt tính năng mới xoay quanh AI trên nhiều nền tảng OS họ đang phát triển. Tuy nhiên chính thức ra mắt thì phải đợi tới tháng 9, khi iPhone 16 series ra mắt thì các tính năng này mới chính thức được đưa tới tay người dùng. Hiện vẫn chưa rõ là các tính năng này sẽ đều hỗ trợ các phần cứng cũ hay có yêu cầu chuyên biệt gì đòi hỏi phải xài trên phần cứng mới hay không.
Apple sẽ dùng OpenAI hoặc Gemini
Một thông tin cực quan trọng khác là Apple đang củng cố thỏa thuận với OpenAI để tích hợp công nghệ và chatbot vào iOS. Cách đây không lâu, một đoạn code rò rỉ trong iOS 17.4 cũng cho thấy việc Apple đang thử nghiệm tích hợp OpenAI vào Siri, cho phép người dùng truy vấn bằng prompt như các chatvot hiện tại. Tuy nhiên, cũng có nguồn tin nói rằng hiện Apple vẫn đang tiếp tục nói chuyện với Google để sử dụng Gemini trong tương lai. Người ta cho rằng Apple hiện vẫn tiếp tục phát triển rất nhiều tính năng AI cho các bản cập nhật phần trong năm nay.
Và dù Apple có chọn đối tác là OpenAI hay Google cho "bộ não" của Siri, thì chắc chắn, các đặc tính mới của Siri sẽ được "kế thừa" từ cách tiếp cận của các chatbot đa model này. Nói cách khác, Siri về bản chất sẽ là một Copilot như của Microsoft đang cho chạy trên Windows. Khác biệt duy nhất bây giờ là cách Apple làm UX và UI cho Siri dựa trên các tính năng nó như thế nào mà thôi. Quan trọng hơn, gần như chắc chắn, Siri mới sẽ hỗ trợ tiếng Việt như cách mà các mô hình ngôn ngữ lớn hiện tại vẫn đang hỗ trợ.
Các câu hỏi về tính bảo mật
Thông tin từ Bloomberg cho rằng cùng với các tính năng AI mới, Apple cũng sẽ nâng cấp các tính năng đảm bảo quyền riêng tư dữ liệu của người dùng. Cụ thể, sẽ có một tính năng mới gọi là "báo cáo thông minh" do hệ thống soạn ra cho người dùng biết được thông tin của họ đang được bảo vệ ra sao.
Đối với các tính năng AI cơ bản chạy hoàn toàn trên máy, tất nhiên thông tin cá nhân của người dùng vẫn sẽ được đảm bảo local. Trong khi đó các tác vụ chạy trên mây vẫn sẽ đòi một số thông tin người dùng chuyển đi server remote. Các thông tin này có thể sẽ được bảo vệ bằng một cái gọi là Secure Enclave trong các chip Apple Silicon chạy trên các trung tâm dữ liệu của Apple.
Ván cược AI của Apple
Dễ thấy, AI chắc chắn sẽ là tâm điểm mà Apple xoay quanh tại sự kiện WWDC sắp tới. Từ khi ra mắt hồi năm 2011 đến nay, Apple được cho là ngày càng tụt lại so với các đối thủ khác ở mảng trợ lý ảo giọng nói thông minh, điển hình như Google Assistant hay Alexa của Amazon. Bởi thế, lần nâng cấp lớn cho Siri sẽ là cách giúp Apple đỡ "bị bỏ lại" hơn ở thời điểm hiện tại so với các công ty khác trong ngành công nghiệp.
Apple hiện tại được cho là đang phải đối mặt với một số thách thức nhất định. Điển hình như doanh số bán hàng khá ảm đạm từ thời điểm đầu năm, đồng tời cổ phiếu cũng kém hơn so với các công ty cùng ngành. Bởi thế, AI có thể xem như một "ván cược" của Apple để vực dậy doanh số lẫn giá trị cổ phiếu . Với các tính năng AI mới, có thể Apple sẽ khuyến khích người dùng có thêm nhu cầu nâng cấp phần cứng iPhone, iPad hay Macbook mới. Bởi thế, có thể các tính năng AI sẽ đòi hỏi phần cứng mới, thí dụ như cần ít nhất iPhone 15 Pro hoặc Mac chạy M1 trở lên mới hoạt động được.
Các tính năng của Siri “mới”
Cụ thể, hệ thống mới cho phép Siri dùng mô hình ngôn ngữ lớn LLM để hiểu được phần mềm đang chạy, hiểu được ngữ cảnh đang sử dụng của người dùng và từ đó, người dùng có thể yêu cầu Siri điều khiển được tất cả các tính năng trong phần mềm.
Nguồn tin giấu tên nói với Bloomberg rằng nhờ thuật toán LLM, Siri sẽ phân tích người dùng đang làm gì trên thiết bị và sẽ tự kích hoạt các tính năng điều khiển bằng Siri. Tính năng này lúc đầu sẽ hoạt động trên các ứng dụng của Apple với hàng trăm câu lệnh điều khiển.
Tuy nhiên, Siri mới sẽ được nâng cấp theo 2 giai đoạn. Đầu tiên thì nó sẽ vẫn chỉ hỗ trợ từng câu lệnh đơn lẻ, tới giai đoạn sau thì Apple mới tiếp tục nâng cấp nó để có thể hiểu được một chuỗi các lệnh nối tiếp nhau. Vậy là sau khi "hoàn thiện", người dùng có thể yêu cầu Siri tóm tắt một đoạn ghi âm cuộc họp, sau đó gởi tới các đồng nghiệp, hoặc, có thể yêu cầu iPhone crop một bức ảnh, sau đó email tới một người bạn chẳng hạn.
Thời điểm ra mắt và lúc chính thức đến tay người dùng
Nguồn tin nói rằng hiện Apple đang chuẩn bị demo một số tính năng tại sự kiện WWDC sắp tới, bao gồm chuyển đoạn ghi âm thành văn bản rồi tóm tắt, recap nhanh một trang web hoặc các thông báo, tự động phản hồi tin nhắn, chỉnh sửa ảnh chuyên sâu bằng AI, dùng AI tạo emoji. Phần lớn các tác vụ AI cơ bản sẽ hoạt động ngay trên thiết bị trong khi các khả năng chuyên sâu hơn sẽ cần đưa lên đám mây xử lý.
Về thời gian chính thức xài được. Theo thông lệ, WWDC sẽ là lúc Apple giới thiệu loạt tính năng mới xoay quanh AI trên nhiều nền tảng OS họ đang phát triển. Tuy nhiên chính thức ra mắt thì phải đợi tới tháng 9, khi iPhone 16 series ra mắt thì các tính năng này mới chính thức được đưa tới tay người dùng. Hiện vẫn chưa rõ là các tính năng này sẽ đều hỗ trợ các phần cứng cũ hay có yêu cầu chuyên biệt gì đòi hỏi phải xài trên phần cứng mới hay không.
Apple sẽ dùng OpenAI hoặc Gemini
Một thông tin cực quan trọng khác là Apple đang củng cố thỏa thuận với OpenAI để tích hợp công nghệ và chatbot vào iOS. Cách đây không lâu, một đoạn code rò rỉ trong iOS 17.4 cũng cho thấy việc Apple đang thử nghiệm tích hợp OpenAI vào Siri, cho phép người dùng truy vấn bằng prompt như các chatvot hiện tại. Tuy nhiên, cũng có nguồn tin nói rằng hiện Apple vẫn đang tiếp tục nói chuyện với Google để sử dụng Gemini trong tương lai. Người ta cho rằng Apple hiện vẫn tiếp tục phát triển rất nhiều tính năng AI cho các bản cập nhật phần trong năm nay.
Và dù Apple có chọn đối tác là OpenAI hay Google cho "bộ não" của Siri, thì chắc chắn, các đặc tính mới của Siri sẽ được "kế thừa" từ cách tiếp cận của các chatbot đa model này. Nói cách khác, Siri về bản chất sẽ là một Copilot như của Microsoft đang cho chạy trên Windows. Khác biệt duy nhất bây giờ là cách Apple làm UX và UI cho Siri dựa trên các tính năng nó như thế nào mà thôi. Quan trọng hơn, gần như chắc chắn, Siri mới sẽ hỗ trợ tiếng Việt như cách mà các mô hình ngôn ngữ lớn hiện tại vẫn đang hỗ trợ.
Các câu hỏi về tính bảo mật
Thông tin từ Bloomberg cho rằng cùng với các tính năng AI mới, Apple cũng sẽ nâng cấp các tính năng đảm bảo quyền riêng tư dữ liệu của người dùng. Cụ thể, sẽ có một tính năng mới gọi là "báo cáo thông minh" do hệ thống soạn ra cho người dùng biết được thông tin của họ đang được bảo vệ ra sao.
Đối với các tính năng AI cơ bản chạy hoàn toàn trên máy, tất nhiên thông tin cá nhân của người dùng vẫn sẽ được đảm bảo local. Trong khi đó các tác vụ chạy trên mây vẫn sẽ đòi một số thông tin người dùng chuyển đi server remote. Các thông tin này có thể sẽ được bảo vệ bằng một cái gọi là Secure Enclave trong các chip Apple Silicon chạy trên các trung tâm dữ liệu của Apple.
Ván cược AI của Apple
Dễ thấy, AI chắc chắn sẽ là tâm điểm mà Apple xoay quanh tại sự kiện WWDC sắp tới. Từ khi ra mắt hồi năm 2011 đến nay, Apple được cho là ngày càng tụt lại so với các đối thủ khác ở mảng trợ lý ảo giọng nói thông minh, điển hình như Google Assistant hay Alexa của Amazon. Bởi thế, lần nâng cấp lớn cho Siri sẽ là cách giúp Apple đỡ "bị bỏ lại" hơn ở thời điểm hiện tại so với các công ty khác trong ngành công nghiệp.
Apple hiện tại được cho là đang phải đối mặt với một số thách thức nhất định. Điển hình như doanh số bán hàng khá ảm đạm từ thời điểm đầu năm, đồng tời cổ phiếu cũng kém hơn so với các công ty cùng ngành. Bởi thế, AI có thể xem như một "ván cược" của Apple để vực dậy doanh số lẫn giá trị cổ phiếu . Với các tính năng AI mới, có thể Apple sẽ khuyến khích người dùng có thêm nhu cầu nâng cấp phần cứng iPhone, iPad hay Macbook mới. Bởi thế, có thể các tính năng AI sẽ đòi hỏi phần cứng mới, thí dụ như cần ít nhất iPhone 15 Pro hoặc Mac chạy M1 trở lên mới hoạt động được.