[Phỏng vấn] AI nhanh, nhẹ, và tích hợp trên thiết bị: Cách Samsung Research phát triển các tính năng AI dịch thuật theo thời gian thực

Các thiết bị di động được trang bị Galaxy AI của Samsung Electronics đã mang đến trải nghiệm giao tiếp liền mạch và không rào cản cho người dùng ở nhiều quốc gia hơn. Hiện nay, tính năng Trợ lý phiên dịch và Phiên dịch trực tiếp của Galaxy AI đã bổ sung thêm tiếng Ả Rập, tiếng Indonesia và tiếng Nga, nâng tổng số ngôn ngữ được hỗ trợ từ 13 lên 16 ngôn ngữ.

 

Trong quá trình phát triển, Samsung Research đã kết hợp kho dữ liệu khổng lồ với công nghệ tiên tiến của hãng. Cùng với Bộ phận Nghiên cứu & Phát triển (R&D) của Ngành hàng Trải nghiệm Di động (MX), họ đã tinh chỉnh và nâng cấp công nghệ này nhằm phát triển các tính năng dịch thuật bằng AI trên thiết bị, có thể được sử dụng để dịch thuật theo thời gian thực trong cuộc gọi và trên nhiều ứng dụng khác.. Để khám phá sâu hơn về những tính năng đầy triển vọng này, Samsung Newsroom đã có cuộc trò chuyện với Yoonjung Choi và Yonghyun Ryu từ Trung tâm AI Toàn cầu của Samsung Research.

 

▲ (Từ trái) Yoonjung Choi và Yonghyun Ryu đến từ Trung tâm AI Toàn cầu của Samsung Research

 

Giao tiếp liền mạch và bảo mật mạnh mẽ với AI trên thiết bị

Việc tích hợp AI trên thiết bị đã mang đến sự đột phá cho các tính năng Trợ lý phiên dịch và Phiên dịch trực tiếp của Galaxy AI đã được giới thiệu tới người dùng qua Galaxy S24 series ra mắt đầu năm nay. Nhờ sức mạnh tính toán mạnh mẽ được tích hợp sẵn trong thiết bị, các sản phẩm điện thoại thông minh được trang bị AI trên thiết bị có thể cung cấp dịch vụ trực tiếp mà không cần phải phụ thuộc vào máy chủ hay điện toán đám mây. Vì vậy, người dùng có thể yên tâm rằng dữ liệu của họ sẽ được bảo mật tuyệt đối vì thông tin sẽ không được chia sẻ với bên ngoài.

 

Trung tâm AI Toàn cầu của Samsung Research đã đóng góp vào việc tích hợp công nghệ độc quyền vào mô hình dịch thuật AI nhằm thương mại hóa các tính năng này để sử dụng rộng rãi.

Trong quá trình xây dựng một loạt các ứng dụng rộng rãi, nhóm Samsung Research và Phòng R&D Ngành hàng MX đã thu thập một lượng dữ liệu khổng lồ. Yoonjung Choi, Giám đốc dự án, giải thích: “Chúng tôi đã thu thập dữ liệu từ các cuộc đối thoại thông thường để phục vụ cho việc phiên dịch theo thời gian thực trong các cuộc gọi với tính năng Phiên Dịch Trực tiếp, cũng như các dữ liệu liên quan đến du lịch để hỗ trợ tính năng Trợ lý phiên dịch. Nhằm cung cấp bản dịch chính xác nhất, chúng tôi đã nghiên cứu và tích hợp ngôn ngữ phổ thông được sử dụng trong các cuộc trò chuyện trực tuyến và các thẻ HTML thường được sử dụng trong trình duyệt web.”

 

▲ Các tình huống sử dụng tính năng dịch AI trên thiết bị bao gồm ① Phiên dịch trực tiếp, ② Dịch tin nhắn văn bản và hội thoại, ③ Dịch ghi chú trong Samsung Notes và ④ Dịch trình duyệt web.

Cách Samsung Research huấn luyện mô hình AI

Đội ngũ Samsung Research đã phát triển mô hình dịch thuật AI dựa trên công nghệ học sâu, có khả năng tự học hỏi và cải thiện từ chính dữ liệu của nó. Yonghyun Ryu, người chịu trách nhiệm về việc nghiên cứu và phát triển AI, đã so sánh quá trình này như việc nuôi dạy một đứa trẻ. Ông mô tả: “Tương tự như cách một đứa trẻ cần có sự giáo dục xuất sắc và người chăm sóc tận tình để trưởng thành và phát triển toàn diện, việc xây dựng mô hình dịch thuật AI hiệu suất cao cũng đòi hỏi nguồn dữ liệu ngôn ngữ chất lượng và đội ngũ nhà nghiên cứu tài năng”.

 

Samsung Research đã tạo dựng sự đột phá trong lĩnh vực dịch thuật AI nhờ sự kết hợp hoàn hảo giữa hai yếu tố trên. Kể từ năm 2013, Samsung đã cung cấp dịch vụ dịch thuật nội bộ, tiến hành nghiên cứu và phát triển liên quan đến dịch thuật AI và tích lũy dữ liệu chất lượng cao.

Đội ngũ chuyên gia về mô hình học sâu của Samsung Research đóng vai trò rất quan trọng trong việc huấn luyện mô hình AI. Ông giải thích: “Nếu xảy ra lỗi dịch thuật trong quá trình nghiên cứu và phát triển thì cần xác định vấn đề và tiến hành cải thiện. Tuy nhiên, điều này là một thách thức và đòi hỏi cần có nhiều thời gian đối với các nhà nghiên cứu không có đủ khả năng và kinh nghiệm. Các nhà nghiên cứu của chúng tôi đã sử dụng chuyên môn và kinh nghiệm của họ để nhanh chóng phân tích nguyên nhân của vấn đề và đưa ra giải pháp nhằm nâng cao mô hình dịch thuật AI”.

 

▲ Yonghyun Ryu thuộc Trung tâm AI toàn cầu của Samsung Research

Để đánh giá hiệu suất dịch thuật của Galaxy AI, Samsung Research đã sử dụng hai phương pháp chính: số liệu định lượng dựa trên các bộ dữ liệu thử nghiệm và đánh giá định tính từ các nhà dịch thuật và phòng R&D MX.

 

Ngoài ra, nhóm nghiên cứu còn tham gia các cuộc thi dịch máy uy tín trên toàn cầu để khẳng định năng lực và độ tin cậy. “Mặc dù việc tham gia đòi hỏi thời gian và công sức nhưng thành tích tốt trong các cuộc thi sẽ tạo động lực cho hoạt động nghiên cứu và phát triển hơn”. Ông Ryu chia sẻ thêm: “Nhóm chúng tôi cũng đạt được những kết quả ấn tượng và đáng tự hào khi làm việc trong môi trường cởi mở, khuyến khích thảo luận và thử nghiệm các ý tưởng mới”.

 

Thấu Hiểu nét Độc Đáo Của từng Ngôn Ngữ Qua Phép lịch sự và Từng Chấm Câu

Mỗi ngôn ngữ đều phản ánh nét đặc trưng văn hóa riêng biệt, thể hiện qua cách sử dụng kính ngữ, ngữ điệu và cả dấu câu đặc trưng. Để tối ưu hóa độ chính xác khi dịch thuật, mô hình dịch thuật AI của Samsung cần cân nhắc tất cả những nét đặc thù ngôn ngữ này. Ví dụ, khi dịch từ tiếng Hàn hay tiếng Nhật, kính ngữ sẽ được giữ nguyên để đảm bảo sự tôn trọng và lịch sự.

 

Vì thế, Samsung đã hợp tác với các trung tâm R&D địa phương để hiểu đầy đủ về bối cảnh văn hóa của các ngôn ngữ. Choi cho biết: “Bằng cách hợp tác chặt chẽ với các nhà nghiên cứu và chuyên gia ngôn ngữ học ở các quốc gia khác nhau, chúng tôi có thể cung cấp bản dịch chính xác và toàn diện hơn”.

Đồng thời, việc xử lý các ngôn ngữ khác nhau thường đòi hỏi quá trình thử nghiệm và sửa lỗi liên tục. “Ví dụ, tiếng Việt là một ngôn ngữ có thanh điệu. Tuy nhiên, trong quá trình nghiên cứu, chúng tôi nhận thấy người dùng Việt Nam thường bỏ qua âm điệu trong các cuộc hội thoại thông thường”, cô giải thích. “Do đó, chúng tôi cần tổng hợp thêm dữ liệu để giúp các tính năng có thể dịch các câu không mang âm điệu.” Đối với tiếng Thái, nhóm nghiên cứu của Samsung đã phát triển một bộ tách câu đặc biệt vì ngôn ngữ này không sử dụng dấu câu.

 

Vì sao Công Nghệ Gọn Nhẹ Lại Là Chìa Khóa tăng tính hiệu quả cho Các Mô Hình AI Trên Thiết Bị

Nhóm Samsung Research bắt đầu phát triển mô hình dịch thuật AI trên thiết bị vào năm 2019. Ông Ryu – đại diện nhóm nghiên cứu cho biết: “Khác với các mô hình AI dựa trên máy chủ, các mô hình AI trên thiết bị chỉ được vận hành bằng tài nguyên có sẵn trên thiết bị của người dùng. Do đó, việc phát triển công nghệ gọn nhẹ, sử dụng tối thiểu tài nguyên là điều then chốt.” Để giảm kích thước của mô hình, nhóm nghiên cứu đã sử dụng công nghệ “chắt lọc kiến thức” và “lượng tử hóa”.

 

Có thể hình dung phương pháp chắt lọc kiến thức là một giáo viên giàu kinh nghiệm với lượng kiến thức lớn. Giáo viên này sẽ tóm tắt kiến thức then chốt và truyền đạt sang cho học sinh một cách súc tích hơn nhưng vẫn đảm bảo tính hiệu quả.  

Lượng tử hóa là phương pháp đơn giản hóa các thuật toán AI để giảm kích thước mô hình và tối ưu hóa quy trình nhằm tăng tốc độ xử lý, phản hồi.

 

Ông Ryu so sánh lượng tử hóa với việc vẽ quả dâu tây: “Để vẽ một quả dâu tây trông giống như thật, bạn cần nhiều màu sắc khác nhau – nhưng bạn cũng có thể vẽ với màu đỏ và xanh lá cây. Lượng tử hóa là quá trình giảm thiểu số lượng màu cần thiết để vẽ dâu tây, trong khi vẫn giữ được hình vẽ giống với thực tế nhất có thể.”

 

▲ Yoonjung Choi từ Trung tâm AI toàn cầu của Samsung Research

 

Trong lĩnh vực AI, chắt lọc và lượng tử hóa kiến thức là những phương pháp nổi tiếng để làm cho mô hình trở nên nhẹ hơn. Tuy nhiên, việc triển khai chúng ở quy mô thương mại không hề dễ dàng do sự khác biệt trong phương pháp và yếu tố thử nghiệm chi tiết của mỗi nhóm nghiên cứu. Nhóm nghiên cứu Samsung đã phát triển công nghệ độc quyền nhờ việc khám phá kỹ thuật lượng tử hóa hiệu quả và từ đó tạo ra thuật toán tăng tốc. Cô Choi nhận xét: “Qua thử nghiệm liên tục, chúng tôi đã tìm ra cách tối ưu để làm cho mô hình nhẹ hơn”.

 

Thông qua việc kết hợp mô hình dịch thuật AI chất lượng cao với các thuật toán giúp mô hình nhẹ hơn và tăng tốc độ phản hồi, các tính năng AI trên thiết bị nhẹ và nhanh đã ra đời.

 

Nền văn hóa ẩn sau ngôn ngữ: Thế nào là một mô hình dịch thuật AI hoàn hảo?

Các nhà nghiên cứu tại Trung tâm AI Toàn cầu của Samsung Research không chỉ đơn thuần hướng đến việc phát triển một công cụ dịch thuật trên thiết bị. Cô Choi chia sẻ: “Mục tiêu cuối cùng của tôi là giúp người dùng giao tiếp trôi chảy và thuận tiện với những người nói ngôn ngữ khác”. Ông Ryu tiết lộ thêm về tầm nhìn của bản thân trong việc xây dựng một công cụ phiên dịch hoàn hảo. Ông bày tỏ: “Một ngày nào đó, chúng tôi muốn tạo ra một công cụ phiên dịch hiểu được ý đồ giao tiếp của người dùng cũng như thực sự hiểu được nền văn hóa đằng sau ngôn ngữ được dịch. Tôi muốn thử thách bản thân để phát triển một công cụ phiên dịch chưa từng có trên thế giới.”

 

▲ Nhóm Trung tâm AI Toàn cầu của Samsung Research đã phát triển tính năng dịch AI trên thiết bị.

Samsung mang đến cho người dùng các tính năng dịch thuật AI được tích hợp ngay trên thiết bị của Samsung. Nhờ vậy, bất kỳ ai có thiết bị di động được hỗ trợ tính năng này đều có thể giao tiếp một cách dễ dàng — mà không phải lo lắng về việc kết nối Internet hoặc rò rỉ thông tin. Trong tương lai, Samsung Research sẽ không ngừng nỗ lực để tiếp tục dẫn đầu trong việc đem lại những đổi mới trong lĩnh vực AI và mang lại trải nghiệm tốt nhất cho người dùng.

:

Công nghệDi độngGalaxy AIGalaxy S24 SeriesInterpreterLive TranslateOn-Device AISamsung Research
Last version finder