Trang chủ Kinh tế Công nghệ
11:01 | 28/12/2023 GMT+7

“ChatGPT phiên bản Việt” và câu chuyện của người tiên phong

aa
Chỉ 9 tháng sau khi ChatGPT ra mắt, đội ngũ kỹ sư VinBigdata (Tập đoàn Vingroup) đã làm chủ hoàn toàn mô hình ngôn ngữ lớn tiếng Việt và chính thức giới thiệu ViGPT - ChatGPT phiên bản Việt đầu tiên dành cho người dùng cuối vào tháng 12/2023. Sản phẩm nhanh chóng gây được tiếng vang trong cộng đồng khoa học công nghệ Việt Nam.
VinBigdata phát triển thành công công nghệ AI tạo sinh
VinBigdata ra mắt “ChatGPT" phiên bản Việt đầu tiên dành cho người dùng cuối

Chọn con đường khó để giải bài toán Việt

Vào cuối năm 2022, ChatGPT tạo nên một “cú nổ lớn”, mở ra cuộc đua chinh phục AI tạo sinh giữa các các quốc gia và ông lớn trong lĩnh vực công nghệ. Giới công nghệ Việt khi ấy cũng sục sôi mong muốn phát triển những sản phẩm của riêng người Việt để tự chủ về công nghệ, giảm thiểu sự phụ thuộc vào các sản phẩm quốc tế. Tuy nhiên, không phải đơn vị nào cũng đủ khả năng và quyết tâm hiện thực hóa mong muốn ấy như VinBigdata.

“AI tạo sinh là một bài toán khó. Các ông lớn như OpenAI hay Google cũng phải đổ rất nhiều nguồn lực và thời gian vào nghiên cứu mới có thể tạo ra những sản phẩm như chúng ta thấy. Các sản phẩm này đã rất tốt, nhưng thật ra các nhà khoa học cũng vẫn chưa hoàn toàn hiểu cơ cấu hoạt động của nó. Khi nào nó có lỗi, và lỗi sẽ như thế nào ít ai đoán trước được. Để phát triển một sản phẩm tương tự ChatGPT dành cho người Việt, trong thời gian ngắn chưa tới một năm, thì rất nhiều thử thách. Nhưng chúng tôi đã lựa chọn "liều" vì một phiên bản ChatGPT tiếng Việt nếu không phải người Việt làm thì ai làm- GS. Vũ Hà Văn, Giám đốc khoa học VinBigdata chia sẻ.

“ChatGPT phiên bản Việt” và câu chuyện của người tiên phong
GS. Vũ Hà Văn, Giám đốc khoa học VinBigdata.

Thực tế, rất ít công ty lựa chọn xây dựng Mô hình ngôn ngữ lớn của riêng mình từ đầu. Như GPT 3 của OpenAI có 175 tỷ tham số và được đào tạo trên bộ dữ liệu 45 terabyte và tiêu tốn 4,6 triệu USD. Thậm chí, theo tính toán, số tiền để phát triển GPT 4 có thể lên tới 100 triệu USD. “Với những con số khổng lồ như thế, rất khó để tìm được một công ty nào đủ sức đầu tư cho công nghệ này”, TS. Nguyễn Kim Anh, Giám đốc Sản phẩm VinBigdata nói.

Để các doanh nghiệp Việt Nam có thể tiếp cận với công nghệ AI thế hệ mới, với chi phí và hạ tầng tối ưu, VinBigdata lựa chọn một hướng đi hoàn toàn khác biệt, đó là tạo ra một mô hình ngôn ngữ chỉ với 1,6 tỷ tham số, nhưng có khả năng tương đương với những mô hình ngôn ngữ lớn có nhiều tỷ tham số.“Kết quả cho thấy, với kiến trúc do chính VinBigdata tự phát triển hoàn toàn có thể tối ưu và đẩy nhanh quá trình huấn luyện mô hình ngôn ngữ, giảm chi phí hạ tầng (bao gồm chi phí huấn luyện và chi phí sử dụng), nhưng vẫn đảm bảo chất lượng của mô hình”, TS. Nguyễn Kim Anh cho biết thêm.

“ChatGPT phiên bản Việt” và câu chuyện của người tiên phong
“ChatGPT phiên bản Việt” và câu chuyện của người tiên phong

Sau khi giải quyết bài toán về kích thước mô hình ngôn ngữ lớn, trong quá trình “thai nghén” ViGPT, sau khi nghiên cứu các mô hình của nước ngoài, đội ngũ VinBigdata còn nhận ra một thử thách khác là “tính ảo giác”, đến từ bản chất cố hữu của mô hình xác suất thống kê.

Theo đó, các mô hình ngôn ngữ lớn trên thế giới thường được huấn luyện bằng các nguồn dữ liệu tiếng Anh. Do đó, mô hình này chưa thực sự hiểu và phản ứng đúng với ngữ cảnh và văn hóa của người Việt. Điều này dẫn đến tình trạng ảo giác (hallucination) khiến mô hình ngôn ngữ lớn “bịa đặt” ra câu trả lời không chính xác.

Để tìm ra lời giải tối ưu trong thời gian ngắn nhất, đội ngũ Xử lý ngôn ngữ tự nhiên (NLP) của VinBigdata được chia thành các nhóm nhỏ, cùng phân tích, bàn bạc các ý tưởng khác nhau để tìm hướng đi cuối cùng phù hợp nhất.

Sau cùng, chúng tôi quyết định phát triển kiến trúc khác so với phần lớn mô hình ngôn ngữ lớn hiện tại, đồng thời tiến hành đào tạo trên bộ 600GB dữ liệu tiếng Việt tinh chỉnh, nhằm tạo ra một “trợ lý ảo thông minh” có khả năng hiểu và đưa ra câu trả lời theo ngữ cảnh của người Việt”, TS. Nguyễn Kim Anh nói thêm.

Khát vọng một hệ sinh thái công nghệ Việt

Theo kết quả đánh giá từ Bộ Tiêu chuẩn đánh giá năng lực tiếng Việt (VMLU) ViGPT đạt điểm trung bình là 42.24%, đứng thứ hai chỉ sau ChatGPT (48.54%). Kết quả này cho phép ViGPT tìm kiếm thông tin, giải đáp câu hỏi về các chủ đề đặc trưng, đặc thù của Việt Nam một cách nhanh chóng.

“ChatGPT phiên bản Việt” và câu chuyện của người tiên phong
“ChatGPT phiên bản Việt” và câu chuyện của người tiên phong

Bên cạnh năng lực của trợ lý ảo, điều đội ngũ phát triển mong muốn là tích hợp ViGPT vào các sản phẩm gần gũi, sử dụng hàng ngày, nhằm tạo ra sự thay đổi trong cuộc sống của người Việt. Đó chính là động lực thôi thúc đội ngũ VinBigdata xây dựng một hệ sinh thái các sản phẩm ngôn ngữ và tiếng nói ứng dụng ViGPT - Hệ sinh thái “Vi” bao gồm: ViChat, ViVoice, Trợ lý ảo ViVi. Các sản phẩm này có thể sử dụng cho đa ngành nghề, từ công nghiệp ô tô, ngân hàng - tài chính, bảo hiểm đến giao thông vận tải và nhiều lĩnh vực khác.

“Khi làm công nghệ, nhất là AI, chúng tôi không chỉ muốn chinh phục những hệ thống hay, phức tạp mà khó nhìn thấy. Chúng tôi muốn tạo ra những sản phẩm hữu hình, có tính ứng dụng cao, mà ở đó, AI là tác nhân trực tiếp tạo ra những thay đổi trong cuộc sống”, Giám đốc Sản phẩm VinBigdata khẳng định.

Do đó, phát triển thành công ViGPT mới chỉ là bước đầu tiên trong hành trình đưa công nghệ và dữ liệu “thuần Việt” phục vụ cuộc sống của hàng triệu người dân Việt Nam. Đại diện VinBigdata cho biết, đơn vị này đặt mục tiêu tích hợp ViGPT vào nền tảng trí tuệ nhân tạo đa nhận thức VinBase 2.0, nhằm cung cấp các giải pháp vượt trội cho hệ thống tổ chức, doanh nghiệp ở đa dạng quy mô, ngành nghề.

Trước ViGPT, đội ngũ chuyên gia, kỹ sư trong lĩnh vực công nghệ xử lý ngôn ngữ và tiếng nói VinBigdata đã ghi dấu ấn với việc cho ra mắt ViVi - trợ lý ảo tiếng Việt toàn diện đầu tiên (được ứng dụng và triển khai trên các dòng ô tô điện VinFast, ứng dụng cư dân Vinhomes Resident và sàn thương mại điện tử Vinhomes Online), đồng thời, làm chủ hoàn toàn những công nghệ tiên tiến nhất trên thế giới như Sinh trắc học giọng nói (Voice Biometrics) hay Nhân bản giọng nói (Voice Cloning).

Tất cả những công nghệ này đều được phát triển dựa trên cơ sở dữ liệu 3.500 terabyte, tập trung chủ yếu vào dữ liệu đặc thù của người Việt, do VinBigdata thu thập, phân tích và tinh chỉnh. Mục tiêu sau cùng là làm sao mang công nghệ thế giới, chạm tới cuộc sống Việt, bằng chính dữ liệu và hệ tri thức của người Việt.

ViGPT là “ChatGPT phiên bản Việt" đầu tiên dành cho người dùng cuối được xây dựng dựa trên mô hình ngôn ngữ lớn tiếng Việt (LLM) do VinBigdata phát triển. ViGPT sở hữu những tính năng vượt trội và thiết kế phù hợp nhất với nhu cầu sử dụng của người Việt như sáng tạo nội dung, tìm kiếm thông tin, giải đáp các câu hỏi thường thức mang đặc trưng của Việt Nam. Đăng ký và trải nghiệm ViGPT tại: vigpt.vinbigdata.com
Vinbigdata công bố kết quả cuộc thi toàn cầu về ứng dụng ai trong phân tích hình ảnh y tế trị giá 50.000 usd Vinbigdata công bố kết quả cuộc thi toàn cầu về ứng dụng ai trong phân tích hình ảnh y tế trị giá 50.000 usd
Ngày 7/4/2021, Viện Nghiên cứu Dữ liệu lớn VinBigdata (Tập đoàn Vingroup) công bố kết quả của Cuộc thi Ứng dụng AI phát hiện điểm bất thường trên ảnh X-quang lồng ngực với tổng giải thưởng trị giá 50.000 USD. Đây là cuộc thi có quy mô dữ liệu đặc trưng người Việt lớn nhất thế giới, thu hút 1.277 đội thi đến từ hơn 60 quốc gia và vùng lãnh thổ.
Trợ lý ảo ViVi được vinh danh Sản phẩm công nghệ tiềm năng 2022 Trợ lý ảo ViVi được vinh danh Sản phẩm công nghệ tiềm năng 2022
Ngày 7/1/2022, Sản phẩm Trợ lý ảo ViVi của Công ty cổ phần VinBigData (Tập đoàn Vingroup) vừa được vinh danh là Sản phẩm công nghệ tiềm năng 2022 tại Lễ trao giải Tech Awards 2021. ViVi cũng là thương hiệu phần mềm duy nhất được vinh danh tại Hạng mục Sản phẩm công nghệ tiềm năng.
PV
Nguồn:

Tin bài liên quan

AI tạo sinh “thuần Việt” và cơ hội vàng để nền kinh tế bứt tốc

AI tạo sinh “thuần Việt” và cơ hội vàng để nền kinh tế bứt tốc

Công nghệ AI tạo sinh “thuần Việt" đang ngày càng được ứng dụng rộng rãi trong các tổ chức và doanh nghiệp, mang tới cơ hội bứt phá cho nhiều lĩnh vực.
Công nghệ xác thực khuôn mặt - “Tấm khiên” chống giả mạo danh tính

Công nghệ xác thực khuôn mặt - “Tấm khiên” chống giả mạo danh tính

Kết hợp phương pháp xác thực dữ liệu sinh trắc khuôn mặt với giải pháp Vizone Access tích hợp công nghệ xác minh thực thể sống (do Công ty VinBigdata phát triển) khi giao dịch trực tuyến, khách hàng sẽ được bảo vệ tối đa trước những phương thức giả mạo danh tính tinh vi và tiết kiệm thời gian thực hiện thao tác.
VinBigdata khẳng định chỗ đứng của AI Việt trên thế giới

VinBigdata khẳng định chỗ đứng của AI Việt trên thế giới

Liên tiếp những thành tựu được đánh giá cao của VinBigdata tại Việt Nam và quốc tế đã cho thấy năng lực của đội ngũ nghiên cứu khoa học cũng như chất lượng công nghệ ở sản phẩm “made in Vietnam”.

Các tin bài khác

MB đón Thủ tướng tham quan không gian công nghệ tại Sự kiện Chuyển đổi số 2025

MB đón Thủ tướng tham quan không gian công nghệ tại Sự kiện Chuyển đổi số 2025

Tại Hà Nội, ngày 29/05/2025, Ngân hàng TMCP Quân đội (MB) đã tham gia sự kiện Chuyển đổi số ngành Ngân hàng 2025 do Ngân hàng Nhà nước Việt Nam tổ chức với chủ đề "Hệ sinh thái số thông minh trong kỷ nguyên mới".
Tài xế taxi điện: Yên tâm vì thu nhập hấp dẫn, nhiều khách hàng trung thành

Tài xế taxi điện: Yên tâm vì thu nhập hấp dẫn, nhiều khách hàng trung thành

Các tài xế của Xanh SM đang có thu nhập tốt nhờ lượng khách đông, ổn định, chi phí vận hành thấp. Với mức lương, thưởng hấp dẫn, mô hình taxi điện đang trở thành lựa chọn lý tưởng cho những ai muốn tối ưu thu nhập trong ngành dịch vụ vận tải.
Trường Cao đẳng Nghề Cần Thơ đạt giải nhất Hội thi thiết bị đào tạo tự làm năm 2024

Trường Cao đẳng Nghề Cần Thơ đạt giải nhất Hội thi thiết bị đào tạo tự làm năm 2024

Chiều 27/9, Sở Lao động - Thương binh và Xã hội thành phố Cần Thơ tổ chức tổng kết Hội thi thiết bị đào tạo tự làm năm 2024.
Gần 170 nhà giáo tham gia Hội thi thiết bị đào tạo tự làm tại Cần Thơ

Gần 170 nhà giáo tham gia Hội thi thiết bị đào tạo tự làm tại Cần Thơ

Ngày 24/9, Sở Lao động - Thương binh và Xã hội thành phố Cần Thơ phối hợp Trường Cao đẳng Nghề thành phố tổ chức Hội thi thiết bị đào tạo tự làm thành phố Cần Thơ năm 2024.

Đọc nhiều

Tin quốc tế ngày 19/11: Nhật Bản cảnh báo công dân tại Trung Quốc, Campuchia đã bắt được nhóm phạm nhân dùng súng tẩu thoát

Tin quốc tế ngày 19/11: Nhật Bản cảnh báo công dân tại Trung Quốc, Campuchia đã bắt được nhóm phạm nhân dùng súng tẩu thoát

Đài Loan (Trung Quốc) phát sổ tay hướng dẫn sinh tồn cho 23 triệu dân; Nhật Bản cảnh báo công dân tại Trung Quốc; Mỹ đứng đầu danh sách vay nợ Trung Quốc; Campuchia đã bắt được nhóm phạm nhân dùng súng tẩu thoát giữa sân tòa án... là tin tức quốc tế đáng chú ý ngày 19/11.
Trao tặng 12 tivi cùng nhiều phần quà ý nghĩa cho trường Tiểu học Chu Phan, Hà Nội

Trao tặng 12 tivi cùng nhiều phần quà ý nghĩa cho trường Tiểu học Chu Phan, Hà Nội

Ngày 18/11/2025, tại Hà Nội, Hiệp hội Công nghệ Mua sắm Công (Hàn Quốc) phối hợp cùng Doanh nghiệp Xã hội Cánh Diều Việt Nam, tổ chức ChorogUsan for Children (Hàn Quốc) và Ban Giám hiệu Trường Tiểu học Chu Phan đã tổ chức chương trình trao tặng trang thiết bị và học bổng cho học sinh tại xã Yên Lãng, thành phố Hà Nội.
“Trình độ duy nhất cần có trong cảm thụ nghệ thuật đó là tự do”

“Trình độ duy nhất cần có trong cảm thụ nghệ thuật đó là tự do”

Nguyễn Như Huy gửi một lời chia tay tạm thời với công việc của một giám tuyển qua triển lãm Bắt mặt. Vậy, ở triển lãm này, từ gương mặt bản thân luôn biến dạng, từ những giọt nước mắt trong bể khổ trầm luân, nghệ sỹ muốn bày tỏ suy tư gì với công chúng? Thời Đại đã có cuộc trao đổi với tác giả.
Trao Giải thưởng Hòa bình Romesh Chandra cho bà Nguyễn Thị Bình và ông Uông Chu Lưu

Trao Giải thưởng Hòa bình Romesh Chandra cho bà Nguyễn Thị Bình và ông Uông Chu Lưu

Ngày 18/11 tại Hà Nội, Liên hiệp các tổ chức hữu nghị Việt Nam phối hợp Tổ chức Hòa bình và Đoàn kết toàn Ấn Độ (AIPSO) trao Giải thưởng Hòa bình Romesh Chandra cho bà Nguyễn Thị Bình, nguyên Ủy viên Trung ương Đảng, nguyên Phó Chủ tịch nước, Chủ tịch danh dự Quỹ Hòa bình và Phát triển Việt Nam (nay là Hội đồng Hòa bình và Phát triển Việt Nam) và ông Uông Chu Lưu, nguyên Ủy viên Trung ương Đảng, nguyên Phó Chủ tịch Quốc hội, Chủ tịch Ủy ban Hòa bình Việt Nam nhằm ghi nhận những đóng góp nổi bật của các cá nhân Việt Nam đối với phong trào hòa bình và đoàn kết quốc tế.
Hơn 300 chiến sĩ Hải quân cơ động giúp nhân dân ngay trong đêm

Hơn 300 chiến sĩ Hải quân cơ động giúp nhân dân ngay trong đêm

Trong đêm 19/11, Vùng 4 Hải quân và Học viện Hải quân đã khẩn trương điều động hơn 300 cán bộ, chiến sĩ cùng nhiều trang bị, phương tiện cứu hộ và nhu yếu phẩm tham gia hỗ trợ nhân dân trước diễn biến mưa lớn kéo dài gây ngập sâu tại nhiều địa phương trong tỉnh Khánh Hòa.
Ký kết biên bản phối hợp bảo vệ biên giới giữa Quảng Trị và Savannakhet

Ký kết biên bản phối hợp bảo vệ biên giới giữa Quảng Trị và Savannakhet

Ngày 19/11 tại thành phố Cayson Phomvihan (tỉnh Savannakhet, Lào), đoàn công tác Bộ đội Biên phòng (BĐBP) thuộc Bộ Chỉ huy Quân sự (CHQS) tỉnh Quảng Trị đã tiến hành thăm, hội đàm thường niên và ký kết biên bản phối hợp bảo vệ biên giới năm 2025 với Bộ Chỉ huy Quân sự tỉnh Savannakhet.
Lào Cai - Vân Nam: đẩy mạnh các hoạt động giao lưu nhằm tăng cường tình đoàn kết hữu nghị

Lào Cai - Vân Nam: đẩy mạnh các hoạt động giao lưu nhằm tăng cường tình đoàn kết hữu nghị

Ngày 18/11, tại Lào Cai đã có tổ chức Hội đàm nghiệp vụ công tác Biên phòng quý 3 năm 2025 giữa Đoàn đại biểu 4 Đồn Biên phòng thuộc bộ đội biên phòng (BĐBP) tỉnh Lào Cai và Đoàn đại biểu Trạm kiểm tra Biên phòng xuất nhập cảnh Hà Khẩu, trực thuộc Tổng Trạm kiểm tra Biên phòng xuất nhập cảnh tỉnh Vân Nam (Trung Quốc). Hai bên cùng nhất trí đẩy mạnh các hoạt động giao lưu văn hóa, văn nghệ, thể dục, thể thao nhân các ngày lế lớn của hai bên nhằm tăng cường tình đoàn kết hữu nghị, hiểu biết lẫn nhau.
infographic lich su hinh thanh va phat trien lien hiep cac to chuc huu nghi viet nam
infographic 10 thang nam 2025 ha noi don 2822 trieu luot khach du lich
infographic quan he huu nghi truyen thong va hop tac nhieu mat viet nam phan lan
quan he huu nghi truyen thong viet nam trieu tien
infographic khuyen cao ve chieu tro gia danh cong an de lua dao
infographic chien dich tu hao viet nam nhuom do khong gian mang chao mung quoc khanh 29
infographic 7 thang nam 2025 ha noi don 1836 trieu luot khach du lich
Xin chờ trong giây lát...
[Video] Ấn Độ tặng Giải thưởng Hòa bình Romesh Chandra cho bà Nguyễn Thị Bình
[Video] Lễ dâng y Kathina tại Đà Nẵng: Sợi dây gắn kết Phật giáo các nước châu Á
Cả nước hướng về Thái Nguyên: Chung tay giúp người dân vượt qua mưa lũ
Trailer lễ hội Văn hóa Thế giới tại Hà Nội lần thứ nhất
[Video] Không khí rộn ràng ngày khai giảng năm học mới trên cả nước
[Video] Petr Tsvetov: Việt Nam ấm áp và thân thuộc
Việt Nam - Cuba: 65 năm cùng chung nhịp đập
[Video] Thiếu tướng Lào kể chuyện nhân dân Việt Nam che chở giữa mưa bom 1972
[Video] Bạn bè quốc tế gửi lời chúc tới nhân dân Việt Nam
[Video] Nhiều hoạt động cứu trợ người dân Nghệ An bị lũ lụt
[Video] Người truyền cảm hứng về tình yêu nước
Sinh viên Lào đi chùa tắm Phật mừng Tết cổ truyền Bunpimay
[Video] 60 phút - Hành trình thay đổi cuộc đời
MV "Bắc Bling": Cụ già, em nhỏ ngân nga, du khách gần xa tỏ bày hứng thú
[Video] Dự án CAF: Ươm mầm những công dân toàn cầu tương lai
Phiên bản di động