Trang chủ Kinh tế Công nghệ

11:01 | 28/12/2023 GMT+7

“ChatGPT phiên bản Việt” và câu chuyện của người tiên phong

PV

Chỉ 9 tháng sau khi ChatGPT ra mắt, đội ngũ kỹ sư VinBigdata (Tập đoàn Vingroup) đã làm chủ hoàn toàn mô hình ngôn ngữ lớn tiếng Việt và chính thức giới thiệu ViGPT - ChatGPT phiên bản Việt đầu tiên dành cho người dùng cuối vào tháng 12/2023. Sản phẩm nhanh chóng gây được tiếng vang trong cộng đồng khoa học công nghệ Việt Nam.

VinBigdata phát triển thành công công nghệ AI tạo sinh
VinBigdata ra mắt “ChatGPT" phiên bản Việt đầu tiên dành cho người dùng cuối

VinBigdata phát triển thành công công nghệ AI tạo sinh

VinBigdata ra mắt “ChatGPT" phiên bản Việt đầu tiên dành cho người dùng cuối

Chọn con đường khó để giải bài toán Việt

Vào cuối năm 2022, ChatGPT tạo nên một “cú nổ lớn”, mở ra cuộc đua chinh phục AI tạo sinh giữa các các quốc gia và ông lớn trong lĩnh vực công nghệ. Giới công nghệ Việt khi ấy cũng sục sôi mong muốn phát triển những sản phẩm của riêng người Việt để tự chủ về công nghệ, giảm thiểu sự phụ thuộc vào các sản phẩm quốc tế. Tuy nhiên, không phải đơn vị nào cũng đủ khả năng và quyết tâm hiện thực hóa mong muốn ấy như VinBigdata.

“AI tạo sinh là một bài toán khó. Các ông lớn như OpenAI hay Google cũng phải đổ rất nhiều nguồn lực và thời gian vào nghiên cứu mới có thể tạo ra những sản phẩm như chúng ta thấy. Các sản phẩm này đã rất tốt, nhưng thật ra các nhà khoa học cũng vẫn chưa hoàn toàn hiểu cơ cấu hoạt động của nó. Khi nào nó có lỗi, và lỗi sẽ như thế nào ít ai đoán trước được. Để phát triển một sản phẩm tương tự ChatGPT dành cho người Việt, trong thời gian ngắn chưa tới một năm, thì rất nhiều thử thách. Nhưng chúng tôi đã lựa chọn "liều" vì một phiên bản ChatGPT tiếng Việt nếu không phải người Việt làm thì ai làm” - GS. Vũ Hà Văn, Giám đốc khoa học VinBigdata chia sẻ.

“ChatGPT phiên bản Việt” và câu chuyện của người tiên phong

GS. Vũ Hà Văn, Giám đốc khoa học VinBigdata.

Thực tế, rất ít công ty lựa chọn xây dựng Mô hình ngôn ngữ lớn của riêng mình từ đầu. Như GPT 3 của OpenAI có 175 tỷ tham số và được đào tạo trên bộ dữ liệu 45 terabyte và tiêu tốn 4,6 triệu USD. Thậm chí, theo tính toán, số tiền để phát triển GPT 4 có thể lên tới 100 triệu USD. “Với những con số khổng lồ như thế, rất khó để tìm được một công ty nào đủ sức đầu tư cho công nghệ này”, TS. Nguyễn Kim Anh, Giám đốc Sản phẩm VinBigdata nói.

Để các doanh nghiệp Việt Nam có thể tiếp cận với công nghệ AI thế hệ mới, với chi phí và hạ tầng tối ưu, VinBigdata lựa chọn một hướng đi hoàn toàn khác biệt, đó là tạo ra một mô hình ngôn ngữ chỉ với 1,6 tỷ tham số, nhưng có khả năng tương đương với những mô hình ngôn ngữ lớn có nhiều tỷ tham số.“Kết quả cho thấy, với kiến trúc do chính VinBigdata tự phát triển hoàn toàn có thể tối ưu và đẩy nhanh quá trình huấn luyện mô hình ngôn ngữ, giảm chi phí hạ tầng (bao gồm chi phí huấn luyện và chi phí sử dụng), nhưng vẫn đảm bảo chất lượng của mô hình”, TS. Nguyễn Kim Anh cho biết thêm.

“ChatGPT phiên bản Việt” và câu chuyện của người tiên phong

Sau khi giải quyết bài toán về kích thước mô hình ngôn ngữ lớn, trong quá trình “thai nghén” ViGPT, sau khi nghiên cứu các mô hình của nước ngoài, đội ngũ VinBigdata còn nhận ra một thử thách khác là “tính ảo giác”, đến từ bản chất cố hữu của mô hình xác suất thống kê.

Theo đó, các mô hình ngôn ngữ lớn trên thế giới thường được huấn luyện bằng các nguồn dữ liệu tiếng Anh. Do đó, mô hình này chưa thực sự hiểu và phản ứng đúng với ngữ cảnh và văn hóa của người Việt. Điều này dẫn đến tình trạng ảo giác (hallucination) khiến mô hình ngôn ngữ lớn “bịa đặt” ra câu trả lời không chính xác.

Để tìm ra lời giải tối ưu trong thời gian ngắn nhất, đội ngũ Xử lý ngôn ngữ tự nhiên (NLP) của VinBigdata được chia thành các nhóm nhỏ, cùng phân tích, bàn bạc các ý tưởng khác nhau để tìm hướng đi cuối cùng phù hợp nhất.

“Sau cùng, chúng tôi quyết định phát triển kiến trúc khác so với phần lớn mô hình ngôn ngữ lớn hiện tại, đồng thời tiến hành đào tạo trên bộ 600GB dữ liệu tiếng Việt tinh chỉnh, nhằm tạo ra một “trợ lý ảo thông minh” có khả năng hiểu và đưa ra câu trả lời theo ngữ cảnh của người Việt”, TS. Nguyễn Kim Anh nói thêm.

Khát vọng một hệ sinh thái công nghệ Việt

Theo kết quả đánh giá từ Bộ Tiêu chuẩn đánh giá năng lực tiếng Việt (VMLU) ViGPT đạt điểm trung bình là 42.24%, đứng thứ hai chỉ sau ChatGPT (48.54%). Kết quả này cho phép ViGPT tìm kiếm thông tin, giải đáp câu hỏi về các chủ đề đặc trưng, đặc thù của Việt Nam một cách nhanh chóng.

“ChatGPT phiên bản Việt” và câu chuyện của người tiên phong

Bên cạnh năng lực của trợ lý ảo, điều đội ngũ phát triển mong muốn là tích hợp ViGPT vào các sản phẩm gần gũi, sử dụng hàng ngày, nhằm tạo ra sự thay đổi trong cuộc sống của người Việt. Đó chính là động lực thôi thúc đội ngũ VinBigdata xây dựng một hệ sinh thái các sản phẩm ngôn ngữ và tiếng nói ứng dụng ViGPT - Hệ sinh thái “Vi” bao gồm: ViChat, ViVoice, Trợ lý ảo ViVi. Các sản phẩm này có thể sử dụng cho đa ngành nghề, từ công nghiệp ô tô, ngân hàng - tài chính, bảo hiểm đến giao thông vận tải và nhiều lĩnh vực khác.

“Khi làm công nghệ, nhất là AI, chúng tôi không chỉ muốn chinh phục những hệ thống hay, phức tạp mà khó nhìn thấy. Chúng tôi muốn tạo ra những sản phẩm hữu hình, có tính ứng dụng cao, mà ở đó, AI là tác nhân trực tiếp tạo ra những thay đổi trong cuộc sống”, Giám đốc Sản phẩm VinBigdata khẳng định.

Do đó, phát triển thành công ViGPT mới chỉ là bước đầu tiên trong hành trình đưa công nghệ và dữ liệu “thuần Việt” phục vụ cuộc sống của hàng triệu người dân Việt Nam. Đại diện VinBigdata cho biết, đơn vị này đặt mục tiêu tích hợp ViGPT vào nền tảng trí tuệ nhân tạo đa nhận thức VinBase 2.0, nhằm cung cấp các giải pháp vượt trội cho hệ thống tổ chức, doanh nghiệp ở đa dạng quy mô, ngành nghề.

Trước ViGPT, đội ngũ chuyên gia, kỹ sư trong lĩnh vực công nghệ xử lý ngôn ngữ và tiếng nói VinBigdata đã ghi dấu ấn với việc cho ra mắt ViVi - trợ lý ảo tiếng Việt toàn diện đầu tiên (được ứng dụng và triển khai trên các dòng ô tô điện VinFast, ứng dụng cư dân Vinhomes Resident và sàn thương mại điện tử Vinhomes Online), đồng thời, làm chủ hoàn toàn những công nghệ tiên tiến nhất trên thế giới như Sinh trắc học giọng nói (Voice Biometrics) hay Nhân bản giọng nói (Voice Cloning).

Tất cả những công nghệ này đều được phát triển dựa trên cơ sở dữ liệu 3.500 terabyte, tập trung chủ yếu vào dữ liệu đặc thù của người Việt, do VinBigdata thu thập, phân tích và tinh chỉnh. Mục tiêu sau cùng là làm sao mang công nghệ thế giới, chạm tới cuộc sống Việt, bằng chính dữ liệu và hệ tri thức của người Việt.

ViGPT là “ChatGPT phiên bản Việt" đầu tiên dành cho người dùng cuối được xây dựng dựa trên mô hình ngôn ngữ lớn tiếng Việt (LLM) do VinBigdata phát triển. ViGPT sở hữu những tính năng vượt trội và thiết kế phù hợp nhất với nhu cầu sử dụng của người Việt như sáng tạo nội dung, tìm kiếm thông tin, giải đáp các câu hỏi thường thức mang đặc trưng của Việt Nam. Đăng ký và trải nghiệm ViGPT tại: vigpt.vinbigdata.com

Vinbigdata công bố kết quả cuộc thi toàn cầu về ứng dụng ai trong phân tích hình ảnh y tế trị giá 50.000 usd

Ngày 7/4/2021, Viện Nghiên cứu Dữ liệu lớn VinBigdata (Tập đoàn Vingroup) công bố kết quả của Cuộc thi Ứng dụng AI phát hiện điểm bất thường trên ảnh X-quang lồng ngực với tổng giải thưởng trị giá 50.000 USD. Đây là cuộc thi có quy mô dữ liệu đặc trưng người Việt lớn nhất thế giới, thu hút 1.277 đội thi đến từ hơn 60 quốc gia và vùng lãnh thổ.

Trợ lý ảo ViVi được vinh danh Sản phẩm công nghệ tiềm năng 2022

Ngày 7/1/2022, Sản phẩm Trợ lý ảo ViVi của Công ty cổ phần VinBigData (Tập đoàn Vingroup) vừa được vinh danh là Sản phẩm công nghệ tiềm năng 2022 tại Lễ trao giải Tech Awards 2021. ViVi cũng là thương hiệu phần mềm duy nhất được vinh danh tại Hạng mục Sản phẩm công nghệ tiềm năng.

Nguồn:

Tags:

Tin bài liên quan

AI tạo sinh “thuần Việt” và cơ hội vàng để nền kinh tế bứt tốc

10:21 | 28/10/2024 Doanh nghiệp - Doanh nhân 125

Công nghệ AI tạo sinh “thuần Việt" đang ngày càng được ứng dụng rộng rãi trong các tổ chức và doanh nghiệp, mang tới cơ hội bứt phá cho nhiều lĩnh vực.

Công nghệ xác thực khuôn mặt - “Tấm khiên” chống giả mạo danh tính

10:05 | 31/07/2024 Sản phẩm dịch vụ 125

Kết hợp phương pháp xác thực dữ liệu sinh trắc khuôn mặt với giải pháp Vizone Access tích hợp công nghệ xác minh thực thể sống (do Công ty VinBigdata phát triển) khi giao dịch trực tuyến, khách hàng sẽ được bảo vệ tối đa trước những phương thức giả mạo danh tính tinh vi và tiết kiệm thời gian thực hiện thao tác.

VinBigdata khẳng định chỗ đứng của AI Việt trên thế giới

09:33 | 29/07/2024 Bạn đọc - Cần biết 125

Liên tiếp những thành tựu được đánh giá cao của VinBigdata tại Việt Nam và quốc tế đã cho thấy năng lực của đội ngũ nghiên cứu khoa học cũng như chất lượng công nghệ ở sản phẩm “made in Vietnam”.

Các tin bài khác

Giới khoa học quốc tế “đặt lịch sớm” tham gia Tuần lễ Khoa học Công nghệ VinFuture 2025

16:17 | 19/11/2025 Công nghệ 125

Các nhà khoa học hàng đầu thế giới đang hướng về Việt Nam, nơi Tuần lễ Khoa học Công nghệ VinFuture 2025 chuẩn bị mở màn với chuỗi tọa đàm xoay quanh những lĩnh vực trọng yếu của tương lai nhân loại. Những cuộc gặp gỡ trực tiếp, trao đổi chuyên sâu và thảo luận đa chiều của những trí tuệ lỗi lạc sẽ đưa Việt Nam thành “vùng hội tụ tri thức” hiếm có tại khu vực và thế giới.

VinMotion gây chấn động với humanoid robot 100% Make in Vietnam: Kỳ tích công nghệ chỉ sau 7 tháng

11:42 | 12/08/2025 Công nghệ 125

Lần đầu tiên tại Việt Nam, một dàn robot hình người do các kỹ sư Việt Nam tự nghiên cứu, phát triển và sản xuất hoàn toàn đã trình diễn trực tiếp trên sân khấu trước hàng nghìn khán giả, đánh dấu cột mốc lịch sử cho ngành công nghệ nước nhà.

MB đón Thủ tướng tham quan không gian công nghệ tại Sự kiện Chuyển đổi số 2025

00:00 | 30/05/2025 Công nghệ 125

Tại Hà Nội, ngày 29/05/2025, Ngân hàng TMCP Quân đội (MB) đã tham gia sự kiện Chuyển đổi số ngành Ngân hàng 2025 do Ngân hàng Nhà nước Việt Nam tổ chức với chủ đề "Hệ sinh thái số thông minh trong kỷ nguyên mới".

Tài xế taxi điện: Yên tâm vì thu nhập hấp dẫn, nhiều khách hàng trung thành

13:20 | 17/10/2024 Công nghệ 125

Các tài xế của Xanh SM đang có thu nhập tốt nhờ lượng khách đông, ổn định, chi phí vận hành thấp. Với mức lương, thưởng hấp dẫn, mô hình taxi điện đang trở thành lựa chọn lý tưởng cho những ai muốn tối ưu thu nhập trong ngành dịch vụ vận tải.

Xem thêm

Đọc nhiều

Thúc đẩy hợp tác giáo dục Việt Nam - Rumani

29/07/2026 14:47 Hữu nghị 125

Ngày 29/7, tại Hà Nội, Liên hiệp các tổ chức hữu nghị Việt Nam tổ chức buổi gặp gỡ và giao lưu với đoàn Trường Đại học Khoa học Nông nghiệp và Thú y Bucharest (Rumani) nhân dịp đoàn sang thăm và làm việc tại Việt Nam. Hoạt động góp phần tăng cường kết nối giữa các cơ sở giáo dục, các cựu lưu học sinh và thúc đẩy giao lưu nhân dân giữa hai nước.

Hội hữu nghị Việt Nam - Áo kết nối trí thức, nhà khoa học tại Áo

30/07/2026 09:18 Hữu nghị 125

Đoàn Hội hữu nghị Việt Nam - Áo do GS.TS Trần Tuấn Anh, Phó Chủ tịch Viện Hàn lâm Khoa học và Công nghệ Việt Nam, Chủ tịch Hội dẫn đầu vừa có chuyến thăm và làm việc tại Cộng hoà Áo. Đoàn đã gặp gỡ trí thức Việt Nam, làm việc với Đại sứ quán Việt Nam cùng một số cơ sở nghiên cứu, trường đại học và tổ chức quốc tế tại Áo, trao đổi khả năng hợp tác trong các lĩnh vực khoa học, công nghệ và đổi mới sáng tạo.

Việt Nam - Italia đẩy mạnh hợp tác công nghệ cao

30/07/2026 09:38 Chuyện ngoại giao 125

Chiều 29/7, tại Hà Nội, Bộ trưởng Bộ Công an Lương Tam Quang tiếp Phó Chủ tịch cấp cao Tập đoàn Leonardo S.p.A. (Italia) Daniele Tavano, trao đổi về hợp tác công nghệ phục vụ bảo đảm an ninh, trật tự.

Toàn văn phát biểu của Tổng Bí thư, Chủ tịch nước Tô Lâm tại Hội nghị toàn quốc quán triệt và triển khai thực hiện Nghị quyết Hội nghị Trung ương 3

29/07/2026 13:08 Việt Nam hôm nay 125

Sáng 29/7, Bộ Chính trị tổ chức Hội nghị toàn quốc nghiên cứu, học tập, quán triệt và triển khai thực hiện Nghị quyết Hội nghị lần thứ ba Ban Chấp hành Trung ương Đảng khóa XIV. Tổng Bí thư, Chủ tịch nước Tô Lâm đã có bài phát biểu chỉ đạo quan trọng. Cục Thông tin và Truyền thông Chính phủ trân trọng giới thiệu toàn văn bài phát biểu của đồng chí Tổng Bí thư, Chủ tịch nước.

Bờ cõi biển đảo

Miền đất - Con người Cuộc sống vùng biên Nhịp sống biển đảo Lịch sử chủ quyền Giao lưu hữu nghị

Việt Nam - Australia mở rộng hợp tác quốc phòng

15 giờ 18 phút Bờ cõi biển đảo 125

Chiều 29/7, tại trụ sở Bộ Quốc phòng, Đại tướng Phan Văn Giang, Ủy viên Bộ Chính trị, Phó Thủ tướng Chính phủ, Bộ trưởng Bộ Quốc phòng tiếp Đại sứ Australia tại Việt Nam Gillian Bird, trao đổi về việc làm sâu sắc và mở rộng hợp tác quốc phòng song phương.

Chuyển đổi số tạo đột phá trong quản lý tàu cá ở Cà Mau

1 ngày trước Bờ cõi biển đảo 125

Đẩy mạnh chuyển đổi số trong quản lý nghề cá, tỉnh Cà Mau đang từng bước minh bạch hóa hoạt động khai thác và truy xuất nguồn gốc thủy sản thông qua Hệ thống truy xuất nguồn gốc thủy sản điện tử (eCDT). Đây được xem là một trong những giải pháp trọng tâm nhằm thực hiện hiệu quả các khuyến nghị của Ủy ban châu Âu (EC), hướng tới sớm gỡ bỏ cảnh báo "thẻ vàng", đồng thời xây dựng ngành thủy sản hiện đại, có trách nhiệm và phát triển bền vững.

Việt Nam luôn thiện chí tuân thủ Công ước của Liên hợp quốc về Luật Biển 1982

12-07-2026 18:02 Bờ cõi biển đảo 125

Việt Nam nhấn mạnh cam kết tuân thủ Công ước Liên hợp quốc về Luật Biển 1982 và giải quyết tranh chấp bằng hòa bình, hợp tác ở Biển Đông.

Multimedia

Podcasts Video E-magazine Infographic

ho tro tien an gao do dung ca nhan cho hoc sinh truong pho thong noi tru

Hỗ trợ tiền ăn, gạo, đồ dùng cá nhân cho học sinh trường phổ thông nội trú

18-07-2026 08:13 Nhịp sống qua ảnh 125

Chính phủ ban hành Nghị định 188/2026/NĐ-CP ngày 27/5/2026 quy định chính sách cho học sinh trường phổ thông nội trú và trường phổ thông nội trú tại các xã biên giới đất liền.

infographic quan he asean nga va hoi nghi cap cao ky niem 35 nam quan he asean nga

[Infographic] Quan hệ ASEAN-Nga và Hội nghị Cấp cao Kỷ niệm 35 năm quan hệ ASEAN-Nga

17-06-2026 14:52 Infographic 125

Quan hệ đối tác đối thoại ASEAN-Nga được thiết lập năm 1991 và được nâng cấp lên quan hệ Đối tác chiến lược năm 2018. Hai bên đã tổ chức 5 Hội nghị Cấp cao vào các năm 2005, 2010, 2016, 2018, 2021.

mot so moc thoi gian quan trong sap xep to chuc lai thon to dan pho

Một số mốc thời gian quan trọng sắp xếp, tổ chức lại thôn, tổ dân phố

24-05-2026 09:47 Infographic 125

Ủy ban Nhân dân các tỉnh, thành phố xây dựng Phương án tổng thể sắp xếp, tổ chức lại thôn, tổ dân phố hoàn thành trước ngày 10/6/2026.

nhat ban la doi tac kinh te quan trong hang dau cua viet nam

Nhật Bản là đối tác kinh tế quan trọng hàng đầu của Việt Nam

01-05-2026 15:55 Infographic 125

Nhật Bản hiện là đối tác kinh tế quan trọng hàng đầu của Việt Nam, hợp tác địa phương, văn hóa, kết nối nguồn nhân lực và giao lưu nhân dân giữa hai nước ngày càng mật thiết và hiệu quả.

infographic 9 luat va 31 nghi quyet duoc thong qua tai ky hop thu nhat quoc hoi khoa xvi

[Infographic] 9 luật và 31 nghị quyết được thông qua tại Kỳ họp thứ nhất, Quốc hội khóa XVI

26-04-2026 08:19 Infographic 125

Tại Kỳ họp thứ nhất, Quốc hội khóa XVI, Quốc hội đã xem xét, thông qua 9 luật, 5 nghị quyết quy phạm pháp luật; quyết định các vấn đề về kinh tế-xã hội, tài chính, ngân sách...

infographic viet nam va trung quoc ky ket 32 van kien hop tac

[Infographic] Việt Nam và Trung Quốc ký kết 32 văn kiện hợp tác

18-04-2026 09:34 Infographic 125

Trong khuôn khổ chuyến thăm cấp Nhà nước tới Trung Quốc của Tổng Bí thư, Chủ tịch nước Tô Lâm cùng Phu nhân và Đoàn đại biểu cấp cao Việt Nam, hai bên đã ký 32 văn kiện hợp tác trong các lĩnh vực.

chinh phu nhiem ky quoc hoi khoa xvi co 14 bo 3 co quan ngang bo

Chính phủ nhiệm kỳ Quốc hội khóa XVI có 14 Bộ, 3 cơ quan ngang Bộ

07-04-2026 15:50 Infographic 125

Ngày 7/4/20206, Quốc hội khóa XVI thông qua cơ cấu tổ chức chính phủ gồm 14 Bộ và 3 cơ quan ngang Bộ, đảm bảo hoạt động hiệu quả.

Videos

Xin chờ trong giây lát...

Truyền hình

Đối ngoại nhân dân Thủ đô hướng tới kết nối hiệu quả nguồn lực người Việt Nam ở nước ngoài

10/06/2026 16:58 Truyền hình 66

Ngày 10/6 tại Hà Nội, Liên hiệp các tổ chức hữu nghị thành phố Hà Nội chủ trì tổ chức Tọa đàm lấy ý kiến đóng góp hoàn thiện dự thảo Đề án “Tăng cường đối ngoại nhân dân Thủ đô, phát huy vai trò của Mặt trận Tổ quốc Việt Nam thành phố Hà Nội trong vận động, kết nối người Việt Nam ở nước ngoài, trí thức, chuyên gia, doanh nhân, kiều bào tham gia xây dựng và phát triển Thủ đô trong giai đoạn mới”.