Trang chủ Kinh tế Công nghệ
11:01 | 28/12/2023 GMT+7

“ChatGPT phiên bản Việt” và câu chuyện của người tiên phong

aa
Chỉ 9 tháng sau khi ChatGPT ra mắt, đội ngũ kỹ sư VinBigdata (Tập đoàn Vingroup) đã làm chủ hoàn toàn mô hình ngôn ngữ lớn tiếng Việt và chính thức giới thiệu ViGPT - ChatGPT phiên bản Việt đầu tiên dành cho người dùng cuối vào tháng 12/2023. Sản phẩm nhanh chóng gây được tiếng vang trong cộng đồng khoa học công nghệ Việt Nam.
VinBigdata phát triển thành công công nghệ AI tạo sinh
VinBigdata ra mắt “ChatGPT" phiên bản Việt đầu tiên dành cho người dùng cuối

Chọn con đường khó để giải bài toán Việt

Vào cuối năm 2022, ChatGPT tạo nên một “cú nổ lớn”, mở ra cuộc đua chinh phục AI tạo sinh giữa các các quốc gia và ông lớn trong lĩnh vực công nghệ. Giới công nghệ Việt khi ấy cũng sục sôi mong muốn phát triển những sản phẩm của riêng người Việt để tự chủ về công nghệ, giảm thiểu sự phụ thuộc vào các sản phẩm quốc tế. Tuy nhiên, không phải đơn vị nào cũng đủ khả năng và quyết tâm hiện thực hóa mong muốn ấy như VinBigdata.

“AI tạo sinh là một bài toán khó. Các ông lớn như OpenAI hay Google cũng phải đổ rất nhiều nguồn lực và thời gian vào nghiên cứu mới có thể tạo ra những sản phẩm như chúng ta thấy. Các sản phẩm này đã rất tốt, nhưng thật ra các nhà khoa học cũng vẫn chưa hoàn toàn hiểu cơ cấu hoạt động của nó. Khi nào nó có lỗi, và lỗi sẽ như thế nào ít ai đoán trước được. Để phát triển một sản phẩm tương tự ChatGPT dành cho người Việt, trong thời gian ngắn chưa tới một năm, thì rất nhiều thử thách. Nhưng chúng tôi đã lựa chọn "liều" vì một phiên bản ChatGPT tiếng Việt nếu không phải người Việt làm thì ai làm- GS. Vũ Hà Văn, Giám đốc khoa học VinBigdata chia sẻ.

“ChatGPT phiên bản Việt” và câu chuyện của người tiên phong
GS. Vũ Hà Văn, Giám đốc khoa học VinBigdata.

Thực tế, rất ít công ty lựa chọn xây dựng Mô hình ngôn ngữ lớn của riêng mình từ đầu. Như GPT 3 của OpenAI có 175 tỷ tham số và được đào tạo trên bộ dữ liệu 45 terabyte và tiêu tốn 4,6 triệu USD. Thậm chí, theo tính toán, số tiền để phát triển GPT 4 có thể lên tới 100 triệu USD. “Với những con số khổng lồ như thế, rất khó để tìm được một công ty nào đủ sức đầu tư cho công nghệ này”, TS. Nguyễn Kim Anh, Giám đốc Sản phẩm VinBigdata nói.

Để các doanh nghiệp Việt Nam có thể tiếp cận với công nghệ AI thế hệ mới, với chi phí và hạ tầng tối ưu, VinBigdata lựa chọn một hướng đi hoàn toàn khác biệt, đó là tạo ra một mô hình ngôn ngữ chỉ với 1,6 tỷ tham số, nhưng có khả năng tương đương với những mô hình ngôn ngữ lớn có nhiều tỷ tham số.“Kết quả cho thấy, với kiến trúc do chính VinBigdata tự phát triển hoàn toàn có thể tối ưu và đẩy nhanh quá trình huấn luyện mô hình ngôn ngữ, giảm chi phí hạ tầng (bao gồm chi phí huấn luyện và chi phí sử dụng), nhưng vẫn đảm bảo chất lượng của mô hình”, TS. Nguyễn Kim Anh cho biết thêm.

“ChatGPT phiên bản Việt” và câu chuyện của người tiên phong
“ChatGPT phiên bản Việt” và câu chuyện của người tiên phong

Sau khi giải quyết bài toán về kích thước mô hình ngôn ngữ lớn, trong quá trình “thai nghén” ViGPT, sau khi nghiên cứu các mô hình của nước ngoài, đội ngũ VinBigdata còn nhận ra một thử thách khác là “tính ảo giác”, đến từ bản chất cố hữu của mô hình xác suất thống kê.

Theo đó, các mô hình ngôn ngữ lớn trên thế giới thường được huấn luyện bằng các nguồn dữ liệu tiếng Anh. Do đó, mô hình này chưa thực sự hiểu và phản ứng đúng với ngữ cảnh và văn hóa của người Việt. Điều này dẫn đến tình trạng ảo giác (hallucination) khiến mô hình ngôn ngữ lớn “bịa đặt” ra câu trả lời không chính xác.

Để tìm ra lời giải tối ưu trong thời gian ngắn nhất, đội ngũ Xử lý ngôn ngữ tự nhiên (NLP) của VinBigdata được chia thành các nhóm nhỏ, cùng phân tích, bàn bạc các ý tưởng khác nhau để tìm hướng đi cuối cùng phù hợp nhất.

Sau cùng, chúng tôi quyết định phát triển kiến trúc khác so với phần lớn mô hình ngôn ngữ lớn hiện tại, đồng thời tiến hành đào tạo trên bộ 600GB dữ liệu tiếng Việt tinh chỉnh, nhằm tạo ra một “trợ lý ảo thông minh” có khả năng hiểu và đưa ra câu trả lời theo ngữ cảnh của người Việt”, TS. Nguyễn Kim Anh nói thêm.

Khát vọng một hệ sinh thái công nghệ Việt

Theo kết quả đánh giá từ Bộ Tiêu chuẩn đánh giá năng lực tiếng Việt (VMLU) ViGPT đạt điểm trung bình là 42.24%, đứng thứ hai chỉ sau ChatGPT (48.54%). Kết quả này cho phép ViGPT tìm kiếm thông tin, giải đáp câu hỏi về các chủ đề đặc trưng, đặc thù của Việt Nam một cách nhanh chóng.

“ChatGPT phiên bản Việt” và câu chuyện của người tiên phong
“ChatGPT phiên bản Việt” và câu chuyện của người tiên phong

Bên cạnh năng lực của trợ lý ảo, điều đội ngũ phát triển mong muốn là tích hợp ViGPT vào các sản phẩm gần gũi, sử dụng hàng ngày, nhằm tạo ra sự thay đổi trong cuộc sống của người Việt. Đó chính là động lực thôi thúc đội ngũ VinBigdata xây dựng một hệ sinh thái các sản phẩm ngôn ngữ và tiếng nói ứng dụng ViGPT - Hệ sinh thái “Vi” bao gồm: ViChat, ViVoice, Trợ lý ảo ViVi. Các sản phẩm này có thể sử dụng cho đa ngành nghề, từ công nghiệp ô tô, ngân hàng - tài chính, bảo hiểm đến giao thông vận tải và nhiều lĩnh vực khác.

“Khi làm công nghệ, nhất là AI, chúng tôi không chỉ muốn chinh phục những hệ thống hay, phức tạp mà khó nhìn thấy. Chúng tôi muốn tạo ra những sản phẩm hữu hình, có tính ứng dụng cao, mà ở đó, AI là tác nhân trực tiếp tạo ra những thay đổi trong cuộc sống”, Giám đốc Sản phẩm VinBigdata khẳng định.

Do đó, phát triển thành công ViGPT mới chỉ là bước đầu tiên trong hành trình đưa công nghệ và dữ liệu “thuần Việt” phục vụ cuộc sống của hàng triệu người dân Việt Nam. Đại diện VinBigdata cho biết, đơn vị này đặt mục tiêu tích hợp ViGPT vào nền tảng trí tuệ nhân tạo đa nhận thức VinBase 2.0, nhằm cung cấp các giải pháp vượt trội cho hệ thống tổ chức, doanh nghiệp ở đa dạng quy mô, ngành nghề.

Trước ViGPT, đội ngũ chuyên gia, kỹ sư trong lĩnh vực công nghệ xử lý ngôn ngữ và tiếng nói VinBigdata đã ghi dấu ấn với việc cho ra mắt ViVi - trợ lý ảo tiếng Việt toàn diện đầu tiên (được ứng dụng và triển khai trên các dòng ô tô điện VinFast, ứng dụng cư dân Vinhomes Resident và sàn thương mại điện tử Vinhomes Online), đồng thời, làm chủ hoàn toàn những công nghệ tiên tiến nhất trên thế giới như Sinh trắc học giọng nói (Voice Biometrics) hay Nhân bản giọng nói (Voice Cloning).

Tất cả những công nghệ này đều được phát triển dựa trên cơ sở dữ liệu 3.500 terabyte, tập trung chủ yếu vào dữ liệu đặc thù của người Việt, do VinBigdata thu thập, phân tích và tinh chỉnh. Mục tiêu sau cùng là làm sao mang công nghệ thế giới, chạm tới cuộc sống Việt, bằng chính dữ liệu và hệ tri thức của người Việt.

ViGPT là “ChatGPT phiên bản Việt" đầu tiên dành cho người dùng cuối được xây dựng dựa trên mô hình ngôn ngữ lớn tiếng Việt (LLM) do VinBigdata phát triển. ViGPT sở hữu những tính năng vượt trội và thiết kế phù hợp nhất với nhu cầu sử dụng của người Việt như sáng tạo nội dung, tìm kiếm thông tin, giải đáp các câu hỏi thường thức mang đặc trưng của Việt Nam. Đăng ký và trải nghiệm ViGPT tại: vigpt.vinbigdata.com
Vinbigdata công bố kết quả cuộc thi toàn cầu về ứng dụng ai trong phân tích hình ảnh y tế trị giá 50.000 usd Vinbigdata công bố kết quả cuộc thi toàn cầu về ứng dụng ai trong phân tích hình ảnh y tế trị giá 50.000 usd
Ngày 7/4/2021, Viện Nghiên cứu Dữ liệu lớn VinBigdata (Tập đoàn Vingroup) công bố kết quả của Cuộc thi Ứng dụng AI phát hiện điểm bất thường trên ảnh X-quang lồng ngực với tổng giải thưởng trị giá 50.000 USD. Đây là cuộc thi có quy mô dữ liệu đặc trưng người Việt lớn nhất thế giới, thu hút 1.277 đội thi đến từ hơn 60 quốc gia và vùng lãnh thổ.
Trợ lý ảo ViVi được vinh danh Sản phẩm công nghệ tiềm năng 2022 Trợ lý ảo ViVi được vinh danh Sản phẩm công nghệ tiềm năng 2022
Ngày 7/1/2022, Sản phẩm Trợ lý ảo ViVi của Công ty cổ phần VinBigData (Tập đoàn Vingroup) vừa được vinh danh là Sản phẩm công nghệ tiềm năng 2022 tại Lễ trao giải Tech Awards 2021. ViVi cũng là thương hiệu phần mềm duy nhất được vinh danh tại Hạng mục Sản phẩm công nghệ tiềm năng.
PV
Nguồn:

Tin bài liên quan

Vinbigdata tuyển sinh chương trình đào tạo kỹ sư ai mùa 5 - 2024

Vinbigdata tuyển sinh chương trình đào tạo kỹ sư ai mùa 5 - 2024

Từ ngày 1/4/2024, VinBigdata (thuộc Tập đoàn Vingroup) bắt đầu tuyển sinh Chương trình Đào tạo Kỹ sư AI Vingroup mùa 5, nhằm tìm kiếm và phát triển tài năng trẻ thuộc lĩnh vực khoa học công nghệ. Học viên sẽ được đào tạo miễn phí với sự dẫn dắt của chuyên gia đầu ngành thế giới và cơ hội phát triển nghề nghiệp tại Vingroup cùng học bổng du học các trường Top đầu thế giới về công nghệ.
VinBigdata ra mắt “ChatGPT" phiên bản Việt đầu tiên dành cho người dùng cuối

VinBigdata ra mắt “ChatGPT" phiên bản Việt đầu tiên dành cho người dùng cuối

Ngày 27/12/2023, Công ty VinBigdata (Tập đoàn Vingroup) chính thức đưa vào hoạt động ứng dụng ViGPT - phiên bản ChatGPT đầu tiên ở Việt Nam mở cho người dùng cuối. Đồng thời, một phiên bản khác dành riêng cho doanh nghiệp với hệ tri thức ngành sâu rộng được tích hợp trong nền tảng trí tuệ nhân tạo đa nhận thức VinBase 2.0 cũng chính thức ra mắt.
VinBigdata phát triển thành công công nghệ AI tạo sinh

VinBigdata phát triển thành công công nghệ AI tạo sinh

Ngày 21/08/2023, Công ty Cổ phần VinBigdata (Tập đoàn Vingroup) công bố xây dựng thành công mô hình ngôn ngữ lớn tiếng Việt, đặt nền móng cho việc xây dựng các giải pháp tích hợp AI tạo sinh. Sự kiện không chỉ đưa VinBigdata trở thành đơn vị đầu tiên tại Việt Nam làm chủ công nghệ AI tạo sinh mà còn đánh dấu cho những bước phát triển đầu tiên của một “ChatGPT phiên bản Việt”.

Các tin bài khác

Hé lộ nơi vinh danh những trí tuệ kiệt xuất của Lễ trao giải VinFuture 2023

Hé lộ nơi vinh danh những trí tuệ kiệt xuất của Lễ trao giải VinFuture 2023

Lễ trao giải VinFuture 2023, một trong những giải thưởng Khoa học Công nghệ lớn nhất hành tinh, sẽ diễn ra tại Nhà hát Hồ Gươm vào tối 20/12/2023. Cùng chiêm ngưỡng không gian đẳng cấp của nhà hát hiện đại bậc nhất Việt Nam và khu vực, đồng thời là biểu tượng văn hóa mới của Thủ đô, nơi sẽ tôn vinh chủ nhân của những công trình nghiên cứu đột phá có ý nghĩa với nhân loại.
Việt Nam lọt top 15 quốc gia, vùng lãnh thổ tiên tiến nhất châu Á

Việt Nam lọt top 15 quốc gia, vùng lãnh thổ tiên tiến nhất châu Á

Mới đây, Việt Nam đã lọt top 15 quốc gia tiên tiến nhất châu Á, theo đánh giá của trang tin tài chính Insider Monkey. Ngoài Việt Nam, khu vực Đông Nam Á còn có Singapore, Thái Lan và Malaysia.
Người đầu tiên trên thế giới tìm ra tế bào “T điều hòa” sẽ có bài phát biểu đặc biệt tại VinFuture 2023

Người đầu tiên trên thế giới tìm ra tế bào “T điều hòa” sẽ có bài phát biểu đặc biệt tại VinFuture 2023

Ngày 18/12, GS.BS Shimon Sakaguchi - học giả lỗi lạc, người đầu tiên trên thế giới tìm ra tế bào T điều hòa (regulatory T cell – Treg) sẽ có bài phát biểu đặc biệt tại tọa đàm “Thúc đẩy miễn dịch học chính xác để điều trị các bệnh rối loạn tự miễn”. Sự kiện nằm trong trong Tuần lễ Khoa học Công nghệ và Lễ trao giải VinFuture 2023 diễn ra từ ngày 18 - 21/12/2023 tại Hà Nội.
Thành viên Hội đồng Giải thưởng VinFuture: “AI không thay thế con người”

Thành viên Hội đồng Giải thưởng VinFuture: “AI không thay thế con người”

TS. Padmanabhan Anandan, nhà khoa học nổi tiếng toàn cầu về Thị giác Máy tính và Trí tuệ nhân tạo (AI), diễn giả tại Tọa đàm về AI trong khuôn khổ Tuần lễ Khoa học Công nghệ VinFuture 2023, khẳng định sự phát triển của AI là nền tảng hỗ trợ và thúc đẩy cho toàn bộ các lĩnh vực khác. Dù vậy, AI sẽ không thay thế con người và nếu đi đúng hướng, một viễn cảnh cộng hưởng thành công của mọi lĩnh vực sẽ đến với nhân loại.

Đọc nhiều

Tử vi hôm nay 12 con giáp 24/5/2024: Dậu công việc tiến triển vô cùng thuận lợi Tý tiền bạc đi lên

Tử vi hôm nay 12 con giáp 24/5/2024: Dậu công việc tiến triển vô cùng thuận lợi Tý tiền bạc đi lên

Tử vi hôm nay 12 con giáp 24/5/2024 công việc của tuổi Dậu tiến triển thuận lợi nhờ có sự nâng đỡ của tam hội.
Tử vi hôm nay 12 con giáp 23/5/2024: Tý gặp phải nhiều chuyện không như ý muốn

Tử vi hôm nay 12 con giáp 23/5/2024: Tý gặp phải nhiều chuyện không như ý muốn

Tử vi hôm nay 12 con giáp 23/5/2024 công việc dễ gặp trục trặc, liên tiếp vướng phải những khúc mắc không đáng có, ảnh hưởng đến tiến độ ban đầu.
Con số may mắn hôm nay 24/5/2024 12 con giáp: Hợi thần Tài gõ cửa

Con số may mắn hôm nay 24/5/2024 12 con giáp: Hợi thần Tài gõ cửa

Con số may mắn hôm nay 24/5/2024 12 con giáp sẽ bao gồm những số nào? Cùng tìm hiểu ngay trong bài viết dưới đây.
Tử vi hôm nay 12 cung hoàng đạo 23/5/2024: Kim Ngưu đạt được thành tự trong công việc

Tử vi hôm nay 12 cung hoàng đạo 23/5/2024: Kim Ngưu đạt được thành tự trong công việc

Tử vi hôm nay 12 cung hoàng đạo 23/5/2024 hiệu quả công việc được cải thiện đáng kể sẽ giúp bạn hoàn thành tất cả những nhiệm vụ trong ngày với chất lượng cao và nhận được sự khen ngợi từ cấp trên cùng sự ngưỡng mộ từ đồng nghiệp.
Phấn đấu xây dựng khu cảnh quan thác Bản Giốc (Việt Nam) - Đức Thiên (Trung Quốc) thành mô hình kiểu mẫu du lịch qua biên giới

Phấn đấu xây dựng khu cảnh quan thác Bản Giốc (Việt Nam) - Đức Thiên (Trung Quốc) thành mô hình kiểu mẫu du lịch qua biên giới

Đây là phát biểu của ông Hoàng Xuân Ánh, Chủ tịch Ủy ban nhân dân (UBND) tỉnh Cao Bằng tại buổi làm việc với đoàn công tác Ủy ban biên giới quốc gia Bộ Ngoại giao về việc triển khai vận hành thí điểm khu cảnh quan thác Bản Giốc (Việt Nam) - Đức Thiên (Trung Quốc) vừa qua.
Cảnh sát biển Việt Nam - Trung Quốc tuần tra chung trên Vịnh Bắc Bộ

Cảnh sát biển Việt Nam - Trung Quốc tuần tra chung trên Vịnh Bắc Bộ

Ngày 22/5, Lực lượng Cảnh sát biển hai nước Việt Nam - Trung Quốc tổ chức chuyến tuần tra chung lần thứ 2 năm 2024 trên khu vực biển phía Bắc Vịnh Bắc Bộ thuộc địa phận thành phố Móng Cái, tỉnh Quảng Ninh (Việt Nam) và thành phố Đông Hưng, thành phố Phòng Thành Cảng, tỉnh Quảng Tây (Trung Quốc).
Cửa biển bị bồi lấp, ngư dân lo lắng

Cửa biển bị bồi lấp, ngư dân lo lắng

Luồng lạch ra vào khu neo trú tàu thuyền và cửa biển Mỹ Á, phường Phổ Quang, thị xã Đức Phổ (Quảng Ngãi) hiện đang bị bồi lấp nghiêm trọng. Tàu cá công suất lớn khai thác xa bờ hầu như không thể vào cảng; tàu công suất nhỏ thì lo sợ mất an toàn trước mỗi chuyến ra khơi. Thực trạng này không chỉ ảnh hưởng lớn đến phát triển kinh tế thủy sản của địa phương, mà còn khiến ngư dân lo lắng việc neo đậu tránh trú khi mùa mưa bão đã cận kề.
ho chi minh la bieu tuong cua hoa binh doc lap va tien bo xa hoi
cap nhat thong tin dat nuoc nga cho nhung nguoi ban viet nam
inforgraphic quan ly phuong tien co gioi nuoc ngoai tham gia giao thong tai viet nam
top 3 diem den thu hut du khach quoc te tai ha noi
xe dap tho trong chien dich dien bien phu
gioi thieu quang ba ve dat nuoc va con nguoi viet nam tai dan mach
lan dau tien am thuc hungary ra mat tai ha noi
Xin chờ trong giây lát...
Vietnam Cultural Show London 2024
Lão nông nhiều năm sưu tập những bức ảnh quý giá về Bác Hồ
Bác Hồ và bộ phim Những ngày tháng bên nhau
Hồ Chí Minh là biểu tượng của hòa bình, độc lập và tiến bộ xã hội
Bộ đội hải quân giúp dân chống hạn
Du học sinh Trung Quốc trải nghiệm đặc sản Hà Nội - 'cà phê trứng'
Du học sinh Trung Quốc trải nghiệm đặc sản Hà Nội - cà phê trứng
Top 3 điểm đến thu hút du khách quốc tế tại Hà Nội
Sản phẩm Làng nghề Dệt Thổ cẩm Xí Thoại, xã Xuân Lãnh, huyện Đồng Xuân, tỉnh Phú Yên.
Đại sứ Marc Knapper trò chuyện cùng chị Lưu Hiếu
Hơn 300 lưu học sinh Lào, Campuchia trải nghiệm Làng văn hóa các dân tộc Việt Nam
Hyakka Souen - Bách Hoa Thương Viêm
Giai điệu Nga trong lòng Hà Nội
Nhà tưởng niệm Phó Chủ tịch nước Nguyễn Lương Bằng đón lượng khách cao gấp 3 lần
Hành trình chinh phục khán giả xứ anh đào của KURROCK
Phiên bản di động