Chuyện chưa từng có: Internet 'cạn sạch dữ liệu', OpenAI phải thuê người viết code để 'nuôi sống' ChatGPT-5?

Admin

00:50 25/12/2024

Theo OpenAI, nguồn dữ liệu công khai từ Internet được cho là không đủ phong phú và chất lượng để làm cho GPT-5 "thông minh hơn" đáng kể so với GPT-4.

Hồi tháng 3, nhiều báo cáo cho biết OpenAI đã bắt đầu đào tạo ChatGPT-5 – phiên bản kế nhiệm được hứa hẹn mang đến những tính năng vượt trội so với GPT-4. Tuy nhiên, khi năm 2024 đã gần kề, ChatGPT-5 vẫn chưa xuất hiện. Một bài viết từ The Wall Street Journal đã hé lộ lý do đằng sau sự chậm trễ này.

ChatGPT-5: Quá trình phát triển đầy thách thức

Được biết đến với tên mã Project Orion, ChatGPT-5 đã được OpenAI ấp ủ trong 18 tháng. Microsoft, nhà đầu tư lớn nhất của OpenAI, từng kỳ vọng mô hình này sẽ ra mắt vào giữa năm 2024. Tuy nhiên, những báo cáo gần đây cho thấy việc phát triển ChatGPT-5 đã gặp nhiều trở ngại lớn, đặc biệt trong quá trình đào tạo.

OpenAI đã thực hiện ít nhất hai đợt huấn luyện lớn với lượng dữ liệu khổng lồ, nhưng kết quả không như mong đợi. Chạy thử đầu tiên diễn ra chậm hơn dự kiến, khiến OpenAI nhận ra rằng một đợt huấn luyện quy mô lớn hơn sẽ tiêu tốn thời gian và chi phí khổng lồ. Quan trọng hơn, nguồn dữ liệu từ internet công khai không đủ phong phú và chất lượng để làm cho GPT-5 "thông minh hơn" đáng kể so với GPT-4.

Chuyện chưa từng có: Internet 'cạn sạch dữ liệu', OpenAI phải thuê người viết code để 'nuôi sống' ChatGPT-5?- Ảnh 1.

Nhằm giải quyết vấn đề thiếu hụt dữ liệu chất lượng cao, OpenAI đã thuê hàng trăm người để viết code hoặc giải bài toán, tạo nên bộ dữ liệu hoàn toàn mới từ đầu. Tuy nhiên, quá trình này rất chậm. Để hình dung: GPT-4 được huấn luyện trên khoảng 13 nghìn tỷ token. Nếu 1.000 người viết 5.000 từ mỗi ngày, họ sẽ mất vài tháng mới tạo ra được 1 tỷ token.

Một giải pháp khác là tạo dữ liệu tổng hợp từ chính các mô hình AI hiện tại. Nhưng cách làm này đi kèm với rủi ro: những vòng lặp dữ liệu tổng hợp có thể dẫn đến kết quả phi logic hoặc "rác dữ liệu". OpenAI tin rằng có thể tránh được vấn đề này bằng cách sử dụng dữ liệu từ mô hình Orion hiện tại (o1), dù điều này vẫn gây nhiều tranh cãi trong giới chuyên môn.

Những khó khăn nội bộ và áp lực từ thị trường

Ngoài những thách thức kỹ thuật, OpenAI còn phải đối mặt với xáo trộn nội bộ. Năm 2023, CEO Sam Altman bị cách chức rồi nhanh chóng quay trở lại vị trí, trong khi hơn hai chục giám đốc cấp cao đã rời công ty trong năm. Altman cũng từng đổ lỗi rằng việc ra mắt mô hình Orion đầu tiên (o1) là một trong những lý do khiến GPT-5 bị trì hoãn.

Áp lực tài chính cũng là một yếu tố lớn. Chi phí phát triển các mô hình AI tiên tiến ngày càng tăng chóng mặt, nhưng lợi nhuận chưa tương xứng. OpenAI nhận thức rõ rằng ChatGPT-5 cần phải thực sự vượt trội để biện minh cho các khoản đầu tư khổng lồ, điều này càng làm tăng thêm kỳ vọng và áp lực cho dự án.

Với những khó khăn kể trên, ChatGPT-5 dự kiến sẽ ra mắt không sớm hơn giữa năm 2024. Dù vậy, OpenAI cần giải quyết bài toán chất lượng dữ liệu, tối ưu hóa chi phí và vượt qua các rào cản nội bộ để đảm bảo rằng sản phẩm này không chỉ là một bước tiến công nghệ mà còn đáp ứng kỳ vọng của thị trường.

Bình luận

Mới cập nhật

200 cửa hàng - Cột mốc mới trong hành trình lan tỏa niềm vui của Jollibee Việt Nam

Vừa qua, Jollibee đã chính thức đưa vào hoạt động cửa hàng thứ 200 sau 2 thập kỷ phát triển thương hiệu tại Việt Nam. Không chỉ là con số, cửa hàng thứ 200 là cột mốc minh chứng cho thành công của Jollibee trong việc lan tỏa niềm vui ẩm thực và chinh phục thị trường thức ăn nhanh Việt.

13 phút trước Kinh doanh

Ukraine nhận được 1 tỉ USD nhờ tài sản đóng băng của Nga

Thủ tướng Ukraine Denis Shmigal cho biết khoản tiền 1 tỉ USD đã được Mỹ chuyển giao cho Ukraine và mới là đợt đầu tiên trong gói vay 20 tỉ USD.

13 phút trước Tài chính

6 loại giấy tờ bắt buộc phải mang theo khi lái xe ra đường

Những người không mang theo đầy đủ giấy tờ khi tham gia giao thông có thể bị phạt tới 600.000 đồng.

13 phút trước Xã hội

Tóc Tiên khiến cộng đồng mạng "sốc" khi thừa nhận mua giải Chị đẹp

Chị đẹp Tóc Tiên khiến cộng đồng mạng không khỏi sốc vì pha "mỏ hỗn" xéo sắc mà cũng vô cùng đáng yêu.

15 phút trước Văn hóa

Quang Hải nói gì về Nguyễn Xuân Son trước trận gặp Singapore?

Quang Hải đánh giá cao khả năng kết nối lối chơi của Nguyễn Xuân Son và cho rằng tiền đạo này có thể giúp các đồng đội cảm thấy thoải mái hơn trên sân.

15 phút trước Văn hóa

Quốc gia ĐNÁ trở thành thị trường lớn thứ 3 của Mitsubishi, có lịch sử hơn 70 năm gắn bó

Doanh số bán hàng tại đây đạt mức cao kỷ lục trong năm tài chính kết thúc vào tháng 3.

15 phút trước Tài chính

Những điều cần biết về giao thông từ ngày 1-1-2025

Trẻ em không được ngồi cùng hàng ghế với tài xế, vi phạm giao thông sẽ bị trừ điểm, tăng độ tuổi tối đa của người lái xe… là những quy định có hiệu lực từ 2025.

15 phút trước Xã hội

Những chuyến công du nước ngoài nổi bật của lãnh đạo Đảng, Nhà nước năm 2024

Trong năm 2024, các lãnh đạo cấp cao Việt Nam đã thực hiện nhiều chuyến công du nước ngoài nhằm thúc đẩy hợp tác trên các lĩnh vực, thể hiện đường lối đối ngoại độc lập, tự chủ, đa phương hóa, đa dạng hóa của Việt Nam.

15 phút trước Xã hội

Tin gió mùa đông bắc mới nhất: Ngày mai, nhiều nơi có mưa to đến rất to

Theo dự báo, mưa lớn tại khu vực miền Trung còn kéo dài trong vài ngày tới do ảnh hưởng của hoàn lưu áp thấp nhiệt đới và đợt không khí lạnh mới sắp tràn xuống.

15 phút trước Xã hội

Toyota Camry thêm phiên bản đặc biệt: Nội thất toàn da thật và nhung, nút 'boss' cho sếp ngồi thoải mái, mạnh 194 mã lực

Phiên bản đặc biệt Toyota Camry Glorious ra mắt tại Trung Quốc với diện mạo thể thao cùng màu sơn độc đáo. Mẫu xe này hứa hẹn sẽ hâm nóng lại thị trường sedan hybrid đang có phần ảm đạm ở thị trường này.

15 phút trước Tiêu điểm

Chuyện chưa từng có: Internet 'cạn sạch dữ liệu', OpenAI phải thuê người viết code để 'nuôi sống' ChatGPT-5?

Theo OpenAI, nguồn dữ liệu công khai từ Internet được cho là không đủ phong phú và chất lượng để làm cho GPT-5 "thông minh hơn" đáng kể so với GPT-4.

Cùng chủ đề

Ukraine nhận được 1 tỉ USD nhờ tài sản đóng băng của Nga

Quốc gia ĐNÁ trở thành thị trường lớn thứ 3 của Mitsubishi, có lịch sử hơn 70 năm gắn bó

Nga "chi đậm" 4 tỷ USD nâng cấp kênh giao thương trọng yếu với Trung Quốc vẫn không ngăn được suy thoái

Tàu chiến Mỹ suýt bắn nhầm “quân mình” lần hai

Vừa 'chốt đơn' nhận nửa triệu thùng một ngày, quốc gia chủ chốt của BRICS 'kêu trời' vì khó mua dầu Nga: Chuyện gì đang xảy ra?

EU trên đường 'cai' khí đốt Nga

Mới cập nhật