Thứ Năm, 9 tháng 3, 2023

Trung Quốc: Baidu ráng bắt chước ChatGPT cho Trung Quốc

 Ts. Phạm Đình Bá

10/3/2023

ChatGPT: New AI chatbot has everyone talking to it - BBC News

Nhân viên ở Baidu (công ty điều hành công cụ tìm kiếm lớn nhất Trung Quốc) làm việc suốt ngày đêm cho biết chatbot AI (trí tuệ nhân tạo), được đặt tên là Ernie Bot, vẫn chưa hoàn hảo để triển khai theo kế hoạch mà Baidu đã định đặt vào ngày 16/03/2023. [1]

Một tuần trước khi Baidu muốn ra mắt ChatGPT tương đương, nhân viên tại công ty cho biết họ đang chạy đua để kịp thời hạn nhưng vẫn đang gặp khó khăn trong việc thực hiện một số chức năng cơ bản của chatbot Ernie của họ.

Để phát triển chatbot hỗ trợ trí tuệ nhân tạo, hàng trăm nhân viên đã làm việc suốt ngày đêm, những người quen thuộc với dự án cho biết. Họ cho biết các nhóm khác đã được yêu cầu cho mượn nhân viên và các chíp máy tính mạnh mẽ của họ, thứ mà các công ty Trung Quốc không còn có thể mua được do lệnh trừng phạt của Hoa Kỳ.


Một số người cho biết mô hình ngôn ngữ AI nền tảng của chatbot vẫn đang được đào tạo với dữ liệu trước khi ra mắt theo lịch trình, một sự kiện rất được mong đợi trong ngành công nghệ AI Trung Quốc. Một số nhân viên cho biết họ không có đủ thời gian để xây dựng một sản phẩm hoạt động tốt.

Baidu có kế hoạch triển khai sản phẩm theo từng giai đoạn, đầu tiên là mở Ernie bot để thử nghiệm công khai cho một nhóm người dùng hạn chế, những người đã thông báo về kế hoạch cho biết. Tháng trước, Baidu cho biết họ sẽ dùng Ernie bot trong công cụ tìm kiếm của Baidu trước tiên và sẽ dùng Ernie bot sâu rộng cho công chúng vào tháng Ba.

Sự vội vã phản ánh cách Baidu đang thực hiện một canh bạc có tính toán để vượt lên trước các đối thủ Trung Quốc gần đây đã công bố các kế hoạch tương tự. Công ty cho biết họ đã ký thỏa thuận với hơn 400 công ty Trung Quốc, những công ty này sẽ có thể sử dụng Ernie bot trong các sản phẩm và dịch vụ của họ. Đổi lại, chatbot sẽ có kinh nghiệm chạy trong các kịch bản khác nhau để giúp cải thiện hiệu suất của nó, Baidu cho biết.

Một sự ra mắt thành công có thể giúp đưa công ty Baidu, vốn đã không còn được các nhà đầu tư ưa chuộng trong những năm gần đây, trở lại hàng ngũ những công ty công nghệ nổi bật nhất của Trung Quốc. Thất bại có thể khiến Baidu chịu số phận tương tự như Google, công ty Google vẫn tiếp cận tương đối thận trọng với AI cho đến gần đây, sau đó mất 100 tỷ đô la vốn hóa thị trường sau khi công cụ tìm kiếm chatbot do AI cung cấp đã tạo ra các lỗi thực tế trong một công cụ thử nghiệm.

Kết quả của Baidu ráng bắt chước ChatGPT có thể có ý nghĩa đối với mối quan hệ của Baidu với chính phủ Trung Quốc cũng như quan điểm của chính phủ về các công nghệ AI tổng quát để tạo ra nội dung với chữ, tiếng, hình và mã lập trình.

Baidu đã nhận được sự khuyến khích về kế hoạch xây dựng chatbot từ nhà nước ở thành phố Bắc Kinh, nơi công ty đặt trụ sở, những người đã thông báo về vấn đề này cho biết. Ernie bot có thể sẽ là công cụ AI tương tự đầu tiên ở Trung Quốc cạnh tranh với ChatGPT, được phát triển bởi công ty nghiên cứu OpenAI có trụ sở tại San Francisco. Trung Quốc và Mỹ đang chạy đua để tăng cường sức mạnh tương ứng của họ trong các công nghệ chiến lược về trí tuệ nhân tạo.

Các quan chức thành phố Bắc Kinh cũng đã nhắc nhở Baidu đảm bảo rằng dịch vụ của họ sẽ tuân thủ luật pháp và quy định của Trung Quốc, bao gồm cả việc thu thập và xử lý dữ liệu, cũng như các quy tắc kiểm duyệt internet nghiêm ngặt của nhà nước.

Tuần này, Wang Zhigang, Bộ trưởng Bộ Khoa học và Công nghệ Trung Quốc, nói rằng việc phát triển một sản phẩm giống như ChatGPT sẽ rất khó khăn.

 “Chơi bóng chỉ là lừa banh và sút, nhưng không dễ để giỏi như Messi,” ông Wang nói, nhắc đến vận động viên người Argentina Lionel Messi. Ông nói thêm, Trung Quốc đã nghiên cứu lĩnh vực này từ lâu, nhưng “chúng ta sẽ phải chờ xem liệu chúng ta có thể đạt được kết quả như của OpenAI hay không”.

Trong nhiều năm, Baidu đã đầu tư rất nhiều vào việc phát triển các mô hình ngôn ngữ lớn—công nghệ nền tảng cho ChatGPT—điều chỉnh các phiên bản tiếng Anh từ Google và OpenAI cho tiếng Trung Quốc. Cố gắng để thích nghi công cụ tiếng Anh sang tiếng Hoa đã phát hành công cụ AI đầu tiên vào năm 2019, gọi là Ernie, sau khi Google đặt tên cho mẫu của họ là Bert—cả hai đều ám chỉ các nhân vật trong bộ phim “Sesame Street” ở Mỹ.

Vào cuối tháng 12/2022, khi dư luận xôn xao về ChatGPT, Giám đốc điều hành Baidu Robin Li đã nói chuyện với nhân viên về tiến bộ mới. “Chúng ta có công nghệ AI tuyệt vời như vậy, nhưng chúng ta có thể biến nó thành sản phẩm mà mọi người cần không?” ông ấy nói. “Đây thực sự là bước khó khăn nhất, nhưng cũng là bước lớn nhất và có ảnh hưởng nhất.”

Vào đầu tháng 1/2023, các giám đốc điều hành của Baidu đã yêu cầu nhóm xử lý ngôn ngữ tự nhiên của họ bắt đầu tạo ra một sản phẩm giống như ChatGPT với các mô hình Ernie, những người quen thuộc với dự án cho biết.

Nhưng dự án để sao chép ChatGPT đã phải đối mặt với những thách thức, theo chia xẻ của các nhà phát triển AI khác đang làm việc trên công nghệ giống như ChatGPT. Một là làm cho mô hình AI trả lời chính xác hơn các câu hỏi của người dùng, bằng cách dạy nó phân biệt giữa các cụm từ có nhiều nghĩa (ví dụ như ‘ăn cá’ hay “ ‘ăn cá’ độ”) hoặc tên có thể đề cập đến nhiều người (ví dụ như “Phạm Minh Chính” là ông thủ tướng hay “Phạm Minh Chính” là một người bị điên ở Hà Nội). Một cách khác là làm cho chatbot tạo ra ngôn ngữ giống ngôn ngữ của con người hơn (ví dụ như cách diễn đạt của cả hai ông Chính).

Thứ ba là cải thiện độ chính xác thực tế của nó - một giới hạn kỹ thuật của các mô hình ngôn ngữ lớn, vốn kết hợp các câu lại với nhau dựa trên xác suất mà các từ khác nhau có thể xuất hiện cùng nhau thay vì trên ý nghĩa của các mẩu thông tin. Hạn chế này cũng khiến các mô hình như vậy khó kiểm soát để tránh các chủ đề nhạy cảm, trở ngại cho việc kiểm duyệt.

Baidu đã thuê các nhà thầu để giúp xem xét và cải thiện các câu trả lời của chatbot.

Các nhân viên làm việc trong dự án nói rằng mỗi bước đi đều cần có thời gian. Các nhà nghiên cứu AI cho biết, việc đào tạo đúng cách một mô hình ngôn ngữ có quy mô như vậy — với hàng nghìn con chip — có thể mất nhiều thời gian, hàng tuần, hàng tháng hay có khi hàng năm.

Tuần này, các kỹ sư và giám đốc sản phẩm của Baidu đang gấp rút cải thiện các chức năng cơ bản của Ernie bot, chẳng hạn như tốc độ trả lời cho các câu hỏi của người dùng và cách tóm tắt kết quả tìm kiếm để cấu thành câu trả lời, những người quen thuộc với vấn đề này cho biết.

Nhóm phát triển đã làm việc không ngừng nghỉ, kể cả trong suốt kỳ nghỉ Tết Nguyên đán kéo dài một tuần vào cuối tháng 1, những người này cho biết. Họ cho biết hiện tại dự án đã được thu nhỏ lại từ việc tạo ra một chatbot song ngữ có khả năng trò chuyện bằng tiếng Trung và tiếng Anh sang một loại chủ yếu tập trung vào tiếng Trung.

Nghiên cứu và phát triển của Ernie Bot được giám sát bởi giám đốc công nghệ của Baidu, Haifeng Wang, và được thực hiện phần lớn bởi bộ phận phát triển công nghệ của họ, với sự tham gia của nhóm xử lý ngôn ngữ tự nhiên và nhóm kinh doanh hệ sinh thái di động, những người quen thuộc với vấn đề này cho biết. Một số người cho biết đơn vị AI trên mạng mây của Baidu đang cung cấp hỗ trợ điện toán từ các công nghệ điện toán triển khai rộng trên mạng mây.

Để đẩy nhanh quá trình, các giám đốc điều hành đã tập hợp nhiều nguồn lực hơn. Sau kỳ nghỉ Tết Nguyên đán, các nhà lãnh đạo công ty Baidu đã yêu cầu các nhóm nghiên cứu AI trong toàn công ty, bao gồm cả bộ phận lái xe tự hành, cho mượn chip máy tính mạnh nhất của họ, gồm chíp máy tính A100 từ công ty Nvidia của Mỹ, để phát triển Ernie bot, những người quen thuộc với vấn đề này cho biết. Các biện pháp trừng phạt chíp máy tính của Hoa Kỳ gần đây đã cấm các công ty Trung Quốc mua chíp máy tính A100 mới trực tiếp từ Mỹ.

Một số người cho biết các nhân viên cũng đã được huy động để giúp đỡ, đặc biệt là để làm sạch dữ liệu đào tạo, chẳng hạn như lọc nội dung chất lượng thấp. Baidu cũng đã thuê các đội bên ngoài để làm sạch dữ liệu, một số người cho biết.

Những người quen thuộc với vấn đề này cho biết, việc làm việc cận lực để thành công trong một thời gian ngắn có thể tạo khủng hoảng cho một số nhân viên khi họ lo lắng về việc liệu Ernie Bot có đáp ứng được kỳ vọng của người dùng hay thị trường hay không. Một số nhân viên cho biết họ đã bán một số cổ phiếu của công ty Baidu trước khi Ernie bot ra mắt vì những lo ngại đó.

Nguồn:

1. Wall Street Journal. Baidu Scrambles to Ready China’s First ChatGPT Equivalent Ahead of Launch. 9/3/2023; Available from: https://www.wsj.com/articles/baidu-scrambles-to-ready-chinas-first-chatgpt-rival-ahead-of-launch-bf359ca4?mod=djem10point.


Không có nhận xét nào:

Đăng nhận xét