Công nghệ

DeepSeek: Ứng dụng AI của Trung Quốc khiến cả thế giới bàn tán

Minh Ngọc 29/01/2025 10:30

Mô hình trí tuệ nhân tạo (AI) do Trung Quốc sản xuất có tên DeepSeek đã nhanh chóng vươn lên dẫn đầu danh sách tải xuống của Apple Store, khiến các nhà đầu tư choáng váng và kéo tụt một số cổ phiếu công nghệ.

Sản phẩm này được phát hành vào ngày 20/1/2025 và nhanh chóng gây ấn tượng với những người đam mê AI, trước khi thu hút sự chú ý của toàn bộ ngành công nghệ và thế giới. DeepSeek đã trở thành ứng dụng miễn phí được tải xuống nhiều nhất tại Mỹ chỉ 1 tuần sau khi ra mắt.

Tổng thống Mỹ Donald Trump cho biết, DeepSeek là "lời cảnh tỉnh" cho các công ty công nghệ của Mỹ phải tập trung vào "cạnh tranh để giành chiến thắng".

27deepseek-explainer-1-01-hpmc-videosixteenbynine3000.jpg

Điều làm chấn động ngành công nghiệp này là tuyên bố của nhóm nghiên cứu rằng, DeepSeek được xây dựng với chi phí chỉ bằng một phần nhỏ so với các mô hình hàng đầu trong ngành như OpenAI - vì sử dụng ít chip tiên tiến hơn.

Khả năng đó khiến "gã khổng lồ" sản xuất chip Nvidia mất gần 600 tỷ USD giá trị thị trường vào thứ Hai vừa qua - mức lỗ trong ngày lớn nhất lịch sử nước Mỹ.

DeepSeek cũng đặt ra câu hỏi về những nỗ lực của Washington nhằm kiềm chế tham vọng thống trị công nghệ của Bắc Kinh - một trong những hạn chế chính là lệnh cấm xuất khẩu chip tiên tiến sang Trung Quốc.

Tuy nhiên, Bắc Kinh đã "đáp trả" với việc Chủ tịch Tập Cận Bình tuyên bố AI là ưu tiên hàng đầu. Các công ty khởi nghiệp như DeepSeek đóng vai trò quan trọng khi Trung Quốc chuyển hướng từ sản xuất truyền thống - quần áo và đồ nội thất sang công nghệ tiên tiến - chip, xe điện và AI.

DeepSeek là gì?

Đôi khi, AI có thể khiến máy tính trông giống như một con người. Máy móc sử dụng công nghệ để học và giải quyết vấn đề, thường bằng cách được đào tạo với lượng thông tin khổng lồ và nhận dạng các mẫu hình. Kết quả cuối cùng là phần mềm có thể trò chuyện như con người hoặc dự đoán thói quen mua sắm của mọi người.

Trong những năm gần đây, công nghệ này được biết đến nhiều nhất với vai trò là công nghệ đằng sau các chatbot như ChatGPT - và DeepSeek - hay còn gọi là AI tạo sinh. Các chương trình này học hỏi từ khối lượng dữ liệu khổng lồ, bao gồm văn bản và hình ảnh trực tuyến để có thể tạo ra nội dung mới.

DeepSeek là tên của chatbot miễn phí hỗ trợ AI, có giao diện, cảm giác và hoạt động rất giống với ChatGPT. Điều đó có nghĩa là DeepSeek được sử dụng cho nhiều nhiệm vụ tương tự, mặc dù hiệu quả thực sự của nó so với các đối thủ cạnh tranh như thế nào vẫn còn là vấn đề gây tranh cãi. Nhưng mô hình AI hỗ trợ DeepSeek - được gọi là R1 - có khoảng 670 tỷ tham số, khiến công nghệ này trở thành mô hình nguồn mở có khả năng suy luận lớn nhất cho đến nay, theo Anil Ananthaswamy, tác giả của cuốn Why Machines Learn: The Elegant Math Behind Modern AI.

Theo như báo cáo, DeepSeek mạnh mẽ như mô hình O1 của OpenAI - được OpenAI phát hành vào cuối năm ngoái - về mặt toán học, mã hóa và lập luận.

R1 được gọi là mô hình lý luận. Các mô hình này tạo ra phản hồi theo từng bước, mô phỏng một quá trình tương tự như cách con người lý luận thông qua các vấn đề hoặc ý tưởng. Nó sử dụng ít bộ nhớ hơn so với các đối thủ cạnh tranh, cuối cùng là giảm chi phí thực hiện nhiệm vụ.

Giống như nhiều mô hình AI khác của Trung Quốc - Ernie của Baidu hay Doubao của ByteDance - DeepSeek được đào tạo để tránh các câu hỏi nhạy cảm về mặt chính trị. Khi đó, trợ lý sẽ trả lời: "Tôi rất tiếc, nhưng tôi không thể trả lời câu hỏi đó. Tôi là trợ lý AI được thiết kế để cung cấp những câu trả lời hữu ích và vô hại."

Theo chuyên gia của Mỹ, kiểm duyệt của chính phủ Trung Quốc là thách thức lớn đối với tham vọng AI của nước này trên trường quốc tế. Nhưng mô hình cơ sở của DeepSeek dường như đã được đào tạo thông qua các nguồn chính xác, đồng thời đưa vào lớp kiểm duyệt hoặc giữ lại một số thông tin thông qua một lớp bảo vệ bổ sung.

Deepseek cho biết, có thể thực hiện điều này với chi phí rẻ. Các nhà nghiên cứu đứng sau công cụ này khẳng định, với chi phí xây dựng là 6 triệu USD, chỉ bằng một phần nhỏ so với "hơn 100 triệu USD" mà CEO của OpenAI là Sam Altman ám chỉ khi thảo luận về ChatGPT4.

Công ty đã làm điều này chính xác như thế nào vẫn chưa rõ. Người sáng lập DeepSeek được cho là đã xây dựng một kho chip Nvidia A100, loại chip đã bị cấm xuất khẩu sang Trung Quốc kể từ tháng 9/2022. Các chuyên gia tin rằng, bộ sưu tập này - một số người ước tính lên tới 50.000 chiếc - đã giúp xây dựng được một mô hình AI mạnh mẽ, bằng cách ghép nối những con chip này với những con chip rẻ hơn và ít tinh vi hơn.

Ai là người sáng lập DeepSeek?

DeepSeek được ông Liang Wenfeng thành lập vào tháng 12/2023 và phát hành mô hình ngôn ngữ lớn AI đầu tiên vào năm 2024.

Không ai biết nhiều về người đàn ông này, chỉ có thông tin rằng, ông Liang đã tốt nghiệp Đại học Chiết Giang với bằng kỹ sư thông tin điện tử và khoa học máy tính. Nhưng giờ đây, đây là nhân vật đang trong "tầm ngắm" của quốc tế.

Gần đây, ông Liang đã xuất hiện tại cuộc họp do thủ tướng Trung Quốc Lý Cường chủ trì, phản ánh vị thế ngày càng nổi bật của DeepSeek trong ngành AI.

Không giống như nhiều doanh nhân AI người Mỹ đến từ Thung lũng Silicon, ông Liang còn có nền tảng về tài chính.

Ông là CEO của một quỹ đầu cơ có tên là High-Flyer, sử dụng AI để phân tích dữ liệu tài chính nhằm đưa ra quyết định đầu tư - gọi là giao dịch định lượng. Năm 2019, High-Flyer trở thành quỹ đầu cơ định lượng đầu tiên tại Trung Quốc, huy động được hơn 100 tỷ Nhân dân tệ (13 triệu USD).

Trong bài phát biểu năm đó, ông Liang nói: "Nếu Mỹ có thể phát triển lĩnh vực thương mại định lượng của mình thì tại sao Trung Quốc lại không thể?".

Trong cuộc phỏng vấn hiếm hoi vào năm ngoái, ông cho biết, lĩnh vực AI của Trung Quốc "không thể mãi là kẻ đi sau", ông nói thêm: "Chúng ta thường nói rằng, có khoảng cách 1 hoặc 2 năm giữa AI của Trung Quốc và Mỹ, nhưng khoảng cách thực sự là giữa tính độc đáo và tính bắt chước. Nếu điều này không thay đổi, Trung Quốc sẽ luôn là kẻ đi sau".

Khi được hỏi tại sao mô hình của DeepSeek lại khiến nhiều người ở Thung lũng Silicon ngạc nhiên đến vậy, ông cho biết: "Sự ngạc nhiên đó bắt nguồn từ việc thấy một công ty Trung Quốc tham gia trò chơi của họ với tư cách là một nhà đổi mới, chứ không chỉ là kẻ đi sau - điều mà hầu hết các công ty Trung Quốc đã quen bị gọi".

Trong khi đó, nhiều chuyên gia trong ngành đã nêu ra một số nghi ngờ về tính bảo mật của ứng dụng do có rất nhiều câu hỏi cần được trả lời kịp thời về chất lượng, sở thích của người tiêu dùng, dữ liệu và quản lý quyền riêng tư.

Các công ty của Mỹ bị ảnh hưởng như thế nào?

Những thành tựu của DeepSeek đã làm suy yếu niềm tin rằng, ngân sách lớn và chip tiên tiến hàng đầu là cách duy nhất để phát triển AI, tạo ra sự không chắc chắn về tương lai của chip hiệu suất cao.

Ông Wei Sun, nhà phân tích AI tại Counterpoint Research cho biết, DeepSeek đã chứng minh rằng các mô hình AI tiên tiến có thể được phát triển với nguồn tài nguyên tính toán hạn chế.

Ngược lại, OpenAI, được định giá 157 tỷ USD, đang phải đối mặt với sự giám sát về khả năng duy trì lợi thế thống lĩnh trong lĩnh vực đổi mới hoặc biện minh cho mức định giá và chi tiêu khổng lồ của mình mà không mang lại lợi nhuận đáng kể.

Chi phí thấp hơn của DeepSeek có thể đã làm chao đảo thị trường tài chính vào ngày 27/1, khiến chỉ số Nasdaq giảm hơn 3% trong đợt bán tháo rộng rãi, bao gồm các nhà sản xuất chip và trung tâm dữ liệu trên toàn thế giới.

Nvidia dường như bị ảnh hưởng nặng nề nhất khi giá cổ phiếu của công ty giảm 17% chỉ trong 1 ngày. Nhà sản xuất chip này từng là công ty có giá trị nhất thế giới khi xét theo vốn hóa thị trường nhưng đã tụt xuống vị trí thứ 3 sau Apple và Microsoft vào thứ Hai, khi giá trị thị trường của công ty giảm từ 3,5 nghìn tỷ USD xuống còn 2,9 nghìn tỷ USD.

Trung Quốc đang ăn mừng tác động của DeepSeek

Sự phát triển của DeepSeek là động lực to lớn cho chính phủ Trung Quốc, vốn đang tìm cách xây dựng công nghệ độc lập với phương Tây.

Trong khi chính phủ vẫn chưa đưa ra bình luận, truyền thông Trung Quốc rất muốn đưa tin rằng, các "gã khổng lồ" ở Thung lũng Silicon và Phố Wall đang "mất ngủ" vì DeepSeek, công ty đang "làm đảo lộn" thị trường chứng khoán Mỹ.

"Ở Trung Quốc, những tiến bộ của DeepSeek đang được ca ngợi như minh chứng cho sức mạnh công nghệ ngày càng tăng và khả năng tự lực của đất nước này", bà Marina Zhang, Phó Giáo sư tại Đại học Công nghệ Sydney cho rằng: "Thành công của DeepSeek được coi là sự xác nhận cho đổi mới sáng tạo 2.0 của Trung Quốc, một kỷ nguyên mới của sự lãnh đạo công nghệ trong nước do thế hệ doanh nhân trẻ thúc đẩy".

Nhưng bà cũng cảnh báo rằng, tình trạng này cũng có thể dẫn đến "chủ nghĩa cô lập công nghệ".

(Theo BBC News)

(0) Bình luận
Nổi bật
Đừng bỏ lỡ
DeepSeek: Ứng dụng AI của Trung Quốc khiến cả thế giới bàn tán
POWERED BY ONECMS - A PRODUCT OF NEKO