Thứ Sáu, ngày 14 tháng 03 năm 2025

Giải mã DeepSeek - ứng dụng đang gây “bão” giới công nghệ

Ngày phát hành: 06/02/2025 Lượt xem 1467

Ngay từ những ngày đầu năm 2025, sự xuất hiện của DeepSeek, một mô hình Trí tuệ nhân tạo (AI) đầy hứa hẹn từ Trung Quốc, đã gây “bão” giới công nghệ. Dù mô hình AI DeepSeek có tuổi đời non trẻ, mới hình thành từ cách đây một năm, song sức mạnh của DeepSeek đã có thể sánh ngang hoặc thậm chí vượt trội so với những mô hình AI nổi tiếng như ChatGPT của OpenAI, Gemini của Google, CoPilot của Microsoft hay Llama của Meta… Kể từ sau khi được công bố từ cuối tháng 1/2025 đến nay, DeepSeek đã bất ngờ trở thành ứng dụng miễn phí được tải xuống nhiều nhất trên kho ứng dụng (App Store) của Apple tại Mỹ, vượt qua cả ChatGPT của OpenAI.

 


Giải mã DeepSeek

 
DeepSeek là một công ty trí tuệ nhân tạo (AI) của Trung Quốc mới thành lập từ năm 2023. Khi đó DeepSeek chỉ là một phòng thí nghiệm nhỏ có trụ sở tại thành phố Hàng Châu (Trung Quốc), đã được ông Lương Văn Phong và một nhóm kỹ sư trẻ người Trung Quốc thành lập với mục đích phát triển các mô hình AI mã nguồn mở.  Chỉ hơn một năm sau khi hình thành, DeepSeek đã ra mắt sản phẩm cốt lõi DeepSeek-R1 vào ngày 20/1/2025, gây sốc cho giới công nghệ toàn cầu. Dù còn non trẻ, nhưng DeepSeek đã gây chú ý và khiến các công ty công nghệ “khổng lồ” ở Thung lũng Silicon (Silicon Valley) lo ngại, khi giới thiệu các mô hình AI có hiệu suất ngang tầm những chatbot hàng đầu thế giới, nhưng với chi phí phát triển thấp hơn nhiều.


Mô hình này đã nhanh chóng thu hút được sự chú ý đáng kể nhờ khả năng lập luận tiên tiến, được cho là đã đạt được hiệu suất tương đương với các hệ thống AI hàng đầu, như ChatGPT của OpenAI, nhưng với chi phí phát triển chỉ bằng một phần nhỏ. Đến ngày 27/1/2025, chỉ một tuần sau khi ra mắt, ứng dụng DeepSeek đã vươn lên đứng đầu bảng xếp hạng các ứng dụng được tải xuống miễn phí trên “chợ phần mềm” App Store tại cả Trung Quốc và Mỹ, vượt qua cả ChatGPT của OpenAI.


DeepSeek được xem là một giải pháp thay thế ChatGPT. Khi sử dụng ứng dụng này, người dùng có thể sử dụng chatbot để phân tích tệp, trả lời câu hỏi và tìm thông tin trực tuyến. Ứng dụng miễn phí, cho phép tải tệp lên và đồng bộ hóa lịch sử trò chuyện trên nhiều thiết bị. Đây là một mô hình AI mang tính đột phá, có khả năng thiết lập một tiêu chuẩn mới trên toàn cầu, không chỉ về hiệu suất mà còn về giá cả và chiến lược phát triển nguồn mở. Vì thế mà ngay khi ra mắt, DeepSeek đã gây bão trong cộng đồng AI, vượt qua nhiều mô hình AI hàng đầu, bao gồm cả AI nguồn đóng, thách thức quan điểm rằng AI nguồn mở chỉ có thể đóng vai trò thứ yếu. Việc sử dụng các công nghệ nguồn mở khiến DeepSeek trở nên hấp dẫn đối với các nhà phát triển và doanh nghiệp muốn tích hợp các giải pháp AI vào cơ sở hạ tầng hiện có mà không phải đầu tư nhiều vào nguồn lực công nghệ thông tin đắt đỏ. DeepSeek có tốc độ và hiệu quả ấn tượng, xử lý thông tin với tốc độ chóng mặt.


Nhưng điều thực sự khiến giới công nghệ chấn động là trong khi OpenAI và Meta của Mỹ phải mất hàng tỷ USD để phát triển thì DeepSeek lại tiết lộ rằng họ đã phát triển mô hình mới nhất của mình, DeepSeek-R1, với chi phí chỉ 5,6 triệu USD - một con số cực nhỏ so với hàng tỷ USD mà các gã khổng lồ công nghệ Mỹ đã đổ vào AI. Trước đó, trí tuệ nhân tạo (AI) bắt đầu bùng nổ và gây chú ý kể từ sau sự kiện ra mắt của ChatGPT vào cuối năm 2022, đưa Nvidia trở thành một trong những công ty có giá trị nhất thế giới về phát triển AI.


Việc ứng dụng DeepSeek vươn lên đứng đầu bảng xếp hạng các ứng dụng được tải xuống miễn phí trên “chợ phần mềm” App Store tại cả Trung Quốc và Mỹ, vượt qua cả ChatGPT của OpenAI vào ngày 27/1 vừa qua đã gây ra những cơn địa chấn trong lĩnh vực công nghệ Mỹ, khiến giá cổ phiếu của Nvidia, nhà sản xuất chip hàng đầu của Mỹ, bất ngờ giảm mạnh 17% và giá trị thị trường của công ty này bốc hơi gần 600 tỷ USD trong cùng ngày, lập kỷ lục về mức giảm trong một ngày cao nhất của một công ty trong lịch sử thị trường chứng khoán Mỹ. Không những vậy, cổ phiếu của các công ty công nghệ châu Âu và Mỹ cũng giảm mạnh, như cổ phiếu của nhà sản xuất chip Broadcom giảm 17%, AMD giảm 6,4%. Các cổ phiếu lĩnh vực AI khác ở Mỹ cũng đi xuống như Micron mất 8%, Arm Holdings mất 9%... trong khi công ty Hà Lan ASML, chuyên sản xuất máy móc dùng để chế tạo chip bán dẫn, chứng kiến cổ phiếu của mình giảm 6,7%.


Vậy tại sao DeepSeek lại gây ra một cơn chấn động lớn như vậy với giới công nghệ?


Theo phân tích của tờ “Liên hợp buổi sáng”, phiên bản đầy đủ của mô hình ngôn ngữ lớn V3 của DeepSeek có dung lượng gần 700 gigabyte, lớn đến mức chỉ có thể chạy trên phần cứng chuyên nghiệp, có kích thước khổng lồ với 685 tỷ tham số. Trong khi đó, mô hình Llama 3.1 của Meta, công ty mẹ của Facebook, chỉ có 405 tỷ tham số. Kết quả thử nghiệm từ nền tảng mã hóa trí tuệ nhân tạo Aider cho thấy hiệu suất của DeepSeek chỉ đứng sau mô hình o1 của OpenAI. Hơn nữa, DeepSeek còn đạt được hiệu suất cao nhất với chi phí cực kỳ thấp. Công ty nghiên cứu độc lập Melius Research chỉ ra rằng DeepSeek có khả năng đã thành thạo phương pháp sử dụng bộ nhớ hiệu quả hơn và các chiến lược học tập tối ưu, để giảm chi phí đào tạo mô hình. Chi phí tạo ra thông tin cho mô hình của DeepSeek chỉ bằng 1/10 so với mô hình ChatGPT của OpenAI.


Ưu điểm của DeepSeek còn nằm ở việc cải tiến và tối ưu hóa thuật toán, giúp tiết kiệm năng lượng tính toán. Dữ liệu đầu vào và ngữ liệu của DeepSeek không đòi hỏi khối lượng dữ liệu và năng lượng tính toán lớn như các phần mềm AI tiên tiến khác.


Một số ước tính cho thấy rằng các mô hình AI lớn của phương Tây sử dụng 16.000 chất bán dẫn (chip) chuyên dụng. Tài liệu của DeepSeek cho thấy họ chỉ sử dụng khoảng 2.048 chip Nvidia H800, con chip này ban đầu là phiên bản đặc biệt dành cho thị trường Trung Quốc, với một số thông số hiệu suất được giảm xuống để tuân thủ các biện pháp kiểm soát xuất khẩu chip cao cấp của Mỹ đối với Trung Quốc vào năm 2022. Vào tháng 10/2023, H800 cũng được đưa vào lệnh cấm xuất khẩu của Mỹ sang Trung Quốc.


Nhưng mặc dù ứng dụng DeepSeek mang đến những tính năng thú vị thì cũng có ý kiến chỉ ra một số hạn chế nhất định, như ứng dụng này không hỗ trợ giọng nói hoặc khả năng tạo hình ảnh ngay lập tức như ChatGPT. Đôi khi, tốc độ phản hồi cũng không ổn định. Một số người dùng chỉ ra DeepSeek chỉ được đào tạo dựa trên dữ liệu đến tháng 7/2024. Vì vậy, nếu người dùng muốn tìm kiếm thông tin cập nhật mới nhất phải sử dụng công cụ tìm kiếm thay vì dựa vào mô hình AI này. Qua các kiểm chứng khác, nhiều hình ảnh hay thông tin đã bị DeepSeek “thay đổi”, cho ra kết quả không như thực tế.

Cuộc đua công nghệ càng gay cấn hơn

 
Theo các chuyên gia, sự ra đời của DeepSeek, một công ty có quy mô chưa đến 200 người, không cần dùng đến các tổ hợp chip quá mạnh mẽ trong khi hiệu quả vẫn vượt trội, sẽ buộc các ông lớn công nghệ Mỹ như OpenAI và Google phải xem xét lại chiến lược phát triển. Thay vì dồn tiền vào đầu tư phần cứng mua hàng chục nghìn con chip siêu tốc độ đắt đỏ của Nvidia hay xây dựng các nhà máy AI, các tập đoàn Mỹ có thể phải chuyển sang tối ưu thuật toán để giảm chi phí.


Theo tạp chí “The Economist”, trong hai năm qua, các phòng thí nghiệm AI lớn ở Mỹ đang cạnh tranh để xem mô hình của công ty nào có thể đạt được sự cải thiện nhỏ về chất lượng, thay vì quan tâm xem công ty nào có thể tạo ra mô hình rẻ, chất lượng cao và nhanh hơn. Về mặt này, DeepSeek đã chứng tỏ có cách tiếp cận tốt hơn so với đối thủ cạnh tranh.
Hiện các công ty khởi nghiệp công nghệ tại châu Âu đang dần chuyển sang sử dụng mô hình AI DeepSeek của Trung Quốc nhằm cắt giảm chi phí vận hành. Việc tiếp cận công nghệ AI với chi phí hợp lý đang mở ra nhiều cơ hội cho các công ty khởi nghiệp tại châu Âu, nơi trước đây gặp nhiều khó khăn trong việc theo kịp Mỹ do hạn chế về nguồn vốn. Theo các nhà phân tích, giá của DeepSeek rẻ hơn từ 20 - 40 lần so với OpenAI. Cụ thể, OpenAI tính phí 2,5 USD cho mỗi 1 triệu token đầu vào, trong khi giá của DeepSeek chỉ là 0,014 USD.


Trong năm 2024, gần 100 tỷ USD đã được đầu tư vào các công ty AI tại Mỹ, trong khi con số này ở châu Âu là khoảng 15,8 tỷ USD. Mỹ đang đẩy mạnh các dự án AI lớn, điển hình là dự án Stargate trị giá 500 tỷ USD do OpenAI, SoftBank và Oracle hợp tác phát triển.


Tại châu Âu, chỉ có công ty Mistral của Pháp nằm trong danh sách các mô hình AI hàng đầu, bên cạnh các tên tuổi lớn như OpenAI, Meta, Anthropic và Google.


Các chuyên gia nhận định sự xuất hiện của DeepSeek có thể góp phần thúc đẩy sự cạnh tranh và giảm giá thành trong lĩnh vực AI, từ đó mở ra xu hướng cạnh tranh mới trong ngành. Microsoft gần đây cũng đã cung cấp miễn phí mô hình AI o1 của OpenAI cho tất cả người dùng Copilot, thay vì thu phí 20 USD/tháng như trước đây.


Dù vậy, một số tập đoàn lớn như Nokia (Phần Lan) và SAP (Đức) vẫn thận trọng khi cân nhắc chuyển đổi sang DeepSeek. Ngoài chi phí, các doanh nghiệp còn quan tâm đến các yếu tố như chứng chỉ an ninh, khung pháp lý và hệ sinh thái phần mềm để đảm bảo khả năng tích hợp an toàn và hiệu quả.


Theo các chuyên gia, với sự ra đời của DeepSeek, cuộc đua AI không còn chỉ xoay quanh việc công ty hay quốc gia nào phát triển các mô hình tiên tiến nhất; mà ngày càng phụ thuộc vào việc ai khai thác AI hiệu quả nhất. Điều này dựa trên ba yếu tố chính là sức mạnh tính toán để triển khai AI, đổi mới và chuyển đổi doanh nghiệp để ứng dụng AI tốt hơn, và nhân tài để thúc đẩy sáng tạo.


Và chắc chắn, sự xuất hiện và gây “bão” của DeepSeek ngay đầu năm mới 2025 sẽ hứa hẹn cuộc cạnh trạnh trong lĩnh vực công nghệ nói chung, trong lĩnh vực AI nói riêng giữa các cường quốc trên thế giới sẽ ngày càng khốc liệt hơn./.

 

  Theo TTXVN

Tin Liên quan

Góp ý về nội dung bài viết