DeepSeek Ungkap Cara Hemat Latih AI Tandingan GPT

BEIJING, TINTAHIJAU.com Startup kecerdasan buatan (AI) asal Tiongkok, DeepSeek, mengungkap strategi efisien dalam melatih model AI open source mereka yang disebut-sebut mampu menyaingi performa GPT milik OpenAI, namun dengan biaya jauh lebih murah.

Dalam laporan yang dirilis pendirinya, Liang Wenfeng, DeepSeek menguraikan bagaimana model terbaru mereka, DeepSeek-V3, berhasil dilatih menggunakan 2.048 unit GPU Nvidia H800. GPU tersebut merupakan perangkat keras khusus yang awalnya dirancang Nvidia untuk pasar Tiongkok guna menghindari sanksi ekspor dari Amerika Serikat.

“DeepSeek-V3 yang dilatih menggunakan 2.048 GPU Nvidia H800 memperlihatkan bagaimana model hardware bisa mengubah tantangan ini secara efektif, membuat pelatihan dan inference dalam skala menjadi efisien,” tulis Liang dalam laporan yang dikutip detikINET dari South China Morning Post (SCMP), Senin (19/5/2025).

DeepSeek dan mitra pendananya, High-Flyer, disebut telah lebih dulu menimbun GPU H800 sebelum Amerika Serikat memperluas larangan ekspor perangkat keras tersebut pada 2023. Langkah strategis ini memungkinkan DeepSeek untuk melatih model AI secara masif tanpa terkendala pembatasan teknologi.

Selain penghematan dari sisi hardware, DeepSeek juga mengadopsi serangkaian optimasi teknis guna meningkatkan efisiensi memori dan komunikasi antar chip. Infrastruktur AI mereka turut diperkuat agar mampu menangani skala pelatihan besar dengan performa inference yang lebih cepat.

Metode yang diterapkan startup ini bukan hanya berhasil menurunkan biaya komputasi secara signifikan, namun juga mulai diadopsi oleh banyak pengembang AI lain di Tiongkok. Alibaba, salah satunya, menggunakan pendekatan serupa dalam pengembangan model AI Qwen3.

DeepSeek pertama kali merilis model V3 pada Desember 2024, disusul model R1 sebulan kemudian. Kedua model tersebut mengejutkan komunitas teknologi global karena efisiensi daya komputasi yang tinggi namun tetap mampu menyajikan performa setara model GPT dari OpenAI.

Namun sejak peluncuran itu, perusahaan justru cenderung tertutup mengenai rencana pengembangan lanjutan. DeepSeek hanya merilis pembaruan riset mereka secara berkala ke publik, tanpa banyak pengumuman besar.

Sementara itu, dalam enam bulan terakhir, geliat inovasi AI di Tiongkok terus meningkat. Raksasa teknologi seperti Baidu dan Alibaba turut berlomba menghadirkan model AI multimodal yang kompetitif.

Pada April lalu, Baidu meluncurkan Ernie 4.5 Turbo dan X1 Turbo, yang diklaim memiliki kemampuan reasoning multimodal dengan harga 40% lebih murah dibanding DeepSeek-V3. Di sisi lain, Alibaba memperkenalkan model terbaru Qwen yang kini telah menyalip DeepSeek-V3 sebagai model AI open source paling populer secara global.

Langkah DeepSeek menjadi cermin transformasi lanskap pengembangan AI di Tiongkok, yang kini tak hanya mengejar efisiensi, namun juga kemandirian teknologi di tengah ketatnya persaingan global dan tekanan geopolitik.