Logo JawaPos
Author avatar - Image
Sabtu, 20 September 2025 | 03.09 WIB

Heboh! DeepSeek AI Klaim Kembangkan Model R1 Hanya dengan Rp 4,8 Miliar, Jauh Lebih Murah dari Pesaing AS

Perusahaan AI asal Tiongkok, DeepSeek mampu mengefisiensi biaya pelatihan model R1 (Dok. Belstad)

JawaPos.com - Pengembang kecerdasan buatan (AI) asal Tiongkok, DeepSeek, mengatakan pihaknya hanya menghabiskan USD 294.000 atau setara Rp 4,8 miliar untuk melatih model R1-nya. Biaya ini jauh lebih rendah dibanding angka yang dilaporkan untuk para pesaingnya di AS. Nilai biaya itu muncul dalam sebuah makalah yang kemungkinan akan memicu kembali perdebatan mengenai posisi Beijing dalam perlombaan pengembangan kecerdasan buatan.

Dilansir dari Reuters, pembaruan langka dari perusahaan yang berpusat di Hangzhou itu muncul dalam artikel tinjauan sejawat di jurnal akademis Nature yang diterbitkan pada Rabu lalu (17/9/2025). Jurnal Nature memuat data perihal biaya pelatihan model R1 DeepSeek.

Tak heran, perilisan DeepSeek sebagai sistem AI berbiaya rendah pada bulan Januari lalu mendorong investor global untuk melepas saham teknologi. Pasalnya, para investor khawatir model baru itu dapat mengancam dominasi para pemimpin AI, termasuk Nvidia. Sejak saat itu, perusahaan DeepSeek dan pendirinya, Liang Wenfeng, menghilang dari pandangan publik, selain mengeluarkan beberapa pembaruan produk baru.

Artikel pada jurnal Nature, yang mencantumkan Liang sebagai salah satu penulis, menyatakan bahwa model R1 DeepSeek yang berfokus pada penalaran membutuhkan biaya pelatihan sebesar USD 294.000 dan menggunakan 512 chip Nvidia H800. Versi artikel sebelumnya yang diterbitkan pada bulan Januari tidak memuat informasi ini.

Biaya pelatihan untuk model bahasa besar yang mendukung chatbot AI merujuk pada biaya yang dikeluarkan untuk menjalankan sekumpulan chip canggih selama berminggu-minggu atau berbulan-bulan guna memproses teks dan kode dalam jumlah besar.

Sam Altman, CEO raksasa AI di AS, OpenAI, mengatakan pada tahun 2023 bahwa pelatihan model dasar telah menghabiskan biaya jauh lebih banyak dari USD 100 juta atau sekitar Rp 1,6 triliun. Meskipun perusahaannya belum memberikan angka rinci untuk rilis apa pun.

Perdebatan Mengenai Chip dan Metode Pelatihan

Beberapa pernyataan DeepSeek tentang biaya pengembangan dan teknologi yang digunakannya telah dipertanyakan oleh perusahaan dan pejabat AS. Chip H800 yang digunakan DeepSeek dirancang oleh Nvidia untuk pasar Tiongkok setelah AS melarang ekspor chip H100 dan A100 yang lebih canggih ke Tiongkok pada Oktober 2022.

Para pejabat AS mengatakan kepada Reuters pada bulan Juni bahwa DeepSeek memiliki akses ke sejumlah besar chip H100 yang diperoleh setelah kontrol ekspor AS diterapkan. Namun, Nvidia mengatakan kepada Reuters saat itu bahwa DeepSeek telah menggunakan chip H800 yang diperoleh secara sah, bukan H100.

Dalam dokumen informasi tambahan yang menyertai artikel Nature, perusahaan DeepSeek untuk pertama kalinya mengakui memiliki chip A100 dan mengatakan telah menggunakannya pada tahap persiapan pengembangan.

"Mengenai penelitian kami pada DeepSeek-R1, kami menggunakan GPU A100 untuk mempersiapkan eksperimen dengan model yang lebih kecil," tulis para peneliti. Setelah fase awal ini, R1 dilatih selama total 80 jam pada kluster 512 chip H800.

Reuters sebelumnya melaporkan bahwa salah satu alasan DeepSeek mampu menarik para pemikir paling cemerlang di Tiongkok adalah karena perusahaan ini merupakan satu dari sedikit perusahaan domestik yang mengoperasikan klaster superkomputer A100.

Sementara itu, DeepSeek juga menanggapi untuk pertama kalinya, meskipun tidak secara langsung, pernyataan dari penasihat utama Gedung Putih dan tokoh AI AS lainnya pada bulan Januari bahwa mereka secara sengaja menyaring model OpenAI menjadi modelnya sendiri.

DeepSeek secara konsisten melakukan penyaringan atau distilasi karena menghasilkan performa model yang lebih baik, sekaligus jauh lebih murah untuk dilatih dan dijalankan. Ini juga memungkinkan akses yang lebih luas ke teknologi bertenaga AI karena tuntutan sumber daya yang intensif energi pada model tersebut.

Editor: Candra Mega Sari
Tags
Jawa Pos
JawaPos.com adalah bagian dari Jawa Pos Group, perusahaan media terkemuka di Indonesia. Menyajikan berita terkini, akurat, dan terpercaya.
Graha Pena Lt.2 Jl. Raya Kby. Lama No.12, Grogol Utara, Kec. Kebayoran Lama, Kota Jakarta Selatan, Daerah Khusus Ibukota Jakarta 12210
Download Aplikasi JawaPos.com
Download PlaystoreDownload Appstore