Deepseek yang menghairankan model AI yang murah mencabar gergasi industri. Permulaan Cina mendakwa telah melatih rangkaian neural Deepseek V3 yang kuat untuk hanya $ 6 juta, hanya menggunakan 2048 GPU, yang sangat berbeza dengan kos pesaing yang jauh lebih tinggi. Walau bagaimanapun, angka yang seolah -olah rendah ini menghilangkan perbelanjaan yang besar seperti penyelidikan, penghalusan, pemprosesan data, dan infrastruktur.
Pendekatan inovatif DeepSeek memanfaatkan beberapa teknologi utama: Ramalan Multi-Token (MTP) untuk ketepatan dan kecekapan yang lebih baik; Campuran Pakar (MOE) menggunakan 256 rangkaian saraf untuk latihan dipercepatkan; dan perhatian laten multi-kepala (MLA) untuk fokus yang lebih baik pada unsur-unsur kalimat penting.
imej: ensigame.com
Bertentangan dengan angka yang dipublikasikan mereka, semianalisis mendedahkan DeepSeek mengendalikan infrastruktur pengiraan besar -besaran, yang merangkumi kira -kira 50,000 GPU NVIDIA Hopper di seluruh pusat data, yang mewakili jumlah pelaburan pelayan kira -kira $ 1.6 bilion dan kos operasi berhampiran $ 944 juta. Ini termasuk 10,000 H800, 10,000 H100, dan GPU tambahan H20.
imej: ensigame.com
DeepSeek, anak syarikat High-Flyer, dana lindung nilai Cina, memiliki pusat datanya, tidak seperti pesaing yang berpendapat awan, memupuk inovasi dan pengoptimuman yang lebih cepat. Status yang dibiayai sendiri menyumbang kepada ketangkasan dan membuat keputusan yang cepat. Selain itu, DeepSeek menarik bakat teratas, dengan beberapa penyelidik memperoleh lebih dari $ 1.3 juta setiap tahun, terutamanya dari universiti -universiti China.
imej: ensigame.com
Walaupun kos latihan Deepseek $ 6 juta adalah mengelirukan, pelaburan keseluruhan mereka melebihi $ 500 juta. Struktur kurus mereka memudahkan inovasi yang cekap, berbeza dengan syarikat birokrasi yang lebih besar dan lebih besar. Pelaburan yang besar, kemajuan teknologi, dan pasukan mahir adalah kunci kejayaan mereka, bukan semata -mata "anggaran revolusioner." Ketidaksamaan kos jelas: Model R1 DeepSeek berharga $ 5 juta, manakala latihan ChatGPT4O berharga $ 100 juta.
imej: ensigame.com
Kisah DeepSeek menyoroti potensi syarikat AI yang dibiayai dengan baik untuk bersaing dengan berkesan, walaupun naratif kos yang sangat rendah memerlukan pengawasan yang teliti.