Intel Dorong Era AI Generatif dengan Xeon 6 dan Gaudi 3
Menurut Justin Hotard, wakil presiden eksekutif sekaligus general manager di Data Center and Artificial Intelligence Group Intel, kebutuhan akan AI telah menyebabkan perubahan besar di pusat data, dan pasar meminta lebih banyak pilihan dalam hal perangkat keras, perangkat lunak, serta alat pengembang. Dengan hadirnya Xeon 6 yang dilengkapi P-cores serta AI accelerator Gaudi 3, Intel memberikan solusi ekosistem terbuka. Ini memudahkan para pelanggan untuk mengimplementasikan berbagai beban kerja dengan performa yang optimal, efisiensi yang lebih baik, dan sistem keamanan yang lebih tinggi.
Intel Xeon 6 dan AI Accelerator Gaudi 3: Terobosan dalam Infrastruktur AI
Prosesor Intel Xeon 6 dengan P-cores merupakan salah satu inovasi penting Intel. Prosesor ini dirancang khusus untuk menangani beban kerja yang memerlukan daya komputasi besar dengan efisiensi luar biasa. Dibandingkan dengan generasi sebelumnya, Xeon 6 menawarkan peningkatan performa dua kali lipat. Selain itu, fitur core count yang lebih besar dan bandwidth memori yang dua kali lebih luas memungkinkan proses yang lebih cepat. Setiap core pada prosesor ini juga dilengkapi dengan kemampuan AI acceleration, membuatnya ideal untuk digunakan dalam lingkungan edge, pusat data, maupun cloud.
Sementara itu, Gaudi 3 AI Accelerator adalah solusi yang dioptimalkan untuk menangani AI generatif berskala besar. Dengan dilengkapi 64 Tensor processor core (TPC) dan 8 matrix multiplication engine (MME), Gaudi 3 dapat mempercepat proses komputasi deep neural network. Selain itu, Gaudi 3 memiliki memori HBM2e sebesar 128 gigabyte (GB) yang memungkinkan pelatihan dan inferensi dalam skala besar, serta 24 port Ethernet dengan kecepatan 200 Gigabit (Gb) yang mendukung jaringan yang sangat skalabel. Kompatibilitas yang baik dengan framework PyTorch dan model transformer Hugging Face juga menjadi nilai tambah yang memungkinkan penggunaan Gaudi 3 dalam berbagai aplikasi AI generatif modern.
Kerja sama Intel dengan IBM juga memberikan dampak signifikan, terutama dalam mengoptimalkan penggunaan AI accelerator Gaudi 3 di IBM Cloud. Melalui kolaborasi ini, mereka berupaya untuk mengurangi biaya total kepemilikan (TCO) dan meningkatkan performa AI pada skala besar.
Mengoptimalkan AI dengan Efisiensi TCO yang Lebih Baik
Salah satu pertimbangan utama dalam penerapan AI pada skala besar adalah fleksibilitas dalam implementasi, serta teknologi AI yang mudah diakses dengan rasio harga-performa yang kompetitif. Intel, dengan infrastruktur x86 yang kuat dan ekosistem terbuka, mendukung perusahaan dalam membangun sistem AI dengan nilai tinggi. Faktanya, sekitar 73% server yang menggunakan akselerasi GPU menjadikan Intel Xeon sebagai host CPU.
Bekerja sama dengan OEM besar seperti Dell Technologies dan Supermicro, Intel mengembangkan sistem yang dirancang khusus untuk memenuhi kebutuhan AI pelanggan dengan lebih efektif. Contohnya, Dell Technologies saat ini sedang mengembangkan solusi berbasis RAG yang memanfaatkan teknologi Gaudi 3 dan Xeon 6.
Meningkatkan Produksi AI melalui Co-engineering
Salah satu tantangan terbesar dalam pengembangan solusi AI generatif adalah transisi dari prototipe ke sistem produksi. Tantangan ini melibatkan monitoring real-time, penanganan error, logging, keamanan, serta skalabilitas. Untuk mengatasi hal tersebut, Intel bekerja sama dengan OEM dan mitra industri untuk menciptakan solusi retrieval-augmented generation (RAG) yang siap untuk produksi. Solusi ini didukung oleh platform Open Platform Enterprise AI (OPEA) dan dioptimalkan untuk digunakan bersama prosesor Xeon serta sistem AI Gaudi.
Dengan mengintegrasikan layanan mikro berbasis OPEA, pelanggan dapat dengan mudah mengadopsi teknologi ini dalam aplikasi mereka, termasuk Kubernetes dan Red Hat OpenShift AI.
Solusi Enterprise AI yang Diperluas oleh Intel Tiber
Portofolio Intel Tiber mencakup solusi yang dirancang untuk mengatasi berbagai tantangan seperti biaya, aksesibilitas, efisiensi, keamanan, dan skalabilitas di lingkungan AI, cloud, maupun edge. Intel Tiber Developer Cloud juga menawarkan sistem pratinjau Xeon 6 untuk pengujian teknologi. Intel Gaudi juga mulai diakses oleh pelanggan terpilih untuk validasi penerapan model AI. Bahkan, cluster Gaudi 3 akan diluncurkan pada kuartal mendatang untuk mendukung produksi AI skala besar.
Sebagai bagian dari layanan terbaru, platform SeekrFlow yang didukung AI end-to-end memungkinkan pengembangan aplikasi AI yang lebih aman dan andal. Intel juga memperbarui software Gaudi dan notebook Jupyter dengan dukungan PyTorch 2.4, Intel oneAPI, serta alat AI terbaru tahun 2024, sehingga memberikan akselerasi dan dukungan optimal bagi prosesor Xeon 6