F5 bersama NVIDIA memperluas kolaborasi strategis untuk menghadirkan infrastruktur AI yang lebih efisien dan ekonomis. Integrasi F5 BIG-IP Next for Kubernetes dengan NVIDIA BlueField-3 DPU memungkinkan peningkatan throughput token, pengurangan biaya per token, serta keamanan multi-tenant dalam skala besar.
Solusi ini dirancang untuk mendukung era agentic AI, di mana alur kerja berbasis agen membutuhkan performa tinggi dan kontrol trafik yang lebih cerdas.
Dalam ekosistem AI, token menjadi metrik utama yang menentukan pengalaman pengguna dan potensi pendapatan. Dengan pendekatan baru ini, perusahaan dapat mengoptimalkan “tokenomics” melalui pemanfaatan GPU yang lebih efisien, latensi lebih rendah, serta routing inferensi berbasis data telemetri.
Hasilnya, AI factory tidak hanya sekadar mengandalkan kapasitas GPU, tetapi juga memaksimalkan output ekonomi per akselerator.
Peningkatan Terukur dan Validasi Kinerja
Pengujian independen oleh The Tolly Group menunjukkan peningkatan signifikan: throughput token naik hingga 40%, time to first token (TTFT) lebih cepat 61%, dan latensi turun 34%.
Dengan memindahkan fungsi networking, enkripsi TLS, load balancing berbasis AI, serta manajemen trafik ke BlueField-3 DPU, kapasitas CPU host tetap terjaga dan GPU dapat fokus pada inferensi berkelanjutan.
Semua peningkatan ini dapat diterapkan tanpa perlu modifikasi model, sehingga langsung kompatibel dengan infrastruktur AI factory yang sudah ada.
Infrastruktur Siap Multi-Tenant dan Agentic AI
BIG-IP Next for Kubernetes kini mendukung routing berbasis inferensi, integrasi dengan NVIDIA DOCA Platform Framework, serta EVPN-VXLAN dengan VRF dinamis untuk keamanan multi-tenancy.
Fitur observability, tata kelola token, dan kontrol trafik yang terintegrasi memungkinkan perusahaan maupun penyedia NeoCloud berbagi infrastruktur GPU secara aman tanpa mengorbankan performa.
Dengan pendekatan ini, organisasi dapat meningkatkan pendapatan per GPU, menekan biaya operasional, dan menghadirkan layanan AI yang skalabel.
Control Plane Strategis untuk Ekonomi AI
Kolaborasi F5 dan NVIDIA menempatkan BIG-IP Next for Kubernetes sebagai control plane utama dalam ekonomi AI factory.
Dengan menggabungkan data telemetri, akselerasi DPU, serta traffic intelligence, solusi ini membantu perusahaan mentransformasi AI factory menjadi platform yang efisien, dapat dimonetisasi, dan siap menghadapi pertumbuhan jangka panjang di era agentic AI.