Loading market data...

Technology

Perplexity använder Qwen3 235B på Nvidia GB200-rack, ökar inferensprestanda

By GFdaily Newsroom

Perplexity Qwen3 235B Nvidia GB200 AI inference AI hardware

May 21, 2026 5 min read

Read in:🇺🇸 English 🇹🇷 Türkçe 🇦🇱 Shqip 🇸🇦 العربية 🇫🇷 Français 🇩🇪 Deutsch 🇷🇺 Русский 🇪🇸 Español 🇮🇹 Italiano 🇧🇷 Português 🇨🇳 中文 🇯🇵 日本語 🇷🇴 Română 🇩🇰 Dansk 🇳🇴 Norsk 🇫🇮 Suomi 🇮🇷 فارسی 🇬🇷 Ελληνικά 🇻🇳 Tiếng Việt 🇹🇭 ไทย 🇮🇱 עברית 🇰🇷 한국어 🇮🇩 Bahasa Indonesia 🇮🇳 हिन्दी 🇲🇾 Bahasa Melayu 🇧🇩 বাংলা 🇺🇦 Українська 🇳🇱 Nederlands 🇵🇱 Polski 🇨🇿 Čeština 🇭🇺 Magyar 🇸🇪 Svenska

Perplexity använder Qwen3 235B på Nvidia GB200-rack, ökar inferensprestanda

and

tags. Meta description: similar. Let's translate step by step. First paragraph: "Perplexity has started serving Qwen3 235B models on Nvidia GB200 racks, a move that delivers major inference performance gains. The deployment, first reported by Crypto Briefing, underscores Nvidia's continued lead in AI hardware and could shift the competitive dynamics of large-model serving." Swedish: "Perplexity har börjat använda Qwen3 235B-modeller på Nvidia GB200-rack, ett drag som ger betydande prestandavinster inom inferens. Implementeringen, som först rapporterades av Crypto Briefing, understryker Nvidias fortsatta ledarskap inom AI-hårdvara och kan förändra konkurrensdynamiken för hantering av stora modeller." Note: "serving" -> "hantering" or "betjäning"? "large-model serving" -> "hantering av stora modeller" is fine. Second paragraph: "The switch to GB200 racks gives Perplexity a noticeable lift in how fast it can run the 235-billion-parameter Qwen3 model. Inference throughput and latency both improved, though the company hasn't released specific benchmarks. The gains come from the tight integration of Nvidia's Grace CPU and Blackwell GPU, which cuts data-transfer bottlenecks." Swedish: "Bytet till GB200-rack ger Perplexity en märkbar förbättring i hur snabbt de kan köra Qwen3-modellen med 235 miljarder parametrar. Inferensgenomströmning och latens har båda förbättrats, även om företaget inte har publicerat specifika riktmärken. Vinsterna kommer från den täta integrationen av Nvidias Grace CPU och Blackwell GPU, vilket minskar flaskhalsar för dataöverföring." Third paragraph: "This deployment is another example of Nvidia pulling ahead in the AI chip race. GB200 racks are designed for exactly these kinds of high-parameter workloads, and Perplexity's choice suggests the hardware delivers where it counts. Competitors like AMD and Intel face an uphill climb to match that performance at scale." Swedish: "Denna implementering är ytterligare ett exempel på att Nvidia drar ifrån i AI-chipploppet. GB200-rack är designade för just denna typ av arbetsbelastningar med höga parametrar, och Perplexitys val tyder på att hårdvaran levererar där det räknas. Konkurrenter som AMD och Intel står inför en brant uppförsbacke för att matcha den prestandan i skala." Fourth paragraph: "With better inference, Perplexity can roll out updates and new models faster. The Qwen3 235B is a dense, powerful model, and running it efficiently means less time between training and production. That speed matters as the race to deploy ever-larger language models heats up." Swedish: "Med bättre inferens kan Perplexity rulla ut uppdateringar och nya modeller snabbare. Qwen3 235B är en tät och kraftfull modell, och att köra den effektivt innebär kortare tid mellan träning och produktion. Den hastigheten är viktig när kapplöpningen för att distribuera allt större språkmodeller intensifieras." Fifth paragraph: "The move could pressure other inference providers to upgrade their hardware or risk falling behind. If Perplexity maintains this edge, it may attract more AI developers who need high-throughput, low-latency serving. The next few months will show whether rivals can close the gap or if Nvidia's GB200 becomes the de facto standard for heavy models." Swedish: "Detta drag kan sätta press på andra inferensleverantörer att uppgradera sin hårdvara eller riskera att hamna på efterkälken. Om Perplexity behåller detta övertag kan det locka fler AI-utvecklare som behöver hög genomströmning och låg latens. De närmaste månaderna kommer att visa om konkurrenterna kan minska gapet eller om Nvidias GB200 blir de facto-standard för tunga modeller." Meta description: "Perplexity deploys Qwen3 235B models on Nvidia GB200 racks, showing major inference gains and reinforcing Nvidia's AI hardware dominance. The move could reshape competitive dynamics." Swedish: "Perplexity använder Qwen3 235B-modeller på Nvidia GB200-rack, vilket visar betydande inferensvinster och förstärker Nvidias dominans inom AI-hårdvara. Draget kan omforma konkurrensdynamiken." Now construct JSON. Ensure proper escaping for HTML? The content is HTML string, so we need to include it as a string. In JSON, we escape double quotes and backslashes. The HTML contains double quotes in tags like
and

. We'll need to escape them. Alternatively, we can use single quotes inside HTML? But standard HTML uses double quotes. We'll escape them by backslash. Also, the content has no backslashes, so fine. Let's write the JSON. { "title": "Perplexity använder Qwen3 235B på Nvidia GB200-rack, ökar inferensprestanda", "content": "
Perplexity har börjat använda Qwen3 235B-modeller på Nvidia GB200-rack, ett drag som ger betydande prestandavinster inom inferens. Implementeringen, som först rapporterades av Crypto Briefing, understryker Nvidias fortsatta ledarskap inom AI-hårdvara och kan förändra konkurrensdynamiken för hantering av stora modeller.

Inferensvinster på GB200
\n
Bytet till GB200-rack ger Perplexity en märkbar förbättring i hur snabbt de kan köra Qwen3-modellen med 235 miljarder parametrar. Inferensgenomströmning och latens har båda förbättrats, även om företaget inte har publicerat specifika riktmärken. Vinsterna kommer från den täta integrationen av Nvidias Grace CPU och Blackwell GPU, vilket minskar flaskhalsar för dataöverföring.

Nvidias hårdvarufördel
\n
Denna implementering är ytterligare ett exempel på att Nvidia drar ifrån i AI-chipploppet. GB200-rack är designade för just denna typ av arbetsbelastningar med höga parametrar, och Perplexitys val tyder på att hårdvaran levererar där det räknas. Konkurrenter som AMD och Intel står inför en brant uppförsbacke för att matcha den prestandan i skala.

Snabbare modellimplementation
\n
Med bättre inferens kan Perplexity rulla ut uppdateringar och nya modeller snabbare. Qwen3 235B är en tät och kraftfull modell, och att köra den effektivt innebär kortare tid mellan träning och produktion. Den hastigheten är viktig när kapplöpningen för att distribuera allt större språkmodeller intensifieras.
\n
Detta drag kan sätta press på andra inferensleverantörer att uppgradera sin hårdvara eller riskera att hamna på efterkälken. Om Perplexity behåller detta övertag kan det locka fler AI-utvecklare som behöver hög genomströmning och låg latens. De närmaste månaderna kommer att visa om konkurrenterna kan minska gapet eller om Nvidias GB200 blir de facto-standard för tunga modeller.