Tenstorrent, gvidita ĉifona kompanio de Jim Keller, publikigis sian sekvan generacion-verman procesoron por AI-laborŝarĝoj, kiujn ĝi atendas oferti bonan agadon je atingebla prezo.La kompanio nuntempe ofertas du pliajn PCIe-kartojn, kiuj povas akcepti unu aŭ du vermolajn procesorojn, same kiel TT-Loudbox kaj TT-QuietBox-labor-staciojn por programistoj. Ĉiuj hodiaŭaj anoncoj celas programistojn, ne al tiuj, kiuj uzas Wormhole Boards por komercaj laborŝarĝoj.
"Ĉiam estas dankema akiri pli multajn el niaj produktoj en la manojn de programistoj. Liberigu disvolvajn sistemojn per niaj kartoj Wormhole ™ povas helpi al programistoj skali kaj disvolvi mult-ĉifonan AI-programon," diris Jim Keller, ĝenerala direktoro de Tenstorrent.Krom ĉi tiu lanĉo, ni ekscitas vidi la progreson, kiun ni faras per la bendo kaj potenco de nia dua-generacia produkto, Blackhole. "

Ĉiu procesoro de vermo enhavas 72 TENSIX-kernojn (kvin el kiuj subtenas RISC-V-kernojn en diversaj datumformatoj) kaj 108 MB de SRAM, liverante 262 FP8-TFLOPojn je 1 GHz kun termika dezajno de 160W. La unu-blata vermo-N150-karto estas ekipita per 12 GB GDDR6-video-memoro kaj havas larĝan bandon de 288 GB/s.
Vermolaj procesoroj provizas flekseblan skaleblon por plenumi la diversajn bezonojn de laborŝarĝoj. En norma laboreja aranĝo kun kvar kartoj de Wormhole N300, la procesoroj povas esti kombinitaj en ununuran unuon, kiu aperas en la programaro kiel unuigita, larĝa Tensix -kerna reto. Ĉi tiu agordo permesas al la akcelilo trakti la saman laborŝarĝon, dividi inter kvar programistoj aŭ kuri ĝis ok malsamajn AI -modelojn samtempe. Ŝlosila trajto de ĉi tiu skalebleco estas, ke ĝi povas funkcii surloke sen bezono de virtualigo. En datumcentra medio, vermo -procesoroj uzos PCIe por ekspansio en la maŝino, aŭ Ethernet por ekstera ekspansio.
Koncerne rendimenton, la unu-ĉifona Wormhole N150-karto de Tenstorrent (72 TENSIX-kernoj, 1 GHz-frekvenco, 108 MB SRAM, 12 GB GDDR6, 288 GB/s Bandwidth) atingis 262 FP8 TFLOPS ĉe 160W, dum la dual-chip, WORM-n32-n32-n32-n32-n32-n32-n32, la duoble-chip, n32-n32, kaj la dufro, kaj la frekvenco de 160 ( Agregita 24 GB GDDR6, 576 GB/S Bandwidth) liveras ĝis 466 FP8 Tflops ĉe 300W.
Por enmeti 300W de 466 FP8 TFLOPS en kuntekston, ni komparos ĝin kun tio, kion AI -merkata estro Nvidia ofertas ĉe ĉi tiu termika desegna potenco. La A100 de NVIDIA ne subtenas FP8, sed ĝi subtenas INT8, kun maksimuma agado de 624 suproj (1.248 pintoj kiam malabunda). Kompare, la H100 de NVIDIA subtenas FP8 kaj atingas pintan agadon de 1.670 TFLOPS ĉe 300W (3.341 TFLOPS ĉe Sparse), kiu signife diferencas de la Wormhole N300 de Tenstorrent.
Tamen estas unu grava problemo. La Wormhole N150 de Tenstorrent vendas por $ 999, dum la N300 vendiĝas por $ 1,399. Kompare, ununura grafika karto NVIDIA H100 vendas por $ 30,000, depende de kvanto. Kompreneble, ni ne scias, ĉu kvar aŭ ok vermtruaj procesoroj efektive povas liveri la agadon de ununura H300, sed iliaj TDP -oj estas 600W kaj 1200W respektive.
Aldone al la kartoj, Tenstorrent ofertas antaŭkonstruitajn labor-staciojn por programistoj, inkluzive de 4 N300-kartoj en la pli atingebla Xeon-bazita TT-Loudbox kun aktiva malvarmigo, kaj la altnivela TT-QuietBox kun EPYC-bazita Xiaolong) likva malvarmiga funkcio).
Afiŝotempo: jul-29-2024