kaza standardo

Industria Novaĵoj: Jim Keller lanĉis novan blaton RISC-V

Industria Novaĵoj: Jim Keller lanĉis novan blaton RISC-V

Tenstorrent, gvidata de Jim Keller-ĉipfirmao, publikigis sian venontgeneracian Wormhole-procesoron por AI-laborŝarĝoj, kiun ĝi atendas oferti bonan rendimenton je atingebla prezo.La kompanio nuntempe ofertas du kromajn PCIe-kartojn, kiuj povas akomodi unu aŭ du Wormhole-procesorojn, same kiel TT-LoudBox kaj TT-QuietBox-laborstaciojn por programistoj. Ĉiuj hodiaŭaj anoncoj celas programistojn, ne tiujn, kiuj uzas Wormhole-tabulojn por komercaj laborŝarĝoj.

“Ĉiam estas ĝojige ricevi pli da niaj produktoj en la manojn de programistoj. Liberigi disvolvajn sistemojn uzante niajn Wormhole™-kartojn povas helpi programistojn grimpi kaj evoluigi plurblatan AI-programaron, "diris Jim Keller, Ĉefoficisto de Tenstorrent.Aldone al ĉi tiu lanĉo, ni ĝojas vidi la progreson, kiun ni faras kun la bendo ekstere kaj ekfunkciigo de nia duageneracia produkto, Blackhole."

1

Ĉiu Wormhole-procesoro enhavas 72 Tensix-kernojn (kvin el kiuj subtenas RISC-V-kernojn en diversaj datumformatoj) kaj 108 MB da SRAM, liverante 262 FP8 TFLOPS ĉe 1 GHz kun termika projektpotenco de 160W. La unu-blata Wormhole n150-karto estas ekipita per 12 GB GDDR6-videomemoro kaj havas bendolarĝon de 288 GB/s.

Vermtruaj procesoroj disponigas flekseblan skaleblon por renkonti la diversajn bezonojn de laborkvantoj. En norma laborstacia aranĝo kun kvar Wormhole n300-kartoj, la procesoroj povas esti kombinitaj en ununuran unuon kiu aperas en la programaro kiel unuigita, larĝa Tensix-kernreto. Ĉi tiu agordo permesas al la akcelilo trakti la saman laborkvanton, dividita inter kvar programistoj aŭ funkcii ĝis ok malsamaj AI-modeloj samtempe. Ĉefa trajto de ĉi tiu skaleblo estas, ke ĝi povas funkcii loke sen bezono de virtualigo. En datumcentra medio, Wormhole-procesoroj uzos PCIe por ekspansio ene de la maŝino, aŭ Ethernet por ekstera ekspansio.

Koncerne rendimenton, la unu-blata Wormhole n150-karto de Tenstorrent (72 Tensix-kernoj, 1 GHz-frekvenco, 108 MB SRAM, 12 GB GDDR6, 288 GB/s bendolarĝo) atingis 262 FP8 TFLOPS ĉe 160W, dum la duobla blata Wormhole n300 (128 Tensix-kernoj, 1 GHz-frekvenco, 192 MB SRAM, aldonita 24 GB GDDR6, 576 GB/s bendolarĝo) liveras ĝis 466 FP8 TFLOPS ĉe 300W.

Por meti 300W de 466 FP8 TFLOPS en kuntekston, ni komparos ĝin kun tio, kion AI-merkata gvidanto Nvidia ofertas ĉe ĉi tiu termika dezajnpotenco. La A100 de Nvidia ne subtenas FP8, sed ĝi subtenas INT8, kun pinta rendimento de 624 TOPS (1,248 TOPS kiam malabunda). Kompare, la H100 de Nvidia subtenas FP8 kaj atingas maksimuman rendimenton de 1,670 TFLOPS ĉe 300W (3,341 TFLOPS ĉe malabunda), kio estas signife diferenca de la Wormhole n300 de Tenstorrent.

Tamen, estas unu grava problemo. La Wormhole n150 de Tenstorrent kostas 999 USD, dum la n300 vendas 1399 USD. Kompare, ununura Nvidia H100-grafika karto kostas 30,000 USD, depende de kvanto. Kompreneble, ni ne scias ĉu kvar aŭ ok Wormhole-procesoroj povas efektive liveri la agadon de ununura H300, sed iliaj TDP-oj estas 600W kaj 1200W respektive.

Krom la kartoj, Tenstorrent ofertas antaŭkonstruitajn laborstaciojn por programistoj, inkluzive de 4 n300-kartoj en la pli pagebla Xeon-bazita TT-LoudBox kun aktiva malvarmigo, kaj la progresinta TT-QuietBox kun EPYC-bazita Xiaolong) likva malvarmiga funkcio).


Afiŝtempo: Jul-29-2024