
Ang Inferx X1 Edge Inference Accelerator ay dinisenyo para sa pagpoproseso ng real-time na mpixel vision workloads na nangangailangan ng mataas na bandwidth support para sa malalim na mga modelo ng pag-aaral na gumana sa maliit na laki ng batch sa real time. Ang karaniwang mga workload ay may malalim na network na may maraming mga tampok na mapa at maraming uri ng operator, nagpapaliwanag sa kumpanya. Maaari din silang magkaroon ng mga target na katumpakan ng modelo na nangangailangan ng paggamit ng mga mixed precisions, kabilang ang Int8, INT16 at BF16. Ang accelerator ay nagbibigay-daan sa isang halo sa pagitan ng mga layer at dinisenyo din para sa mababang latency batch size (b = 1 processing inference) na karaniwang kinakailangan ng mga workload na ito.
Sinusuportahan ng accelerator ang X86 at braso architectures at isang pagpipilian ng OS. Sinusuportahan nito ang camera, IR, ultrasonic at RF sensor input na mga uri at Ethernet, USB at Wi-Fi Comms standard.
Ang X1 Dynamic Tensor Processor Array ay dinisenyo upang suportahan ang mga umiiral na at hinaharap na mga modelo ng AI / ML at inaangkin na pagsamahin ang bilis at kahusayan ng isang ASIC na may reconfigurable control logic technology na hinaharap ng mga bagong teknolohiya ng modelo ng inference sa pamamagitan ng field mga update. Pinapayagan ng arkitektura ng accelerator ang suporta para sa pagproseso ng maramihang mga uri ng data kabilang ang mga high resolution camera.
Bilang karagdagan sa mga yunit ng Mac ng processor array at 12mbyte ng on-chip SRAM, kabilang ang X1 architecture ang pagkakakonekta sa panlabas na LPDDR4 dram para sa modelo ng timbang, pagsasaayos at panloob na imbakan ng pag-activate. Mayroon ding gen3 / 4 PCIe para sa pagkakakonekta sa isang processor ng host.
Nag-aalok din ang kumpanya ng inferx edge inference software development kit na may model compiler at runtime software. Ang modelo ng compiler ay nag-convert ng mga modelo na ipinahayag sa tensorflow lite o torschscript at pinagsasama ang mga ito upang gumana nang direkta sa X1 accelerator. Kinokontrol ng inferx runtime ang pagpapatupad ng modelo at ang X1 ay nagpoproseso ng data steam upang bumuo ng mga resulta ng paghihinuha.