Tło i rozwój

Geekbench AI jest opracowywany przez Primate Labs, irlandzką firmę programistyczną znaną z linii Geekbench — wieloplatformowych testów wydajności. W oparciu o sprawdzony framework Geekbench do testowania CPU i GPU, Primate Labs rozszerzyło swój zestaw narzędzi, aby sprostać rosnącemu znaczeniu zadań sztucznej inteligencji wykonywanych bezpośrednio na urządzeniu. Benchmark jest przeznaczony dla urządzeń z Androidem i iOS, co odzwierciedla powszechne wdrażanie możliwości wnioskowania AI w nowoczesnych smartfonach i tabletach dla konsumentów. Wyniki są przesyłane przez użytkowników i agregowane do publicznie dostępnego wykresu rankingu, dostarczając szerokiego zestawu danych dotyczących rzeczywistej wydajności urządzeń.

Struktura benchmarku i punktacja

Geekbench AI ocenia wydajność wnioskowania AI w trzech zaplecza obliczeniowych: CPU, GPU oraz NPU (Neural Processing Unit). Takie podejście wielozaplecza pozwala uchwycić różne ścieżki sprzętowe, z których korzystają nowoczesne urządzenia mobilne, aby przyspieszać zadania uczenia maszynowego. Testy są przeprowadzane z użyciem trzech odrębnych typów precyzji obciążeń:

Single Precision: Standardowe operacje zmiennoprzecinkowe 32-bitowe, reprezentujące obciążenia wnioskowania w pełnej precyzji.
Half Precision: Operacje zmiennoprzecinkowe 16-bitowe, powszechnie stosowane do równoważenia wydajności i dokładności na zdolnym sprzęcie.
Quantized: Wnioskowanie oparte na liczbach całkowitych, odzwierciedlające techniki optymalizacji szeroko wykorzystywane do zmniejszania rozmiaru modeli i poprawy przepustowości na sprzęcie mobilnym.

Każdy typ obciążenia generuje własny wynik, a następnie są one łączone w złożony wynik Geekbench AI. Wszystkie wyniki są skalibrowane względem bazowej wartości 1 500, która odpowiada wydajności zmierzonej na procesorze Intel Core i7-10700. Takie podejście do kalibracji umożliwia interpretowanie wyników z różnych urządzeń mobilnych w spójnym, porównywalnym kontekście.

Zastosowania i aplikacje

Benchmark spełnia kilka praktycznych celów dla różnych odbiorców. Dla konsumentów publicznie dostępny ranking stanowi punkt odniesienia przy porównywaniu możliwości wnioskowania AI smartfonów i tabletów przed zakupem. Dla deweloperów i badaczy pracujących nad aplikacjami mobilnymi z obszaru AI wielozaplecze i wieloprecyzyjna struktura dostarczają wglądu w to, jak różne konfiguracje sprzętowe radzą sobie z różnymi wymaganiami wnioskowania. Uwzględnienie testów NPU jest szczególnie istotne, ponieważ producenci urządzeń coraz częściej integrują dedykowane sprzętowe układy do przetwarzania neuronowego w projektach mobilnych system-on-chip.

Ponieważ wyniki są przesyłane przez użytkowników i pochodzą z szerokiej gamy urządzeń, ranking odzwierciedla zróżnicowany przekrój dostępnego w segmencie konsumenckim sprzętu, w tym zarówno modele flagowe, jak i ze średniej półki, uruchamiające aktualne oraz niedawne wersje Androida i iOS.

Kontekst w ramach benchmarków AI

Geekbench AI zajmuje określoną niszę w szerszym krajobrazie benchmarków AI, koncentrując się wyłącznie na sprzęcie mobilnym i tabletowym, a nie na systemach typu data center czy komputerach stacjonarnych. Podczas gdy inne benchmarki celują w akceleratory klasy serwerowej lub karty graficzne do komputerów stacjonarnych, Geekbench AI jest ukierunkowany na wnioskowanie wykonywane na urządzeniu w środowiskach o ograniczonych zasobach. Jego model oparty na wynikach przesyłanych przez użytkowników i pozyskiwanych w ramach crowdsourcingu odróżnia go od kontrolowanych testów laboratoryjnych — zapewnia skalę i pokrycie urządzeń kosztem pewnej spójności warunków. Ponieważ przetwarzanie AI na urządzeniu staje się coraz bardziej widoczną cechą w marketingu sprzętu mobilnego i w różnicowaniu produktów, narzędzia takie jak Geekbench AI dostarczają ustandaryzowanego punktu porównania, dostępnego dla szerokiego grona odbiorców.

Geekbench AI Benchmark

Metrics

Kategorie

Tematy

Tło i rozwój

Struktura benchmarku i punktacja

Zastosowania i aplikacje

Kontekst w ramach benchmarków AI