Geekbench AI Benchmark

Stworzony przez Primate Labs

Leaderboard
English

Metrics

Single Precision scoreHalf Precision scoreQuantized scoreGeekbench AI score

Tematy

generative airesearch

Geekbench AI to wieloplatformowy benchmark opracowany przez Primate Labs, który mierzy wydajność wnioskowania AI na urządzeniach mobilnych i tabletach działających na Androidzie i iOS. Ocena obejmuje wydajność w obliczeniach realizowanych przez CPU, GPU i NPU w ramach trzech typów obciążeń: Single Precision, Half Precision oraz Quantized, generując zarówno osobne wyniki, jak i złożony wynik Geekbench AI.

Wyniki są skalibrowane względem wyniku bazowego 1,500 ustawionego przez procesor Intel Core i7-10700, co umożliwia porównania na szeroką skalę różnych urządzeń. Benchmark agreguje wyniki przesyłane przez użytkowników w publicznym zestawieniu rankingowym, dzięki czemu jest powszechnie cytowanym narzędziem do porównywania możliwości wnioskowania AI na urządzeniach użytkownika wśród smartfonów i tabletów konsumenckich.

Tło i rozwój

Geekbench AI jest opracowywany przez Primate Labs, irlandzką firmę programistyczną znaną z linii Geekbench — wieloplatformowych testów wydajności. W oparciu o sprawdzony framework Geekbench do testowania CPU i GPU, Primate Labs rozszerzyło swój zestaw narzędzi, aby sprostać rosnącemu znaczeniu zadań sztucznej inteligencji wykonywanych bezpośrednio na urządzeniu. Benchmark jest przeznaczony dla urządzeń z Androidem i iOS, co odzwierciedla powszechne wdrażanie możliwości wnioskowania AI w nowoczesnych smartfonach i tabletach dla konsumentów. Wyniki są przesyłane przez użytkowników i agregowane do publicznie dostępnego wykresu rankingu, dostarczając szerokiego zestawu danych dotyczących rzeczywistej wydajności urządzeń.

Struktura benchmarku i punktacja

Geekbench AI ocenia wydajność wnioskowania AI w trzech zaplecza obliczeniowych: CPU, GPU oraz NPU (Neural Processing Unit). Takie podejście wielozaplecza pozwala uchwycić różne ścieżki sprzętowe, z których korzystają nowoczesne urządzenia mobilne, aby przyspieszać zadania uczenia maszynowego. Testy są przeprowadzane z użyciem trzech odrębnych typów precyzji obciążeń:

  • Single Precision: Standardowe operacje zmiennoprzecinkowe 32-bitowe, reprezentujące obciążenia wnioskowania w pełnej precyzji.
  • Half Precision: Operacje zmiennoprzecinkowe 16-bitowe, powszechnie stosowane do równoważenia wydajności i dokładności na zdolnym sprzęcie.
  • Quantized: Wnioskowanie oparte na liczbach całkowitych, odzwierciedlające techniki optymalizacji szeroko wykorzystywane do zmniejszania rozmiaru modeli i poprawy przepustowości na sprzęcie mobilnym.

Każdy typ obciążenia generuje własny wynik, a następnie są one łączone w złożony wynik Geekbench AI. Wszystkie wyniki są skalibrowane względem bazowej wartości 1 500, która odpowiada wydajności zmierzonej na procesorze Intel Core i7-10700. Takie podejście do kalibracji umożliwia interpretowanie wyników z różnych urządzeń mobilnych w spójnym, porównywalnym kontekście.

Zastosowania i aplikacje

Benchmark spełnia kilka praktycznych celów dla różnych odbiorców. Dla konsumentów publicznie dostępny ranking stanowi punkt odniesienia przy porównywaniu możliwości wnioskowania AI smartfonów i tabletów przed zakupem. Dla deweloperów i badaczy pracujących nad aplikacjami mobilnymi z obszaru AI wielozaplecze i wieloprecyzyjna struktura dostarczają wglądu w to, jak różne konfiguracje sprzętowe radzą sobie z różnymi wymaganiami wnioskowania. Uwzględnienie testów NPU jest szczególnie istotne, ponieważ producenci urządzeń coraz częściej integrują dedykowane sprzętowe układy do przetwarzania neuronowego w projektach mobilnych system-on-chip.

Ponieważ wyniki są przesyłane przez użytkowników i pochodzą z szerokiej gamy urządzeń, ranking odzwierciedla zróżnicowany przekrój dostępnego w segmencie konsumenckim sprzętu, w tym zarówno modele flagowe, jak i ze średniej półki, uruchamiające aktualne oraz niedawne wersje Androida i iOS.

Kontekst w ramach benchmarków AI

Geekbench AI zajmuje określoną niszę w szerszym krajobrazie benchmarków AI, koncentrując się wyłącznie na sprzęcie mobilnym i tabletowym, a nie na systemach typu data center czy komputerach stacjonarnych. Podczas gdy inne benchmarki celują w akceleratory klasy serwerowej lub karty graficzne do komputerów stacjonarnych, Geekbench AI jest ukierunkowany na wnioskowanie wykonywane na urządzeniu w środowiskach o ograniczonych zasobach. Jego model oparty na wynikach przesyłanych przez użytkowników i pozyskiwanych w ramach crowdsourcingu odróżnia go od kontrolowanych testów laboratoryjnych — zapewnia skalę i pokrycie urządzeń kosztem pewnej spójności warunków. Ponieważ przetwarzanie AI na urządzeniu staje się coraz bardziej widoczną cechą w marketingu sprzętu mobilnego i w różnicowaniu produktów, narzędzia takie jak Geekbench AI dostarczają ustandaryzowanego punktu porównania, dostępnego dla szerokiego grona odbiorców.

Raport