Metrics
Kategorie
Tematy
Geekbench AI to wieloplatformowy benchmark opracowany przez Primate Labs, który mierzy wydajność wnioskowania AI na urządzeniach mobilnych i tabletach działających na Androidzie i iOS. Ocena obejmuje wydajność w obliczeniach realizowanych przez CPU, GPU i NPU w ramach trzech typów obciążeń: Single Precision, Half Precision oraz Quantized, generując zarówno osobne wyniki, jak i złożony wynik Geekbench AI.
Wyniki są skalibrowane względem wyniku bazowego 1,500 ustawionego przez procesor Intel Core i7-10700, co umożliwia porównania na szeroką skalę różnych urządzeń. Benchmark agreguje wyniki przesyłane przez użytkowników w publicznym zestawieniu rankingowym, dzięki czemu jest powszechnie cytowanym narzędziem do porównywania możliwości wnioskowania AI na urządzeniach użytkownika wśród smartfonów i tabletów konsumenckich.
Tło i rozwój
Geekbench AI jest opracowywany przez Primate Labs, irlandzką firmę programistyczną znaną z linii Geekbench — wieloplatformowych testów wydajności. W oparciu o sprawdzony framework Geekbench do testowania CPU i GPU, Primate Labs rozszerzyło swój zestaw narzędzi, aby sprostać rosnącemu znaczeniu zadań sztucznej inteligencji wykonywanych bezpośrednio na urządzeniu. Benchmark jest przeznaczony dla urządzeń z Androidem i iOS, co odzwierciedla powszechne wdrażanie możliwości wnioskowania AI w nowoczesnych smartfonach i tabletach dla konsumentów. Wyniki są przesyłane przez użytkowników i agregowane do publicznie dostępnego wykresu rankingu, dostarczając szerokiego zestawu danych dotyczących rzeczywistej wydajności urządzeń.
Struktura benchmarku i punktacja
Geekbench AI ocenia wydajność wnioskowania AI w trzech zaplecza obliczeniowych: CPU, GPU oraz NPU (Neural Processing Unit). Takie podejście wielozaplecza pozwala uchwycić różne ścieżki sprzętowe, z których korzystają nowoczesne urządzenia mobilne, aby przyspieszać zadania uczenia maszynowego. Testy są przeprowadzane z użyciem trzech odrębnych typów precyzji obciążeń:
- Single Precision: Standardowe operacje zmiennoprzecinkowe 32-bitowe, reprezentujące obciążenia wnioskowania w pełnej precyzji.
- Half Precision: Operacje zmiennoprzecinkowe 16-bitowe, powszechnie stosowane do równoważenia wydajności i dokładności na zdolnym sprzęcie.
- Quantized: Wnioskowanie oparte na liczbach całkowitych, odzwierciedlające techniki optymalizacji szeroko wykorzystywane do zmniejszania rozmiaru modeli i poprawy przepustowości na sprzęcie mobilnym.
Każdy typ obciążenia generuje własny wynik, a następnie są one łączone w złożony wynik Geekbench AI. Wszystkie wyniki są skalibrowane względem bazowej wartości 1 500, która odpowiada wydajności zmierzonej na procesorze Intel Core i7-10700. Takie podejście do kalibracji umożliwia interpretowanie wyników z różnych urządzeń mobilnych w spójnym, porównywalnym kontekście.
Zastosowania i aplikacje
Benchmark spełnia kilka praktycznych celów dla różnych odbiorców. Dla konsumentów publicznie dostępny ranking stanowi punkt odniesienia przy porównywaniu możliwości wnioskowania AI smartfonów i tabletów przed zakupem. Dla deweloperów i badaczy pracujących nad aplikacjami mobilnymi z obszaru AI wielozaplecze i wieloprecyzyjna struktura dostarczają wglądu w to, jak różne konfiguracje sprzętowe radzą sobie z różnymi wymaganiami wnioskowania. Uwzględnienie testów NPU jest szczególnie istotne, ponieważ producenci urządzeń coraz częściej integrują dedykowane sprzętowe układy do przetwarzania neuronowego w projektach mobilnych system-on-chip.
Ponieważ wyniki są przesyłane przez użytkowników i pochodzą z szerokiej gamy urządzeń, ranking odzwierciedla zróżnicowany przekrój dostępnego w segmencie konsumenckim sprzętu, w tym zarówno modele flagowe, jak i ze średniej półki, uruchamiające aktualne oraz niedawne wersje Androida i iOS.
Kontekst w ramach benchmarków AI
Geekbench AI zajmuje określoną niszę w szerszym krajobrazie benchmarków AI, koncentrując się wyłącznie na sprzęcie mobilnym i tabletowym, a nie na systemach typu data center czy komputerach stacjonarnych. Podczas gdy inne benchmarki celują w akceleratory klasy serwerowej lub karty graficzne do komputerów stacjonarnych, Geekbench AI jest ukierunkowany na wnioskowanie wykonywane na urządzeniu w środowiskach o ograniczonych zasobach. Jego model oparty na wynikach przesyłanych przez użytkowników i pozyskiwanych w ramach crowdsourcingu odróżnia go od kontrolowanych testów laboratoryjnych — zapewnia skalę i pokrycie urządzeń kosztem pewnej spójności warunków. Ponieważ przetwarzanie AI na urządzeniu staje się coraz bardziej widoczną cechą w marketingu sprzętu mobilnego i w różnicowaniu produktów, narzędzia takie jak Geekbench AI dostarczają ustandaryzowanego punktu porównania, dostępnego dla szerokiego grona odbiorców.