In Cuda geschriebene Bibliotheken

instant-ngp

Sofortige neuronale Grafikprimitive: blitzschnelles NeRF und mehr.
  • 13.4k
  • GNU General Public License v3.0

deep-high-resolution-net.pytorch

Das Projekt ist eine offizielle Umsetzung unseres CVPR2019-Papiers „Deep High-Resolution Representation Learning for Human Pose Estimation“.
  • 4.1k
  • MIT

cub

Kooperative Grundelemente für CUDA C++. (von NVIDIA).
  • 1.5k
  • BSD 3-clause "New" or "Revised"

cugraph

cuGraph – RAPIDS Graph Analytics-Bibliothek.
  • 1.3k
  • Apache License 2.0

blocksparse

Effiziente GPU-Kernel für die Multiplikation und Faltung blocksparser Matrizen.
  • 948
  • MIT

k2

FSA/FST-Algorithmen, differenzierbar, mit PyTorch-Kompatibilität.
  • 927
  • Apache License 2.0

nv-wavenet

Referenzimplementierung der autoregressiven Wavenet-Inferenz in Echtzeit.
  • 700
  • BSD 3-clause "New" or "Revised"

nvParse

Schneller, GPU-basierter CSV-Parser.
  • 550
  • Apache License 2.0

instant-ngp-Windows

Sofortige neuronale Grafikprimitive: blitzschnelles NeRF und mehr.
  • 458
  • GNU General Public License v3.0

nccl-tests

NCCL-Tests.
  • 436
  • BSD 3-clause "New" or "Revised"

MegBA

MegBA: Eine GPU-basierte verteilte Bibliothek für umfangreiche Bundle-Anpassungen.
  • 368
  • Apache License 2.0

raft

RAFT enthält grundlegende, weit verbreitete Algorithmen und Grundelemente für Datenwissenschaft, Diagramme und maschinelles Lernen. (von rapidsai).
  • 278
  • Apache License 2.0

dietgpu

GPU-Implementierung eines schnellen verallgemeinerten ANS-Entropie-Encoders und -Decoders (asymmetrisches Zahlensystem) mit Erweiterungen für die verlustfreie Komprimierung numerischer und anderer Datentypen in HPC/ML-Anwendungen.
  • 247
  • MIT

TorchPQ

Ungefähre Suche nach nächsten Nachbarn mit Produktquantisierung auf der GPU in Pytorch und Cuda.
  • 173
  • MIT

Lantern

  • 163
  • BSD 3-clause "New" or "Revised"

RWKV-CUDA

Die CUDA-Version des RWKV-Sprachmodells (https://github.com/BlinkDL/RWKV-LM).
  • 113

cuhnsw

CUDA-Implementierung des Hierarchical Navigable Small World Graph-Algorithmus.
  • 88
  • Apache License 2.0

CUB

DIESES REPOSITORY WURDE NACH github.com/nvidia/cub VERSCHOBEN, WAS AUTOMATISCH HIER GESPIEGELT WIRD.
  • 71
  • BSD 3-clause "New" or "Revised"

array-language-comparisons

Ein Vergleich von Array-Sprachen und -Bibliotheken: APL, J, BQN, Q, Julia, R, NumPy, Nial, Futhark, SaC und ArrayFire.
  • 60
  • MIT

mish-cuda

Mish-Aktivierungsfunktion für PyTorch (von JunnYu).
  • 48
  • MIT

rocm-examples

  • 39
  • MIT

xgboost-node

Führen Sie das XGBoost-Modell aus und treffen Sie Vorhersagen in Node.js.
  • 33
  • GNU General Public License v3.0

CUDA-Guide

CUDA Guide.
  • 29

kobra

Forschungsorientierte Spiel-Engine, die modernste Rendering-Techniken erforscht (von vedavamadathil).
  • 21

CryptoGPU

Analyse der Kryptowährungspreise.
  • 16

LSQR-CUDA

Dies ist eine LSQR-CUDA-Implementierung, geschrieben von Lawrence Ayers unter der Leitung von Stefan Guthe vom GRIS-Institut der Technischen Universität Darmstadt. Die LSQR-Bibliothek wurde von Chris Paige und Michael Saunders verfasst.
  • 11
  • MIT

SBNN

Singulares binarisiertes neuronales Netzwerk basierend auf GPU-Bit-Operationen (siehe unser SC-19-Papier).
  • 10
  • GNU General Public License v3.0

GCGT

Quellcode für das Papier: GPU-basiertes Compressed Graph Traversal.
  • 7
  • MIT

FirstCollisionTimestepRarefiedGasSimulator

Dieser Simulator berechnet alle möglichen Schnittpunkte für einen sehr kleinen Zeitschritt für ein Teilchenmodell.
  • 2

DOKSparse

spärliche DOK-Tensoren auf GPU, Pytorch.
  • 1
  • MIT