SEMRON ist ein 2020 in Dresden gegründetes Halbleiterunternehmen, das KI-Chips für den Einsatz direkt auf Endgeräten entwickelt. Im Mittelpunkt steht die Kerntechnologie CapRAM2 – ein 3D-skalierbarer Compute-in-Memory-Ansatz, bei dem KI-Modellgewichte als variable Kapazitanz in memkapazitiven Speicherzellen abgelegt werden. Das Unternehmen zielt darauf ab, große KI-Modelle auf Smartphones, Wearables und Headsets kontinuierlich und ohne Cloud-Anbindung betreiben zu können.
Der technische Fokus liegt auf drei Dimensionen: hoher Energieeffizienz, hoher Parameterdichte sowie reduzierten Chipkosten durch dreidimensionale Integration. Das Compute-in-Memory-Prinzip führt Rechenoperationen direkt im Speicher durch, was den Datentransport zwischen Prozessor und Speicher reduziert – ein zentrales Effizienzproblem klassischer Chip-Architekturen beim Ausführen großer neuronaler Netze.
Neben dem Chip selbst entwickelt SEMRON einen vollständigen Deployment-Workflow für seine Hardware. Dieser ermöglicht die Kompilierung von Modellen aus Hugging Face oder als benutzerdefinierte ONNX-Modelle in effiziente Integer-Versionen sowie deren Paketierung für den Betrieb auf SEMRON-Hardware. Das Unternehmen adressiert damit sowohl die Hardware- als auch die Softwareseite des Edge-AI-Deployments.